クラッシュを回避することができたので、私は自分の質問に答えています。ただし、まだ二次エラーの問題があり、新しいスレッド 詳細とともに。
私のリカバリコードは、二次エラーを異なる方法で処理するようになりました。デッドロックを数回再試行しますが、エラーがデッドロックである場合に限ります。他のタイプのエラーが発生した場合、アプリケーションはあきらめます。
これは、失望したユーザーがエラーを受け取ることを意味しますが、この変更以降、クラスタークラッシュは発生しておらず、恐ろしい「サーバーがなくなった」エラーは発生していません。