FLINK 1.9再起動の戦略およびリカバリ計画

タスクの失敗、再起動エラーや他のタスクタスクへFLINKの必要性が影響を受ける場合には、そのため通常の実行状態にジョブ回復。

FLINKが制御されているタスクは、戦術と戦略の失敗を再起動して復旧を再起動します。再起動ポリシーが再起動し、再起動間隔ことができるかどうかを判断し、タスクを再起動する必要が回復政策決定。

図は、完全な回復ポリシーを再起動します

再起動回復ポリシーの完全なビューでは、それは時にタスクの失敗をバックに失敗し、すべてのタスクのジョブを再開します。

ローカル再開に基づいて復旧戦略は、領域を失敗しました

ポリシーのすべてのタスクの区分は、ジョブ番号1地域となります。タスクが失敗した場合、それは地域の最小セットを再起動する障害復旧の必要性を見つけようとします。
再起動グローバル回復ポリシーと比較すると、回復のいくつかのシナリオでは、この戦略の失敗は、タスクを再起動する必要性が少なくなります。

タスク領域は、ここではパイプライン形式でのデータ交換のセットを指します。つまり、データ交換のバッチ形式は地域の境界線を構成するであろう。
-すべてのデータおよびストリーミングでDataStream表/ SQL操作は、パイプラインの交換形式です。
-すべてのデータのバッチ式テーブル/ SQLバッチジョブは、為替のデフォルト形式です。
-データの形式は、ジョブデータセット[ExecutionConfig]({{site.baseurl}に基づいて、交換 } / ZH / DEV / execution_configuration.html)
構成[実行モード]({{site.javadocs_baseurl} } / API /ジャワ/ ORG /apache/flink/api/common/ExecutionMode.html)
の決定。

次のように判定ロジックを再起動する地域の必要がある:
エラータスクを再起動する1.地域。
2.データは(紛失または破損)いくつかアクセスできないを消費する地域の必要性を再起動する場合は、出力データ領域の部分も再起動する必要があります。
3.下流地域地域を再起動する必要も再起動する必要があります。これは、いくつかの非決定論的な計算や分布が同じにつながるので、データ保護の整合性を検討する予定である
生成結果のパーティションが毎回同じでない場合に含まれるデータ。

おすすめ

転載: www.cnblogs.com/mrpei/p/flinkfailover.html