FLINKは、いくつかの良い火花を言うが、シーンをしません

ファンは、多くの場合、私のオプションFLINKと火花ストリーミング頼みますか?

初心者のビジネスのための選択は、経験豊富なため、非常に単純な、非常に困難なことであると、多くの場合、人を考えます。

個人的な知識を準備する時間の選択:

フレームワークの1.深い理解。

周囲の生態系フレームワークの2深い理解。

あなた自身のビジネスシナリオの3の深い理解。

そのデザインのインスピレーションの理解が見つけ出すことを理解することは非常に単純になる場合、FLINKを取り、例えばストリーミングスパーク:

スパークは、バッチが行われ、その後、マイクロバッチプロセスの形でストリームを作成され始めました。シーンを使用して少し遅れ、バッチ処理、スループット優先順位、および非常に多くはまだ非常に安定しているに貢献ストリーミング火花を許可し、非常に明白です。

FLINKストリーム処理を開始し、その後、バッチを作成するためのインスピレーションの処理をストリーミングされます。これは、高いリアルタイムのシーンのために非常に適しています。現時点ではまだバグがあります。

このような一見まだ非常に抽象的、ストリーミングの火付け役によくやっている間、インスタンスのための特定のシーンに関しては、FLINKは良い行います。

1.グローバル重複排除、そのような別個の、UVおよび他のビジネスシナリオとしてグローバルアグリゲーション操作。適当FLINK、スパークalluxio好み、状態、またはサードパーティオペレータ記憶手段、例えばRedisのにより後者に、多くの問題を行ってストリーミング。

2.複数のウィンドウを必要とし、同じウィンドウを出力します。これはFLINKの、スパークストリーミングたくさんの悩みをトリガすることができます。

3.唯一の治療法。スパーク・ストリーミングは、唯一のプロセスのほとんどは冪等の出力に依存して実装します。そしてFLINKは、物事の本質で実現することができるその分散チェックポイントを通じてシンク、すなわち分散2相コミット。もちろん、FLINKはまた、唯一のプロセスは冪等シンクで使用して実施することができます。

4.点滅して同様の事業開発のためのSQLを、完成に進み、その後、等の完全なサポートSQLのDDL、DMLを、達成しやすいです。テーブルにRDDマイクロバッチのニーズをストリーミングスパークは、小さなテーブルは、グローバルに、一時的ではありません。

5.状態管理。FLINKは、簡単に大規模な状態を達成するために、バックエンドのドキュメント管理を使用することができますが、それは、頻繁なエピソードバグのLinuxオペレーティングシステムファイルを引き起こす可能性があります。もちろん、このようなalluxioなどのサードパーティ製のインターフェイスを使用するための柔軟性をストリーミングスパークも非常に便利です。

6.ドット。IO、出力測定、反復ストリームを非同期。強力なビジネス関連。

補足する必要がどのようなシナリオで、それを考えます。

おすすめ

転載: www.cnblogs.com/niejingsong/p/11469975.html