まず、開口部
第二に、どのようなApacheの麒麟こと?
第三に、なぜApacheの麒麟を使うのか?
四、Apacheの麒麟アーキテクチャ
五、麒麟のユースケース
六、麒麟+ AI見通し
七つの概要
まず、開口部
私の人々が最初に毎朝起床後歯を磨くジュースを飲む習慣を持っています。その上、りんご、梨、バナナ、そう毎朝、私は梨+りんごをもつれ、またはバナナ+梨、バナナやリンゴ+梨+と:私はフルーツの3種類を食べるのが好き。
最初は私が唯一の人物良好であった、数分は非常に便利それを絞る朝早く起きます。飲む私のガールフレンドの後ろに、私は早起きするために少し長くし、より多くの果物は、時間を押すと長くなります。私の父の義理の後ろにも飲んで、私は早起きしたくないので、私はジューサーを買いました。
背中に、私の両親は飲む必要があります。。私が購入し続けなければなら帰っドリンクは、余裕がないと思うので、ジューサーを購入する必要はありません同時に早起きする必要はありません。
私は多彩なジューサーを持つ2つの一般的なジューサーの前で償還、複合機この強力なを使用するとき、それはすべてのフルーツジュースを置くように、だから、私はちょうど、事前に果物の日を入れて、その後、セット搾り出し、その後、我々は、ライン上で、独自のミックスを飲みたいもの。
フルーツのようなタイプは、果物を入れているため限られたスロットで、増加していない限り、また費やす時間を増やす必要があります。それ以外の場合は、関係なく、人々が飲むどのくらい、飲むには十分ではありません。比較的大きな面積を占めるが、私は時間とお金を節約することができますが、それは価値があります!
この多目的ジューサーでのApacheの麒麟は、同じ目的を持っています -
第二に、どのようなApacheの麒麟こと?
1.Apache麒麟は、ビッグデータ分析フレームワークであるハイブの進化として理解することができるだけでなく、Hadoopの上にOLAPしばしばいくつかの倉庫ソリューションのために使用されるエンジン、。
2. 中国初のトップレベルのApacheオープンソースプロジェクト、バイアリのApacheのダボ、RocketMQは早いです。
3.同じ量のデータは、MySQLのレベルは、時間、分であるとハイブレベルであり、およびApache麒麟であることがあり、サブ秒。
第三に、なぜApacheの麒麟を使うのか?
などのHadoop(ハイブ、SparkSql)、上のSQLする従来のデータベース(MySQLの、など)1.は、問題を見つけるだろう、クエリ時間は、データ量が増加するとともに増加します。
2.クエリは、データ量が増加し続け、およびクエリ時間は変更されません、あなたはスピードの並列コンピューティング・レートするように、マシンのレベルを展開する必要があります。しかし一方では、一方では、マシン・リソースのコストを増大させ、機械の操作やメンテナンス人件費が増加します。
使用3.Apache麒麟予め計算これら二つの問題を解決するために時間領域の方法にアプローチ。アナリストは、より多くの時間モデリング事業を費やすのではなく、クエリ結果を待ちましょう。
四、Apacheの麒麟アーキテクチャ
Apacheの麒麟Definitive Guideの(第二版)
一番左の図1は、まず、その上のHadoop、Hiveの、カフカとがあります。ここでアイテムデータソースは、ハイブ、またはMySQLでは格納されていてもよい、またはフローカフカ場合。
2次元モデリングアナリストに従って構成引っ張るための中間計算エンジン、によって構成されたデータソースの後、ユーザが選択することができるか、スパークのMapReduceを用いて計算すること、及びその後、キューブを生成します。
3.得られたデータセットは、照会することを待機して、右側のHBaseのキューブに格納されています。
ユーザーが唯一の技術的な実装の詳細を気にしない、ライン上で通常のクエリ操作を追跡する必要があるので、そのクエリのODBCやJDBCと玄関だけでなく、全体を事前に計算しキューブのユーザーの4 REST APIのトップは、劣性です。