あなたがApacheの麒麟(本とエンドテキストを)知って取るためにジュースを絞った妻の母親から

免責事項:この記事はブロガーオリジナル記事です、続くBY-SAのCC 4.0を著作権契約、複製、元のソースのリンクと、この文を添付してください。
このリンク: https://blog.csdn.net/a934079371/article/details/102774291

まず、開口部

第二に、どのようなApacheの麒麟こと?

第三に、なぜApacheの麒麟を使うのか?

四、Apacheの麒麟アーキテクチャ

五、麒麟のユースケース

六、麒麟+ AI見通し

七つの概要

まず、開口部

私の人々が最初に毎朝起床後歯を磨くジュースを飲む習慣を持っています。その上、りんご、梨、バナナ、そう毎朝、私は梨+りんごをもつれ、またはバナナ+梨、バナナやリンゴ+梨+と:私はフルーツの3種類を食べるのが好き。

最初は私が唯一の人物良好であった、数分は非常に便利それを絞る朝早く起きます。飲む私のガールフレンドの後ろに、私は早起きするために少し長くし、より多くの果物は、時間を押すと長くなります。私の父の義理の後ろにも飲んで、私は早起きしたくないので、私はジューサーを買いました。

背中に、私の両親は飲む必要があります。私が購入し続けなければなら帰っドリンクは、余裕がないと思うので、ジューサーを購入する必要はありません同時に早起きする必要はありません。

私は多彩なジューサーを持つ2つの一般的なジューサーの前で償還、複合機この強力なを使用するとき、それはすべてのフルーツジュースを置くように、だから、私はちょうど、事前に果物の日を入れて、その後、セット搾り出し、その後、我々は、ライン上で、独自のミックスを飲みたいもの。

フルーツのようなタイプは、果物を入れているため限られたスロットで、増加していない限り、また費やす時間を増やす必要があります。それ以外の場合は、関係なく、人々が飲むどのくらい、飲むには十分ではありません。比較的大きな面積を占めるが、私は時間とお金を節約することができますが、それは価値があります!

この多目的ジューサーでのApacheの麒麟は、同じ目的を持っています -

第二に、どのようなApacheの麒麟こと?

1.Apache麒麟は、ビッグデータ分析フレームワークであるハイブの進化として理解することができるだけでなく、Hadoopの上にOLAPしばしばいくつかの倉庫ソリューションのために使用されるエンジン、。

2. 中国初のトップレベルのApacheオープンソースプロジェクト、バイアリのApacheのダボ、RocketMQは早いです。

3.同じ量のデータは、MySQLのレベルは、時間、分であるとハイブレベルであり、およびApache麒麟であることがあり、サブ秒

第三に、なぜApacheの麒麟を使うのか?

などのHadoop(ハイブ、SparkSql)、上のSQLする従来のデータベース(MySQLの、など)1.は、問題を見つけるだろう、クエリ時間は、データ量が増加するとともに増加します。

2.クエリは、データ量が増加し続け、およびクエリ時間は変更されません、あなたはスピードの並列コンピューティング・レートするように、マシンのレベルを展開する必要があります。しかし一方では、一方では、マシン・リソースのコストを増大させ、機械の操作やメンテナンス人件費が増加します。

使用3.Apache麒麟予め計算これら二つの問題を解決するために時間領域の方法にアプローチ。アナリストは、より多くの時間モデリング事業を費やすのではなく、クエリ結果を待ちましょう。

四、Apacheの麒麟アーキテクチャ

640?wx_fmt = PNG

Apacheの麒麟Definitive Guideの(第二版)

一番左の図1は、まず、その上のHadoop、Hiveの、カフカとがあります。ここでアイテムデータソースは、ハイブ、またはMySQLでは格納されていてもよい、またはフローカフカ場合。

2次元モデリングアナリストに従って構成引っ張るための中間計算エンジン、によって構成されたデータソースの後、ユーザが選択することができるか、スパークのMapReduceを用いて計算すること、及びその後、キューブを生成します。

3.得られたデータセットは、照会することを待機して、右側のHBaseのキューブに格納されています。

ユーザーが唯一の技術的な実装の詳細を気にしない、ライン上で通常のクエリ操作を追跡する必要があるので、そのクエリのODBCやJDBCと玄関だけでなく、全体を事前に計算しキューブのユーザーの4 REST APIのトップは、劣性です。

五、麒麟のユースケース

2日間億件の11件のトランザクションがあります

需要: クエリ11日が商品を販売する店を倍増

1.従来のソリューション: すべてのレコードをスキャンし、販売記録、商品の販売を重合し、最終的にソートリターンを押し、ダブル11を見つけます。 販売統計は、統計億件のデータを持っているので、11は、クエリ時間は、その後、ダブル5億への参加がある5を掛けてきました。

2.Kylin溶液: 二次元に従ってモデル化アナ前進[時間の販売、商品]、(財の販売量)SUMを算出して保存しました。 麒麟は、これは、私たちは、事前にすべての商品および対応する時間の量を置くのに役立ちます考え出した、我々は唯一のシーケンスの最後の行をすることができなければなりません。

それは良いの統計の後、我々は商品の二日間のソートのための11は1000年の商品があると想定することができることが、私たちは1000年のレコードをソートする必要があるだけ必要です。

麒麟は、私たちの中学校の同様の順列を事前に計算2の全ての組み合わせの数= n乗、N次元の数です。

たとえば、次のように :フルーツの2種類が存在する場合には リンゴ、ナシは。
これは、ジュース4つの状況表示されることがあります。 1.アップル2. 3.梨リンゴ+梨4.ません

640?wx_fmt = PNG
キューブの外観

六、麒麟+ AI見通し

麒麟+ AIを前提とした後、そのような場面があるでしょう。データアナリストのモデリングの数の増加に伴い、AI次元モデルが自動的に頻繁に使用されるいくつか分析することができ、およびアナリストに推薦するためのイニシアチブをとることができます。金型の建設を完了でアナリストは、AIは、モデルを診断することができますように、合理的な範囲設定を最適化し、する寸法かどうか。

この機能は達成していること、またはを参照してください。具体的には、実装している、または約達成するための「Apache麒麟決定的なガイド:第2版」を

七つの概要

より多くの人々がジュースを飲むよう1.私たちは、ジューサーの話麒麟の最初に考えることができ、絞りたてのジュースニーズも(データの増加量)を増加している、私は早起きしたくありません、私はジューサーを買うためにお金を費やす必要はありません。(麒麟を使用する理由対応)

2.次元モデリングに比べて果物の種類、および寸法は時間が増加した場合にのみ、麒麟労働時間が増加します。私たちは、時間のためのスペースで、ジューサーを時限ので、私は早起きしないでください。

3.我々は唯一の私たちは果物を食べることができるかを気にする必要があり、それがどのように動作するかジューサーを制御しません。キューブの対応生成技術は、我々は唯一の最終結果を気に。

4.私たちは毎日飲むジュースの容量に基づいて機会を搾汁するとき、我々は多くの場合、ジューサーを使用する場合、我々は右の数を入れた果物の種類、判断することを好みます。また、これは麒麟+ AIの結果です。

風水の兄のコメント:Apacheの麒麟技術自体は、大規模なデータ要素の数を統合するだけでなく、主流の技術の多くとApache麒麟は、データのすべての主要なコンポーネントを学ぶことを学ぶからカットする位置の数の概念をカバーし、ビンの数もカット、それから学ぶことができます。

買いに接続するために上にクリックし
Apacheの麒麟コアR&Dチームは、新しいApacheの麒麟2.5に基づいて、よく書かれた、建築設計、各モジュール、サードパーティ、オープンソースおよび二次開発手法との統合のあらゆる側面からの支配的な位置のApache麒麟の数を説明し、あなたがリリースを支援しますビッグデータの生産性。

ファン福祉
Apacheの麒麟のご理解について話をするメッセージは、コメントが3人の読者の心は本物の本---受け取ることになります行く「アパッチ麒麟Definitive Guideの(第2版)ブック1を。

- 終わり -

推奨読書:

Fanger魏コードスキャン
友人を追加し、ノート[ 交換基 ]
ルートと豊富な資源交換基を学ぶためにあなたを引いて
640?wx_fmt = PNG

おすすめ

転載: blog.csdn.net/a934079371/article/details/102774291