良いプログラマあなたが知っているビッグデータ技術の在庫

  良いプログラマビッグデータ技術インベントリ あなたが知っている、その内容を参照するビッグデータの概念は、コレクションのデータ管理と処理をキャプチャするために、従来のソフトウェアツールを使用して一定の期間内に行うことができません。ビッグデータテクノロジーは、すぐに各種のデータから価値ある情報を取得する機能です。

  まず、データ収集

  ツールは、ETLの配布を担当した後、一時的な中間層にリレーショナル、フラットデータファイルと異なるデータソースは、抽出、変換、統合洗浄し、そして最終的にデータウェアハウスまたはデータマートにロードし、オンライン分析処理となりますデータマイニングの基礎。

  第二に、データ・アクセス

  リレーショナルデータベース、 NOSQL、SQLのように。

  第三に、インフラストラクチャ

  クラウドストレージ、分散ファイルストレージ。

  第四に、データ処理

  自然言語処理(NLP、自然言語処理)は、言語の問題や人間とコンピュータの相互作用の研究は規律です。キーは、自然言語処理、コンピュータが、一方でそれは情報処理の言語である。また、また、計算言語学(計算言語学と呼ばれる自然言語処理自然言語理解(NLU、自然言語理解)、として知られている自然言語を、「理解」することですブランチは、他方では、コアの問題の人工知能(AI、人工知能)の一つです。

  第五に、統計解析

  仮説検定、有意性検定、分散分析、相関分析、 T検定、分散分析、カイ二乗分析、部分相関分析、解析から、回帰分析、単回帰分析、重回帰分析、ステップワイズ回帰、回帰予測と残留分析高速クラスタリング法、判別分析、対応分析、(最適規模解析)に対応した多変量解析では、リッジ回帰、ロジスティック回帰分析、推定曲線、因子分析、クラスター分析、主成分分析、因子分析、クラスター法ブートストラップ技術。

  第六に、データマイニング

  分類(分類)、予測(推定)、予測(予測)、相関は、グループ化または相関ルール(アフィニティグループまたは相関ルール)、クラスタリング(クラスタリング)、説明および視覚化、説明および可視化)、複合データ型マイニング(テキスト、ウェブ、グラフィック・イメージ、ビデオ、オーディオなど)。

  第七に、モデルが予測

  予測モデル、機械学習、モデリングとシミュレーション。

  第八に、結果が提示されています

  雲、タグクラウド、図表など。

  実際には、ビッグデータに関する技術的な詳細は、上記よりもはるかに集中することを続けてください。

おすすめ

転載: www.cnblogs.com/gcghcxy/p/10955638.html