良いプログラマビッグデータ技術インベントリ あなたが知っている、その内容を参照するビッグデータの概念は、コレクションのデータ管理と処理をキャプチャするために、従来のソフトウェアツールを使用して一定の期間内に行うことができません。ビッグデータテクノロジーは、すぐに各種のデータから価値ある情報を取得する機能です。
まず、データ収集
ツールは、ETLの配布を担当した後、一時的な中間層にリレーショナル、フラットデータファイルと異なるデータソースは、抽出、変換、統合洗浄し、そして最終的にデータウェアハウスまたはデータマートにロードし、オンライン分析処理となりますデータマイニングの基礎。
第二に、データ・アクセス
リレーショナルデータベース、 NOSQL、SQLのように。
第三に、インフラストラクチャ
クラウドストレージ、分散ファイルストレージ。
第四に、データ処理
自然言語処理(NLP、自然言語処理)は、言語の問題や人間とコンピュータの相互作用の研究は規律です。キーは、自然言語処理、コンピュータが、一方でそれは情報処理の言語である。また、また、計算言語学(計算言語学と呼ばれる自然言語処理自然言語理解(NLU、自然言語理解)、として知られている自然言語を、「理解」することですブランチは、他方では、コアの問題の人工知能(AI、人工知能)の一つです。
第五に、統計解析
仮説検定、有意性検定、分散分析、相関分析、 T検定、分散分析、カイ二乗分析、部分相関分析、解析から、回帰分析、単回帰分析、重回帰分析、ステップワイズ回帰、回帰予測と残留分析高速クラスタリング法、判別分析、対応分析、(最適規模解析)に対応した多変量解析では、リッジ回帰、ロジスティック回帰分析、推定曲線、因子分析、クラスター分析、主成分分析、因子分析、クラスター法ブートストラップ技術。
第六に、データマイニング
分類(分類)、予測(推定)、予測(予測)、相関は、グループ化または相関ルール(アフィニティグループまたは相関ルール)、クラスタリング(クラスタリング)、説明および視覚化、説明および可視化)、複合データ型マイニング(テキスト、ウェブ、グラフィック・イメージ、ビデオ、オーディオなど)。
第七に、モデルが予測
予測モデル、機械学習、モデリングとシミュレーション。
第八に、結果が提示されています
雲、タグクラウド、図表など。
実際には、ビッグデータに関する技術的な詳細は、上記よりもはるかに集中することを続けてください。