良いプログラマは10ビッグデータビッグデータ専門用語を共有します

  需要未満のためのビッグデータ雇用市場、人材不足度の高い、大企業の需要!エンジニアの偉大な、数多くの種類のIT業界の円は、我々はそれが起こる大規模なデータを選択しなければならない理由もありますか?ビッグデータ時代には波を興され、時代の最前線に学生は、どのように将来を急いで!今日のプログラマの在庫グッド、10大規模なデータ専門用語、白迅速こっち!


1.アルゴリズム。「アルゴリズム」ビッグデータの起源は何ですか?実際には、このアルゴリズムは一般的な用語であり、それはそれは非常に人気になり、誰もが人気殺到ビッグデータ分析です。


2.分析。私はほとんどあなたがこの分析を行うことができますトランザクションのリストの最後に楽しみにしています。通年に郵送大手クレジットカード会社からの取引と期末のレポートは、我々はさらに年間消費量を分析し、様々な経費計上されています。あなたがデータから学ぶとき、あなたは完全に将来の支出の決定を行うことができます。


3.記述分析。35%が衣服に費やさ明らかに、我々は25%で、食品への支出、今年の消費者のクレジットカード情報から結論付けることができ、20%が娯楽に費やし、残りはその他の事項によって消費される、などこれは、記述的分析です。


4.雲。我々は繰り返さないクラウドコンピューティングは、何ですか。クラウドコンピューティングは、本質的に、リモートサーバー上で実行されていません


  ソフトウェアおよび(/または)データホスティング、およびインターネット上のどこからでもアクセスすることができます。


5.クラスタコンピューティング。コンピューティングの奇妙な方法であることが、複数のサーバ「クラスタ」のプールされたリソースの使用です。より多くの技術を習得した後、我々はまた、ノード、クラスタ管理、負荷分散と並列処理を議論することがあります。


6.ダークデータ。このデータは、非常に特別な性質を持っている本質的には,,ダークデータは、意味のある目的のために収集され、処理された企業が、されていないデータである、ので、彼らが埋葬されない場合があり、「暗い」としてそれを記述する。彼らはように、中央のログを呼び出して注意事項を満たし、かつ、ソーシャルネットワーキングトラフィックかもしれません。人々は、推定値の多くを作るすべての企業データの60から90パーセントは、「ダークデータ」である可能性が高いが、誰が本当に知っています。


7.データ湖。データ湖元大きなリポジトリのエンタープライズクラスのデータフォーマットです。ここで、我々はまた、他のデータソースでの洗浄および統合後のデータは、概念的に非常に似ているため、すべてのデータのための企業全体のリポジトリ、データウェアハウス、データウェアハウスや湖を議論する必要がありますが、構造化された形式で、違い。


  一般的に、従来のデータで使用されるデータウェアハウス(ではなく、かなり)。湖は、データのユーザーが簡単に企業データにアクセスすることができ、本当に彼らが探しているものを知るために必要なユーザーは、インテリジェントな使用を対処してみましょうする方法であるといわれています。オープンソース技術の前提を抱きしめる - あなたは湖湖データ(DATALAKE)行いを知っているデータを理解しますか?


8.データマイニング。データマイニングは、大量のデータ、抽出洞察から意味のあるパターンを見つけるための洗練されたパターン認識技術を使用することです。この「分析は、」私たちの前に説明を分析するための個人データの密接な関連用語の使用です。統計(はい、古き良き数学)、機械学習アルゴリズムと人工知能を使用して、データマイニングで意味のあるパターンを抽出するために。


9.分散ファイルシステム。単一のシステムに格納するには大きすぎる大規模なデータに、分散ファイルシステムは、大量のデータを保存するために複数のストレージデバイスにわたって容易にするためのデータ・ストレージ・システムを提供し、データストレージの大多数のコストと複雑さを軽減します。


10.ETL。ETLは、抽出、変換およびロード処理の代わりに、抽出され、変換、ロードの頭字語。それは、具体的には、これにより「ローディング」、「適切な」データを取得するデータクリーニング/改変方法「変換」を介して、システム使用のためにプロセス全体の適切なリポジトリを生データを「抽出物」を意味します。けれども概念は、データウェアハウスETLに基づくだけでなく、このような大きなデータシステム内/外部データソースからの吸光度データへのアクセスなどのプロセスにおいて他のシナリオにも適用可能です。


おすすめ

転載: blog.51cto.com/14249543/2404273