ビッグデータはどのように迅速かつ効果的に学ぶために?

近年では、火の中に大きなデータでは、私はビッグデータは火、良い仕事、高賃金だと思います。大規模なデータの初心者のように、ジョブを変更したい多くの人々は、ビッグデータの方向、技術学校、そして、これらの理由は、ビッグデータの方向を考えるようにするために、彼らが失われた場合、あるラインのどのようなことができます学習に行きたいです私はあなたに興味を持っているものを、コンピュータ/ソフトウェアのために、あなたの職業は何です、お願いしたいと思いますか?コンピュータの専門家は、オペレーティングシステム、ハードウェア、ネットワーク、サーバーに興味を持って、ですか?専門的なソフトウェア、ソフトウェア開発、プログラミングは、その関心のコードを書いていますか?または数学、統計、データや数字で特に興味を持って。

実際には、これはあなたが/最適化/運用・保守/監視、ビッグデータの開発/設計/アーキテクチャ、データ分析/マイニングを構築するために、3つのビッグデータプラットフォームを伝えたい方向です。、良い見通しである、容易なより多くのお金を私に聞かないでください。

私は4Vがビッグデータを備えて普及したいと思います:

大量のデータ、TB-> PB

データの多くの種類、構造化、非構造化テキスト、ログ、ビデオ、画像、場所等。

高い商業的価値が、データ分析や機械速く出土学習を通じて、必要なデータの膨大な量の上の値。

高い処理適時、もはやオフライン計算それらに限定大量のデータ処理要件。

データの技術的な側面には、いくつかの大規模なサービス・フレームワークです、今日は、オープンソースのビッグデータフレームワークは、そしてより強く、私が引用しています:

ファイルストレージ:HadoopのHDFS、タキオン、KFS

オフライン計算:HadoopのMapReduceの、スパーク

ストリーミング、リアルタイムの計算:嵐、スパークストリーミング、S4、ヘロン

KV、NOSQLデータベース:HBaseの、Redisの、MongoDBの

リソース管理:YARN、Mesos

コレクションをログに記録:水路、スクライブ、Logstash、Kibana

メッセージシステム:カフカ、StormMQ、ZeroMQ、RabbitMQの

分析:ハイブ、インパラ、豚、プレスト、フェニックス、SparkSQL、ドリル、FLINK、麒麟、ドルイド

分散コーディネーションサービス:飼育係

クラスタ管理とモニタリング:Ambari、神経節、Nagiosは、Clouderaのマネージャー

データマイニング、機械学習:Mahoutの、MLLibスパーク

データの同期化:Sqoop

タスクのスケジューリング:Oozie

ビッグデータ共有学習教材グループ142974151、20:10夜に[無料]ビッグデータがコースを生きる毎日、フォーカス:これらを再生するためにどのように伝えるために、QQグループを心配しないで、学ぶために、どのように開始するどのように多くのもの、ビッグデータ分析、大規模なデータの書き込み、大規模なデータウェアハウス、ビッグデータの例、人工知能、データマイニングは、純粋な乾燥品のシェア、歓迎初心者から上級ジュニアパートナーです。

おすすめ

転載: www.cnblogs.com/baijindashuju/p/10941707.html