最近はITのようにビッグデータの周りのデータの開発、データウェアハウス、データセキュリティ、データ解析、データマイニング、および続く業界の語彙は、業界の専門家の利益の焦点となってきているように、ホットビッグデータの商業的価値の使用が求められ、競合します。ビッグデータの時代の到来により、ビッグデータの開発もされて入ってきました。
実際には、2つの方法でビッグデータの展開。第一は、第二の開発のための大型データ処理システム自体のためであり、いくつかのHadoop、スパークアプリケーションを作成することです。作業の第一のタイプは、このようなシステムはまた、SQLインタフェースを提供し、このポストのデータアナリスト、それのためのより適切な感じ、と今ハイブスパーク-SQL。作品の第二のタイプは、その後、通常唯一の大企業は、一般的に彼らは自分のシステムに取り組んでまいりますまたはオープンソースの二次開発を再実行してきました。この作品は、その後、理論と実践の要件が深い、そしてより多くの技術的な内容。
学ぶ必要がビッグデータ技術開発?次のようにロードマップを学びます:
01
ビッグデータ基盤 -
言語のJavaの基本的な側面
(1)Java言語の基礎
Java開発者は、使い慣れたEclipse開発ツール、Java言語の基礎、プロセス制御のJava、Java文字列、配列、Javaクラスとオブジェクト、クラス、およびデジタル処理コア技術、I / Oおよび反射、マルチスレッド、Swingのプログラムとコレクションを紹介しました
ビッグデータは、学習、業界を満たしている入門の過程では、体系的な学習パスの欠如は、システム計画を学ぶ、あなたが私の大きな学習データ交換スカートの参加を歓迎します:529 867 072、スカート文書は、大規模なデータの調査マニュアルソートの私の年を持っています、開発ツール、書籍とPDF文書は、あなたは自分自身をダウンロードすることができます。
(2)HTML、CSS与Java
PC端末サイトのレイアウト、HTML5 + CSS3の基礎、WebAppのページレイアウト、ネイティブJavaインタラクティブ機能開発、Ajaxの非同期対話、jQueryのアプリケーション
(3)JavaWebとデータベース
データベース、コアのJavaWeb開発、JavaWeb開発インサイダー
02
Linuxのエコシステム&Hadoopの
Linuxシステム、Hadoopのオフラインコンピューティング概要、分散データベースHBaseの、データウェアハウスハイブ、データ移行ツールSqoop、水路分散ロギングフレームワーク
03
分散コンピューティングフレームワークと
スパーク&ストロムエコシステム
(1)分散コンピューティングフレームワーク
Pythonプログラミング言語、Scalaのプログラミング言語、ビッグデータ処理をスパーク、火花ストリーミングビッグデータ処理、火花MLIBの機械学習、マップ計算-GraphXスパーク、本物の1:戦闘2をベーススパーク推薦システム(会社実際のプロジェクトのライン) :シーナ(www.sina.com.cn)
(2)ストームシステムテクノロジーアーキテクチャ
嵐の原理と基盤、メッセージがカフカ、Redisのツールをキューに入れ、飼育係の詳細、本物の1:ログ警報システムプロジェクト、戦闘2:あなたはまた、推薦システムの戦闘ようなことがあり
04
ビッグデータプロジェクトの戦闘
(ファーストライン本物の会社のプロジェクト)
データ収集、データ処理、データ分析、データ・プレゼンテーション、データアプリケーション
05
ビッグデータ分析-AI(人工知能)
データ作業環境データベース分析、データの可視化、Pythonの機械学習を分析&準備
屋外の機器識別分析:2、およびニューラルネットワーク画像認識、自然言語処理&ソーシャルネットワーク処理、機械学習のPython実際のプロジェクト
ビッグデータは、インターネットの発展の方向であり、ビッグデータの才能は高給貴族の未来です。ビッグデータの人材不足で、給与ビッグデータの才能も上昇しています。ビッグデータ開発の機会や技術を習得が不可欠です!