一般的にデータを分析するために使用される計算手法は、データを理解、機械学習に依存しています。長年にわたり、ほとんどの開発者のために、機械学習は非常に遠く離れて、それはとらえどころのないされています。
これは、今、おそらく最高の所得でも技術の中で最も人気のあるの一つです。間違いありません - 開発者として、機械学習は、その気概段階を表示することができます。
機械学習は、単純なデータ検索とストレージの論理的な拡張です。さまざまなコンポーネントの開発により、よりスマートなコンピュータ学習や行動が起こるようにします。
機械学習は、マイニング、履歴データを作成し、可能である将来の傾向を予測します。あなたはそれを実現しないかもしれないが、それはすでに機械学習を利用しない、と多くのメリットがあります。検索エンジンなどの機械学習と多くの関連の例としては、その結果、オンラインの推薦、広告、不正検出とスパムフィルタリングを作り出します。
機械学習は、意思決定を行うために、データに依存しています。直観は重要ですが、経験的データを越えて行くことは困難です。
機械学習のすべての側面
あなたは、詳細な探査機械学習を開始すると、次のような質問が発生します。
1.教師と教師なし学習
2.カテゴリー
3マルコフモデル、ベイジアンネットワークなど
Mahoutの和のHadoop
ApacheのMahoutのプロジェクトの目的は、スケーラブルな機械学習ライブラリを構築することです。
主要なデータ分析とHadoopの間の重なりの程度
40 +すべてここにビッグデータ開発[W]チュートリアルの年俸!
Mahoutのは、クラスタリング、分類および協調フィルタリングアルゴリズムを構築しました。加えてあります。
1.行列分解推薦システム
2 K -手段、ファジィK-クラスタリングアルゴリズム手段
3潜在的ディリクレ割当アルゴリズム
4.特異値分解
5ロジスティック回帰分類器
6(相補)ナイーブベイズをクラシファイア
7.ランダムフォレスト分類器
一度複雑なソフトウェアやハイエンドコンピュータだけでなく、データ科学者を必要とする機械学習。。今機械学習、懸念している予測分析のために、必要とされるものは、完全に管理されたクラウドサービスです。
抗力(ドラッグ&ドロップ)を用いて、データフローグラフの一部は、背の高いから一般的なアルゴリズムを使用して、ライトコードとして、いくつかの実験を行うことができます。
科学者は、Rによるコードデータを書き込みます
統計とデータマイニングのために、Rは、非常に人気のあるオープンソースプロジェクトです。良いニュースは、Rは、簡単にML Studioに統合することができます。私は、このようなF#などの言語の機械学習機能の使用中に多くの友人を持っています。しかし、それは明らかである、この分野でのRはまだ支配的です。
テストマイニングや調査データが徐々にR、近年の人気の度合いを示しています。Rは現在、Rコア開発チーム(R開発コアチーム)の研究開発を担当し、開発はチェンバーズのメンバーで、ニュージャージー州とロバート・ジェントルマンの発明でロス・イハカオークランド大学によって構築されています。Rの命名は、主に最初の二つのRさんの名前の最初の文字に基づいています。Rは主にCと書かれたFortranの言語を使用して、GNUプロジェクトです。
データを分析する方法
理解するための最良の方法は、3つの質問に分ける機械学習分析にあります。
1.何が起こったのか?
a)は、歴史的観点で見ること
2.何が起こるのだろうか?
a)は未来を予測
3.次のステップは、実行する方法をすべきですか?
a)の仕様とガイドライン
誰もが果たす役割の分析
1.インフォメーションワーカー
a)は、典型的にはセルフサービスツールパワーBIを使用:オフィス電源BI 365インテリジェントソリューションセルフサービス・トランザクションで、データを分析し、BIエクセルとOffice 365を介して情報ワーカーに原取引の予測データの可視化を識別する能力を提供します。
2. ITの専門家
A)データキューブ分析とデータモデリングを作成し、データ変換、データウェアハウスにも関します
3.データ科学者
A)符号化、数学、統計及び確率を含む深い技術や技能、
確率を予測するために使用される技術の一連b)は、(例えば、次の18時間以内確率%まで42)ローズ
(例えばモンテカルロように)Cをモンテカルロ)シミュレーション、パラメータ化モデル
d)のデータ科学者の資質
Iドメイン知識。
科学的方法の明確な理解のためにII:目標、仮定、検証、透明性
。数学や統計でIIIは良い
知識と考えるために強力な能力のための静脈渇き。
Vグラフィカルな説明とコミュニケーションスキル。
viと高度なコンピューティング。データ管理機能
学歴
あなたが学校に取得したい場合は、データ科学者になることを学ぶには、次のコースを選択することができます。
1.応用数学
2.コンピュータサイエンス
3.経済
4.統計
5.エンジニアリング
含む、データ・サイエンス業界の恩恵を受ける:
金融サービス
電気通信製造ユーティリティ公衆衛生市場
61. ビッグデータ予測
62. ビッグデータ、他のアプリケーション
63 の産業がで適用することができる大容量のデータ
64 の金融業界では、大規模なアプリケーションデータ
65 インターネット業界におけるビッグデータアプリケーション
66 物流業界におけるビッグデータの応用