どのようにビッグデータエントリ初心者の機械学習?

一般的にデータを分析するために使用される計算手法は、データを理解、機械学習に依存しています。長年にわたり、ほとんどの開発者のために、機械学習は非常に遠く離れて、それはとらえどころのないされています。

これは、今、おそらく最高の所得でも技術の中で最も人気のあるの一つです。間違いありません - 開発者として、機械学習は、その気概段階​​を表示することができます。

機械学習は、単純なデータ検索とストレージの論理的な拡張です。さまざまなコンポーネントの開発により、よりスマートなコンピュータ学習や行動が起こるようにします。

機械学習は、マイニング、履歴データを作成し、可能である将来の傾向を予測します。あなたはそれを実現しないかもしれないが、それはすでに機械学習を利用しない、と多くのメリットがあります。検索エンジンなどの機械学習と多くの関連の例としては、その結果、オンラインの推薦、広告、不正検出とスパムフィルタリングを作り出します。

機械学習は、意思決定を行うために、データに依存しています。直観は重要ですが、経験的データを越えて行くことは困難です。

機械学習のすべての側面

あなたは、詳細な探査機械学習を開始すると、次のような質問が発生します。

1.教師と教師なし学習
2.カテゴリー
3マルコフモデル、ベイジアンネットワークなど

Mahoutの和のHadoop

ApacheのMahoutのプロジェクトの目的は、スケーラブルな機械学習ライブラリを構築することです。

主要なデータ分析とHadoopの間の重なりの程度

40 +すべてここにビッグデータ開発[W]チュートリアルの年俸!

Mahoutのは、クラスタリング、分類および協調フィルタリングアルゴリズムを構築しました。加えてあります。

1.行列分解推薦システム
2 K -手段、ファジィK-クラスタリングアルゴリズム手段
3潜在的ディリクレ割当アルゴリズム
4.特異値分解
5ロジスティック回帰分類器
6(相補)ナイーブベイズをクラシファイア
7.ランダムフォレスト分類器

一度複雑なソフトウェアやハイエンドコンピュータだけでなく、データ科学者を必要とする機械学習。今機械学習、懸念している予測分析のために、必要とされるものは、完全に管理されたクラウドサービスです。

抗力(ドラッグ&ドロップ)を用いて、データフローグラフの一部は、背の高いから一般的なアルゴリズムを使用して、ライトコードとして、いくつかの実験を行うことができます。

科学者は、Rによるコードデータを書き込みます

統計とデータマイニングのために、Rは、非常に人気のあるオープンソースプロジェクトです。良いニュースは、Rは、簡単にML Studioに統合することができます。私は、このようなF#などの言語の機械学習機能の使用中に多くの友人を持っています。しかし、それは明らかである、この分野でのRはまだ支配的です。

テストマイニングや調査データが徐々にR、近年の人気の度合いを示しています。Rは現在、Rコア開発チーム(R開発コアチーム)の研究開発を担当し、開発はチェンバーズのメンバーで、ニュージャージー州とロバート・ジェントルマンの発明でロス・イハカオークランド大学によって構築されています。Rの命名は、主に最初の二つのRさんの名前の最初の文字に基づいています。Rは主にCと書かれたFortranの言語を使用して、GNUプロジェクトです。

データを分析する方法

理解するための最良の方法は、3つの質問に分ける機械学習分析にあります。

1.何が起こったのか?

a)は、歴史的観点で見ること

2.何が起こるのだろうか?

a)は未来を予測

3.次のステップは、実行する方法をすべきですか?

a)の仕様とガイドライン

誰もが果たす役割の分析

1.インフォメーションワーカー

a)は、典型的にはセルフサービスツールパワーBIを使用:オフィス電源BI 365インテリジェントソリューションセルフサービス・トランザクションで、データを分析し、BIエクセルとOffice 365を介して情報ワーカーに原取引の予測データの可視化を識別する能力を提供します。

2. ITの専門家

A)データキューブ分析とデータモデリングを作成し、データ変換、データウェアハウスにも関します

3.データ科学者

A)符号化、数学、統計及び確率を含む深い技術や技能、
確率を予測するために使用される技術の一連b)は、(例えば、次の18時間以内確率%まで42)ローズ
(例えばモンテカルロように)Cをモンテカルロ)シミュレーション、パラメータ化モデル
d)のデータ科学者の資質

Iドメイン知識。
科学的方法の明確な理解のためにII:目標、仮定、検証、透明性
。数学や統計でIIIは良い
知識と考えるために強力な能力のための静脈渇き。
Vグラフィカルな説明とコミュニケーションスキル。
viと高度なコンピューティング。データ管理機能

学歴

あなたが学校に取得したい場合は、データ科学者になることを学ぶには、次のコースを選択することができます。

1.応用数学
2.コンピュータサイエンス
3.経済
4.統計
5.エンジニアリング

含む、データ・サイエンス業界の恩恵を受ける:

金融サービス
電気通信製造ユーティリティ公衆衛生市場




61. ビッグデータ予測
62. ビッグデータ、他のアプリケーション
63 の産業がで適用することができる大容量のデータ
64 の金融業界では、大規模なアプリケーションデータ
65 インターネット業界におけるビッグデータアプリケーション
66 物流業界におけるビッグデータの応用

おすすめ

転載: blog.csdn.net/chengxvsyu/article/details/92181282