機械学習-day1の概要

1特性データ4V

    大量のデータを①

        TB-PB-ZB

        HDFS分散ファイルシステム

    データの多くの種類②

        構造化データ:MySQLのベースのストレージと処理

        非構造化データ:画像、オーディオなど

HDFS、MR、ハイブ

        半構造化データ:XML形式、HTML形式

             HDFS、MR、ハイブ、スパーク

③スピード

     より速く成長します

        TB-PB-ZB

        HDFS

    データ処理速度

        MR-HIVE-PIG-インパラ(オフライン)

        スパーク - FLINK(オンライン)

    ④低密度値

プロジェクトの2ビッグデータフレームワーク

    ①データ収集、FTP、ソケット

    ②HDFSデータストレージ

    ③データ分析MR + HIVE + INPALA + SPARK

    大規模なデータ処理機械学習におけるアプリケーション層④

⑤データショーオラクル+ SSM

人工知能の3の開発

3.1 AI三つの波

    チェッカー - エキスパートシステム

    チェス - 統計モデル

    行く - ディープラーニング

3.2 AIシーン

    画像認識、無人、インテリジェント医療、インテリジェント翻訳、音声認識、データマイニング

4機械学習 - 人工知能との接触の違い

    機械学習は人工知能のブランチです

    ディープ学習は機械学習のブランチです

5つのデータ、データ分析、データマイニングと接触差

    データは、観測または値を測定し、

    情報は信頼できるデータであり、

    データ分析:データ - 情報

    データマイニング:情報 - 貴重な情報

6機械学習

    手段を計算する方法で作業、機械学習の機能を達成するためのモデルで予測モデルを構築するためのアルゴリズムを組み合わせたデータを与え与えます。

7つのルールベースの学習とモデルベースの学習

    ルールベースの学習は、ハードコードされた学習されます

    モデルベースの学習モデルは、モデルによって予測された機械学習データから構成されています。

おすすめ

転載: www.cnblogs.com/zhuome/p/11505830.html