1特性データ4V
大量のデータを①
TB-PB-ZB
HDFS分散ファイルシステム
データの多くの種類②
構造化データ:MySQLのベースのストレージと処理
非構造化データ:画像、オーディオなど
HDFS、MR、ハイブ
半構造化データ:XML形式、HTML形式
HDFS、MR、ハイブ、スパーク
③スピード
より速く成長します
TB-PB-ZB
HDFS
データ処理速度
MR-HIVE-PIG-インパラ(オフライン)
スパーク - FLINK(オンライン)
④低密度値
プロジェクトの2ビッグデータフレームワーク
①データ収集、FTP、ソケット
②HDFSデータストレージ
③データ分析MR + HIVE + INPALA + SPARK
大規模なデータ処理機械学習におけるアプリケーション層④
⑤データショーオラクル+ SSM
人工知能の3の開発
3.1 AI三つの波
チェッカー - エキスパートシステム
チェス - 統計モデル
行く - ディープラーニング
3.2 AIシーン
画像認識、無人、インテリジェント医療、インテリジェント翻訳、音声認識、データマイニング
4機械学習 - 人工知能との接触の違い
機械学習は人工知能のブランチです
ディープ学習は機械学習のブランチです
5つのデータ、データ分析、データマイニングと接触差
データは、観測または値を測定し、
情報は信頼できるデータであり、
データ分析:データ - 情報
データマイニング:情報 - 貴重な情報
6機械学習
手段を計算する方法で作業、機械学習の機能を達成するためのモデルで予測モデルを構築するためのアルゴリズムを組み合わせたデータを与え与えます。
7つのルールベースの学習とモデルベースの学習
ルールベースの学習は、ハードコードされた学習されます
モデルベースの学習モデルは、モデルによって予測された機械学習データから構成されています。