データ サイエンス入門: データ サイエンスの発展の歴史。その中心的な概念、方法論、開発傾向を要約し、データ サイエンスにおける中心的な概念、用語、アルゴリズム、具体的な操作手順、数式をシンプルかつわかりやすく説明することに重点を置いています。用語を理解すること。

著者: 禅とコンピュータープログラミングの芸術

1 はじめに

データ サイエンスは、応用数学、統計、コンピューター サイエンスの分野における学際的な学問であり、データによって生成される現象を理解し、データ サイエンスの手法を使用して予測および分析することで、企業の意思決定能力を効果的に強化し、ビジネスを改善することを目的としています。成果を上げ、新たな機会を発見し、業界全体にビジネス価値をもたらします。
この記事では、データ サイエンスの発展の歴史を探り、その中心となる概念、方法論、開発傾向を要約し、データ サイエンスの中核となる概念、用語、アルゴリズム、具体的な操作手順、および数式をわかりやすく説明することに重点を置きます。わかりやすいやり方。

2. データサイエンスの概要

データサイエンスの歴史と主な役割

データサイエンスの発展の歴史は、500年に一度の発展とも言えます。その主な参加者には、古代ギリシャのアテネ人、ローマ・カトリック教徒、エジプトのヘブライ人、中国の老子、英国のニュートン、米国のジョン・マクドナルド、日本の橋本祥、ドイツのハイデッガー、香港の李思光、ホー・ワップスが含まれる。台湾出身...これらの人々は、データに対する深い洞察力と独自の視点を頼りに、データを有用な情報源として捉え、データサイエンスの形成と進歩を促進しています。
データ サイエンスは、データ駆動型、コンピューティング駆動型、アプリケーション駆動型の 3 つの段階に分かれています。

  • データ駆動型
    データ駆動型データサイエンスは、データを使用して知識を取得するプロセスを特徴とし、データ指向の研究です。実際の問題から一般的なパターンを抽出し、分析、マイニング、モデリング、帰納を通じて最終的に結論や予測を導き出します。通信分野におけるトラフィック予測、リスク評価、マーケティングの最適化などは、いずれもデータドリブンなデータサイエンスの代表的な事例です。
  • 計算主導型
    計算主導型データ サイエンスとは、データを処理、分析、モデル化するためのコンピューター テクノロジと関連分析ツールの使用を指します。このアプローチでは、データの統合、変換、視覚化、解釈にさらに注意を払い、データ分析、予測、意思決定の基礎として生成モデルを使用します。金融、医療、インターネット、ソーシャル ネットワーク、モバイル アプリケーションなどの分野はすべてコンピューティング主導のデータ サイエンスです。
  • アプリケーション主導の
    アプリケーション主導のデータ サイエンスは、オンライン サービス、ビッグ データ プラットフォーム、人工知能、モノのインターネット、産業オートメーション、健康セキュリティ、その他のシナリオに焦点を当てています。

おすすめ

転載: blog.csdn.net/universsky2015/article/details/132074708
おすすめ