著者: 禅とコンピュータープログラミングの芸術
1 はじめに
データ サイエンスは、応用数学、統計、コンピューター サイエンスの分野における学際的な学問であり、データによって生成される現象を理解し、データ サイエンスの手法を使用して予測および分析することで、企業の意思決定能力を効果的に強化し、ビジネスを改善することを目的としています。成果を上げ、新たな機会を発見し、業界全体にビジネス価値をもたらします。
この記事では、データ サイエンスの発展の歴史を探り、その中心となる概念、方法論、開発傾向を要約し、データ サイエンスの中核となる概念、用語、アルゴリズム、具体的な操作手順、および数式をわかりやすく説明することに重点を置きます。わかりやすいやり方。
2. データサイエンスの概要
データサイエンスの歴史と主な役割
データサイエンスの発展の歴史は、500年に一度の発展とも言えます。その主な参加者には、古代ギリシャのアテネ人、ローマ・カトリック教徒、エジプトのヘブライ人、中国の老子、英国のニュートン、米国のジョン・マクドナルド、日本の橋本祥、ドイツのハイデッガー、香港の李思光、ホー・ワップスが含まれる。台湾出身...これらの人々は、データに対する深い洞察力と独自の視点を頼りに、データを有用な情報源として捉え、データサイエンスの形成と進歩を促進しています。
データ サイエンスは、データ駆動型、コンピューティング駆動型、アプリケーション駆動型の 3 つの段階に分かれています。
- データ駆動型
データ駆動型データサイエンスは、データを使用して知識を取得するプロセスを特徴とし、データ指向の研究です。実際の問題から一般的なパターンを抽出し、分析、マイニング、モデリング、帰納を通じて最終的に結論や予測を導き出します。通信分野におけるトラフィック予測、リスク評価、マーケティングの最適化などは、いずれもデータドリブンなデータサイエンスの代表的な事例です。 - 計算主導型
計算主導型データ サイエンスとは、データを処理、分析、モデル化するためのコンピューター テクノロジと関連分析ツールの使用を指します。このアプローチでは、データの統合、変換、視覚化、解釈にさらに注意を払い、データ分析、予測、意思決定の基礎として生成モデルを使用します。金融、医療、インターネット、ソーシャル ネットワーク、モバイル アプリケーションなどの分野はすべてコンピューティング主導のデータ サイエンスです。 - アプリケーション主導の
アプリケーション主導のデータ サイエンスは、オンライン サービス、ビッグ データ プラットフォーム、人工知能、モノのインターネット、産業オートメーション、健康セキュリティ、その他のシナリオに焦点を当てています。