機械学習とは何ですか?
機械学習は、明示的にプログラムされずにコンピューターに学習能力を与える研究分野です。— アーサー・サミュエル、1959 年
コンピュータープログラムは、P によって測定された T でのパフォーマンスが経験 E とともに向上する場合、あるタスクに関する経験 E から T と何らかのパフォーマンス測定値 P を学習できます。—トム・ミッチェル、1997年
平たく言えば、机器学习
(機械学習)はデータから学習できるコンピューター プログラミングの科学です。
机器学习
電子メールのスパム フィルターと同様に、ユーザーはスパムと通常のメールの例をマークし、マシンにスパムのフラグを付けるように学習させます。
ユーザーが学習用にマークしたサンプルは训练
(トレーニング) と呼ばれ、各トレーニング サンプルは训练实例
(または と呼ばれます训练样本
) になり、机器学习
そのプロセスと作成预测
(予測) は模型
(モデル) になります。
神经网络
(ニューラル ネットワーク) や随机森林
(ランダム フォレスト) も模型
例として挙げられます。
この場合、タスク T は新しい電子メールをスパムとしてマークすることであり、エクスペリエンス E はトレーニング データであり、パフォーマンス測定値 P を定義する必要があります。たとえば、正しく分類された電子メールの比率を使用できます。この特定のパフォーマンスの尺度は高精度と呼ばれ、分類タスクによく使用されます。
ただし、Wikipedia のすべての記事のコピーをダウンロードするだけであれば、コンピューター上により多くのコンテンツ データが保存されますが、どんな作業でも突然向上するわけではありません。これは違います机器学习
。
なぜ機械学習を使用するのでしょうか?
スパムに対処する方法を机器学习
使用するフィルターは破棄されます。传统编程
垃圾邮件
1. まず、外観を確認する必要があります。例えば、ショッピングモールのイベントプロモーション、不動産情報、株式の推奨など。- 2. はい、上記の状況に対応する一連の検出アルゴリズムを作成する必要があります。
- 3. プログラムをテストし、十分な結果が得られるまでステップ 1 と 2 を繰り返します。
最終的には、プログラムは複雑なルールの長いリストになる可能性が高く、保守が困難になります。
対照的に、机器学习
異常な頻度を検出することでスパムを適切に予測する方法を自動的に学習する技術に基づくスパム フィルターは、スパムの例よりも短く、保守が容易で、おそらく正確です。
垃圾邮件
マーケットプレイス イベントのプロモーション リンクを含む電子メールがすべてブロックされていることを送信者が知ったらどうなるでしょうか? 彼らはリンクを短いリンクに置き換える必要があります。
ただし、従来のようにプログラムされたスパム フィルターでは、隠れたマーケットプレイス キャンペーンを促進短链接
する。垃圾邮件
送信者がスパム フィルターを回避し続ける限り、ルールを更新する方法は永遠にわかりません。
対照的に、机器学习
テクノロジー ベースの垃圾邮件
フィルターは、ユーザーが報告したスパムの中で、短いリンク形式のストア プロモーション メールが異常に頻繁になっていることを自動的に認識し、ユーザーの介入なしにフラグを立てます。
机器学习
ハイライトは、従来の方法では複雑すぎる問題、またはまだアルゴリズムが存在しない問題を解決することです。
语音识别
それについて話しましょう! 簡単に始めて、1 つと 2 つを区別できるプログラムを作成したい場合は、高音と低音の強度を検出し、それを使用して区別するアルゴリズムをハードコードすることができるかもしれません。
明らかに、このハードコーディング技術は、何億人もの人々が話す何千もの中国語に拡張することはできません。
騒がしい環境では、さまざまな人が数十の言語を使用しますが、現時点での最良の解決策は、自我学习
テキスト録音の多くの例を考慮して、最終的には机器学习
人間と同じように学習できるアルゴリズムを作成することです。
全体として、机器学习
次のシナリオに非常に適しています。
- 既存のソリューションでは、多くの微調整や問題ルールの長いリストが必要です (機械学習モデルは多くの場合、コードを簡素化し、従来の方法よりも優れたパフォーマンスを発揮します)。
- 従来の方法では解決できない複雑な問題 (最高の機械学習技術で解決できる可能性があります)
- 変動する環境 (ML システムは新しいデータで簡単に再トレーニングでき、常に最新の状態になります)
- 複雑な問題と大量のデータに対する洞察を得る