すべてのメモの概要:「機械学習」スイカの本-メモを読む概要
1.はじめに
機械学習は、経験を使用して計算手段を通じてシステム自体のパフォーマンスを向上させる方法の研究に専念しています。
2.用語
データセット:単一のサンプルの特性を説明するレコードのコレクション。各レコードのイベントまたはオブジェクトの説明は「例」または「サンプル」と呼ばれ、イベントまたはオブジェクトのパフォーマンスまたは性質を特定の側面で反映する項目は「属性」または「機能」と呼ばれます。
…(この分野については何も言うことがないことがわかりました。これらの概念をもっと使用すれば、あなたが話していることを理解できます。本当に理解できない場合は、本を読んでください)
3つの架空の空間
帰納と演繹は、科学的推論の2つの基本的な方法です。前者は、特別から一般への「一般化」のプロセス、つまり特定の事実から一般法へのプロセスであり、後者は一般から特別への「専門化」のプロセス、つまり基本原則から推論されるプロセスです。
学習プロセスは、すべての仮説で構成される空間を検索するプロセスと見なすことができます。検索の目標は、トレーニングセットに「適合する」仮説、つまりトレーニングセットで正しく判断できる仮説を見つけることです。 。
第四に、帰納的選好
特定のアルゴリズムについては、モデルを選択する必要があります。現時点では、選択したアルゴリズムの設定が重要な役割を果たします。効果的な機械学習アルゴリズムには、帰納的選好が必要です。そうでない場合、仮説空間で設定されたトレーニングと「同等」であると思われる仮説によって混乱し、明確な学習結果を生成できません。
「オッカムの剃刀」(オッカムの剃刀)は、自然科学研究で一般的に使用されている最も基本的な原則です。つまり、「観察結果と一致する仮説が複数ある場合は、最も単純なものを選択してください」。テストセットよりもトレーニングセットへの過剰適合によってもたらされるモデルの影響を減らすのに役立ちます。
5.開発プロセス、申請状況、読み物
- データマイニング:データ間の関係を発見する
- コンピュータビジョン:人間のように世界を理解する
- 自然言語処理:人間のようにテキストを理解する
- ロボットの意思決定:人間のように意思決定を行う能力があります
他の人は、教科書を見て、それをさらに読んでください...
次の章ポータル:スイカの本の読書ノート(2)-モデルの評価と選択