スイカブック:第一章

1.1用語は、実質的に
、我々は、例えば、スイカの数に関するデータを収集すると仮定:
(色=緑; =カール茎; =有声音は大声ノック)、
色=黒;茎;ノッキング音ボーリング=ややカール)
(=浅い色、T茎剛性; =ノック音クリスプ)、
......、

括弧の各ペアはレコードです、

  • 設定された記録は「と呼ばれるデータセット」(データセット)。

  • 各時間イベントのレコードまたはオブジェクト(スイカと呼ぶ)の説明は、「と呼ばれる試料」(インスタンス)または「サンプル」(サンプル)。

  • 事項またはプロパティ「と呼ばれる特定の領域でのパフォーマンスイベントまたはオブジェクト反映プロパティ」(属性)または「機能」(機能);実施例、「色」、「茎」

  • 属性値「という属性値」(属性値)、例、「緑」、「黒」。

  • 特性により張られる空間は「という属性空間」(属性空間)、「サンプル空間」(試料空間)または「入力空間」。例えば、「カラー」、「茎」、三つの軸として「ノック音」、彼らはスイカを説明するための三次元空間に及ぶ、スイカそれぞれこの座標空間におけるそれらの場所を見つけることができます。

  • 各点の座標ベクトルに対応するので、一つの例は「と呼ばれるので、特徴ベクトル」(特徴ベクトル)。

  • 例では「というフラグ情報、有する試料」(例)。

予測が離散値、「と呼ばれる、このような学習課題であればカテゴリーなど「良いメロン」、「悪いメロン」として」(分類);

予測連続値ならば、そのような学習課題は「と呼ばれる回帰なスイカの成熟度0.95,0.37として」(回帰);

スイカ「を行うことができるクラスタ」(クラスタリング)、スイカ今後のトレーニングセットがいくつかのグループに分割され、各グループは「と呼ばれるクラスタ」(クラスタ);これらのクラスタは自動的に対応する分類の潜在的なコンセプトの数を形成してもよく、そのような「浅いとして色メロン「」暗いメロン。」この学習プロセスは、データのより詳細な分析のための基盤を構築するために、データの固有の法則を理解するために私たちを助けます。なお、クラスタリング、「淡色メロン」、これらの概念は、事前に知られていない「暗いメロン」、及び通常学習処理なしタグ情報に使用されるトレーニングサンプル。もちろん、例外もあります。

「:タグ情報に基づいてトレーニングデータは、タスクは、大きく2つのカテゴリに分けることができる学習、そこにある教師付き学習」(教師あり学習)と「教師なし学習」(教師なし学習)、元に代わって分類および回帰、後者のクラスタリング代表

新しいモデルを学習する能力を得る「と呼ばれるサンプルに適用することが一般化モデルの強い汎化能力はよく全体試料空間に適していて、」(一般化)の容量。

发布了70 篇原创文章 · 获赞 29 · 访问量 4万+

おすすめ

転載: blog.csdn.net/LOVEYSUXIN/article/details/104055142