データ分類分析 - 遅延学習法



1. 怠惰な学習方法と熱心な学習方法

熱心な学習方法: アルゴリズムを使用して判断する前に、まずトレーニング セット データを使用してトレーニングを通じて目的関数を取得し、判断が必要な場合はトレーニング済みの関数を使用して決定を行います。
不活性学習法: 最初は、目的関数は既存のサンプルに基づいて作成されず、単にトレーニング サンプルを保存し、後で新しい受信サンプルを判断する必要がある場合にのみ、新しい受信サンプルと既存のものを開始する 存在するトレーニング サンプル間の関係。

代表的な遅延学習手法は KNN であり、トレーニング セットに基づいてモデルをトレーニングするのではなく、トレーニング セットを保存し、予測が必要な場合はトレーニング セットから最も類似したサンプルを見つけ、その結果を予測として使用します。結果。

2. KNN アルゴリズムのステップ

KNN アルゴリズムの考え方は、特徴空間内のサンプルの K 個の最も近いサンプルのほとんどが 1 つのカテゴリに属する​​場合、このサンプルはそのカテゴリに属する​​というものです。
近傍の最も単純な尺度はユークリッド距離です。

(1) 予測対象サンプルと全サンプル間の距離を計算
(2) 距離が近い順にソートし、上位 K 個のサンプルを選択
(3) K 個のサンプルのうち最も出現頻度の高いカテゴリーを基準として予想カテゴリー。

おすすめ

転載: blog.csdn.net/weixin_47250738/article/details/125463641