K最近傍アルゴリズムの概要
1K最近傍アルゴリズムとは何ですか
- あなたの「隣人」に基づいてあなたのカテゴリーを推測してください
1.1 K最近傍アルゴリズム(KNN)の概念 [「近傍」を通じてどのカテゴリに属するかを判断することです]
K最近傍アルゴリズムはKNNアルゴリズムとも呼ばれます。このアルゴリズムは、機械学習では比較的古典的なアルゴリズムです。一般に、KNNアルゴリズムは比較的理解しやすいものです。
- 定義
特徴空間内のサンプルのk個の最も類似した(つまり、特徴空間内の最近傍)サンプルのほとんどが特定のカテゴリに属している場合、サンプルもこのカテゴリに属します。
出典:KNNアルゴリズムは、もともとCover andHartによって提案された分類アルゴリズムでした
- 距離の公式
2つのサンプル間の距離は、ユークリッド距離とも呼ばれる次の式で計算できます。距離の式については後で説明します。
1.2映画タイプの分析
今、いくつかの映画があるとしましょう
その中で?いいえ。映画カテゴリがわかりません。どのように予測しますか?K最近傍アルゴリズムのアイデアを使用できます
各映画と予測された映画の間の距離を個別に計算してから、
[サンプル数が少ないとエラーが発生する場合があります] [kは通常奇数]