KNN理解

ジェーンへの道と呼ばれることわざがありますが、私はKNNアルゴリズムを説明するために、単純な言語を使用するようにしてください。

現実の世界では、男性と女性への私たちの分割人として物事は、分析のためにソートするリンゴのフルーツ、スイカ、既存の知識に基づいて分類を行うバナナなど、新しいものに分割されます分類する必要があることが多いです、コントラストがそれを分類するためのものの分類とコンピュータ取引をするためにどのようにして、知識の分類がありますか?

使用KNNアルゴリズムは、このような思考「などは、人々のグループのように引き付ける」です。

あなたが最近だれ、あなたと彼は人のクラスです。すべての後に、志を同じくするもの。それが決定されるのであれば、計算は、BにA、次に、二次元平面からの距離を算出する方法として、オブジェクトの分類、オブジェクト分類との間の距離であることが知られています


12989993-8fa5947c8bf10c7e.png

そして、多次元に拡張した場合
12989993-a4c8c9481098c81c.png

Dの値が小さいほど、より近いA及びBは、次いで、A及びBは、より近い位置座標が式で、我々は、のためにA及びB「類似正確により近い、側面から見ることができます。 "

12989993-a743c50c7650d3a8.png

上記のように、サンプルデータの2つの異なるタイプがあり、小さな青い四角形と小さな赤い三角形とのそれぞれは、図緑色の円の中央は、分類すべきデータであるデータをマークすることを示しています。これが私たちの目標である、新しいデータポイントに、私はそれがクラスで何を取得したいですか?さて、緑のドットアイデアkの隣人に応じて分類することができます。

K = 3、三点最も隣接する緑色の点は、2つの小さな赤い三角形と小さな青い四角形、統計的手法に基づいて、いくつかの最も下位である場合に、分類される緑色のドットの決意は、赤い三角形に属しカテゴリ。
K = 5、5つの最近傍緑色の点は、2つの赤い三角形三の青色の正方形である場合、この点緑色であることが分類を決定する統計的方法に基づいて、大部分の少数の下位には、青色に属し正方形のカテゴリ。
私たちは、上記の例から、最近傍アルゴリズムのアイデアは非常に単純であるkは、理解することは非常に簡単に、そして私たちは、このエンドではありませんが、アルゴリズムの原理は、我々はまた、理解する必要があり、また、どのように新規参入者に知って見ることができますポイントを分類する方法、ちょうどカテゴリまで可能最寄りのk個のインスタンスを、見つけます。

ハハ、そう単純な問題、アルゴリズムの核となるアイデアは確かにケースではありませんが、アルゴリズムの実用化に機能するために、量は多くのことに留意すべきである - などのkを決定する方法として、kはそれの最高の数ですか?最近傍とどのように判断するためにそれを与えられた、いわゆる?

我々は、一般的に、典型的には、kの最適値を選択するために、クロスバリデーションを取るために、小さい値を選択します。(言い換えれば、kのキー値を選択することが重要であることはニューラルネットワークの層はハイパーパラメータを調整することで、より良い結果を得るために選択したどのように多くのと似ている、実験的なパラメータ調整です)

ます。https://www.jianshu.com/p/750746da83d7で再現

おすすめ

転載: blog.csdn.net/weixin_33752045/article/details/91243016
おすすめ