K Nearest Neighbor - 代码天地

K Nearest Neighbor

其他 2019-04-10 11:31:10 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_31823267/article/details/89135583

项目地址：https://github.com/Daya-Jin/ML_for_learner/blob/master/neighbors/KNN.ipynb
原博客：https://daya-jin.github.io/2018/12/29/KNearestNeighbor/

模型结构

K近邻(K Nearest Neighbor)是一种基于存储的算法，该算法不需要拟合任何模型，给定一个需要判别的样本 $x_{i}$ ，KNN算法会在数据库中搜索与 $x_{i}$ 最近的数据或 $k$ 个最近的数据来判别 $x_{i}$ 。特别地，当 $k=1$ 时，KNN就退化成最近邻(Nearest Neighbor)算法，也等同于原型方法，其中每一个样本点都是一个簇中心。由于KNN算法是基于距离的算法，因此影响该算法表现的至关重要的两点有：1. 距离度量的方法；2. 数据各特征的尺度差异。对于第二点，一般对数据进行Standardization变换，使得所有特征服从标准正态分布。可以证明(智商不够)，最近邻算法的误差率近似不会超过贝叶斯误差的两倍。

当KNN应用于高维数据时，问题也随之而来。首先是随着维度的增加，数据点在空间的分布会很稀疏，“最近邻”的概念被淡化；另一个问题是应用最广泛的欧氏距离并不是一个通用的距离度量方法。考虑下图所示的情况：

图中黑点是需要预测的的点，长条区域表示的是只考虑 $y$ 轴距离的5个最近领样本，圆形区域表示的是考虑所有维度距离的5个最近领样本；前者正确分类，后者反而造成了误分类。要减缓这种问题也很简单，将 $x$ 轴的尺度放大或者将 $y$ 轴的尺度缩小即可。一般来说，我们会拉伸类分布概率变化不是很剧烈的那个轴。如上图的例子， $x$ 轴上的类分布概率是一个形如符号函数的分布，而在 $y$ 轴上的类分布概率则是随机的，那我们就拉伸 $x$ 轴。

KNN算法其实很简单，没什么好讲的，唯一值的一提的就是可优化的地方，用K-D树可以减少该算法的计算复杂度。

猜你喜欢

转载自blog.csdn.net/qq_31823267/article/details/89135583

k Nearest Neighbor Algorithm

K NEAREST NEIGHBOR 算法

k-Nearest Neighbor

K Nearest Neighbor

k-Nearest Neighbor algorithm

00 knn(K Nearest Neighbor)

k近邻法k-nearest neighbor

k近邻法(k-nearest neighbor)

K-NN(K-Nearest Neighbor)

K 近邻法（K-Nearest Neighbor, K-NN）

Computer Vision (一) Image Classification : Nearest Neighbor , K-Nearest Neighbor , Data Set splits

K近邻算法（k-nearest neighbor, kNN）

K-NN算法（K-Nearest Neighbor）

kNN分类 (k-nearest neighbor,k近邻法)

【Machine learning】K-NN(k-nearest neighbor)

k近邻算法(k-nearest neighbor)和python 实现

K近邻分类算法 (K-Nearest Neighbor)

K最近邻（k-Nearest Neighbor，KNN）

K-Nearest Neighbor, KNN K最邻近教学视频

最邻近规则分类——KNN(K-Nearest Neighbor)

（五） K-Nearest Neighbor (临近取样，KNN算法)

KNN(k-nearest neighbor algorithm)--从原理到实现

Elasticsearch：探索 k-nearest neighbor (kNN) 搜索

nearest_neighbor

Nearest-Neighbor Methods

【机器学习】k-近邻算法（k-nearest neighbor, k-NN）

一、K近邻算法(K-NN，K-Nearest Neighbor Classifier )（有监督学习）

机器学习实战（一）k-近邻kNN（k-Nearest Neighbor）

机器学习分类算法之K近邻（K-Nearest Neighbor）

第三章 K近邻法(k-nearest neighbor)

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)