K近邻算法所面临的维数灾难问题 - 代码天地

K近邻算法所面临的维数灾难问题

其他 2020-04-12 18:03:51 阅读次数: 0

K近邻算法的基本思想

K近邻算法是一种常用的监督学习方法，其原理非常简单：

给定测试样本，基于某种距离找出训练集中与其最靠近的K个训练样本，然后基于这K个邻居的信息来进行预测。

两个基本要素：1某种距离的概念 2 彼此相近的点具有相似性质的假设

k近邻算法所面临的维数灾难问题

但是随着特征维数的增大，K近邻算法的效果会持续变差，这是因为高维空间过于巨大，高维空间内的点根本不会表现得彼此邻近。

观察维数灾难的一种方法是在一个高维的空间中随机地生成点对，并计算它们之间的距离。

对于从1到100的每一个维度，我们会计算10000个随机点对的距离，并统计其平均值和最小值，结果如图1所示：

可以看出，随着维度的增加，空间中点对的平均距离和最小距离都在逐步增大。

但更糟糕的是最小距离和平均距离之间的比例也在逐步增大，如图2所示：

如何解决该问题？

所以，如果打算在高维空间中使用K近邻算法，不妨先做一些降维的工作。

啊哦落落野花

发布了9 篇原创文章 · 获赞 1 · 访问量 6066

私信关注

猜你喜欢

转载自blog.csdn.net/wcysghww/article/details/82589975

K近邻算法所面临的维数灾难问题

分类问题中的“维数灾难”

维数灾难

最近邻回归分类算法（样本距离，维度灾难，最优K值）

机器学习:分类问题中的“维数灾难”

产生维数灾难的原理，如何避免这个问题

维数灾难与过拟合

机器学习----维数灾难

维数灾难的深度理解

维数灾难与Lasso回归

k-近邻算法解决分类问题

K-近邻算法(约会问题)

kNN的维数灾难与PCA降维

K近邻算法

【K近邻算法介绍】

k-近邻算法

K--近邻算法

k近邻算法（KNN）

K近邻分类算法

K近邻算法（一）

k近邻算法笔记

K近邻算法：KNN

k 近邻算法

“k 近邻算法”综述

KNN（K近邻算法）

k近邻算法(KNN)

K最近邻算法

19.6.29 k近邻算法

TensorFlow K近邻算法

实现K近邻算法

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)