机器学习04 kd树 - 代码天地

机器学习04 kd树

其他 2019-04-29 13:21:08 阅读次数: 0

为什么要使用kd树
k近邻法最简单的实现是线性扫描（穷举搜索），即要计算输入实例与每一个训练实例的距离。计算并存储好以后，再查找K近邻。当训练集很大时，计算非常耗时。

为了提高kNN搜索的效率，可以考虑使用特殊的结构存储训练数据，以减小计算距离的次数。

什么是kd树
kd树：为了避免每次都重新计算一遍距离，算法会把距离信息保存在一棵树里，这样在计算之前从树里查询距离信息，尽量避免重新计算。其基本原理是，如果A和B距离很远，B和C距离很近，那么A和C的距离也很远。有了这个信息，就可以在合适的时候跳过距离远的点。
1989年，另外一种称为Ball Tree的算法，在kd Tree的基础上对性能进一步进行了优化。感兴趣的读者可以搜索Five balltree construction algorithms来了解详细的算法信息。
如何使用kd树
1.建立kd树
kd树(K-dimension tree)是一种对k维空间中的实例点进行存储以便对其进行快速检索的树形数据结构。kd树是一种二叉树，表示对k维空间的一个划分，构造kd树相当于不断地用垂直于坐标轴的超平面将K维空间切分，构成一系列的K维超矩形区域。kd树的每个结点对应于一个k维超矩形区域。利用kd树可以省去对大部分数据点的搜索，从而减少搜索的计算量。
在这里插入图片描述
2.最近邻域搜索

案例：
有如下样本：
T={(2,3),(5,4),(9,6),(4,7),(8,1),(7,2)}
第一步：

按照x轴数据进行排序：2 4 5 7 8 9 
按照Y轴数据排序        1 2 3 4 6 7 

第二步：

通过对比得出x轴的数据比Y轴的数据更加离散（方差计算）
所以选择从X轴的树中找到一个中间数，可以选择（7.2）也可以选择（5.4），这里选择（7.2）

第三步：

在这里插入图片描述

做题：
查找点(2.1,3.1)

查找点(2,4.5)

从二叉树找到4.7为最佳结点，以2，4.5为圆心，到4.7的距离为半径，发现5.4和2.3在圈内

或者以4.7为最佳结点，回溯到5.4 发现 5.4里面还有一个2.3所以再测试一下2.3 最后对比，发现还是2.3最近

对比的都是各个结点到2，4.5的半径

猜你喜欢

转载自blog.csdn.net/singularity1980/article/details/89672222

机器学习04 kd树

KD树学习小结

机器学习：K近邻算法，kd树

kd树学习体会

机器学习学习笔记 knn算法 kd树实例

KD树学习笔记（只适合OIer）

机器学习—K近邻,KD树算法python实现

机器学习----KNN中的Kd树及BBF优化

机器学习KNN算法中的KD树搜索

机器学习总结之——KD树小白理解

机器学习实战——K-近邻法、KD树

机器学习系列之——Knn算法 kd树详解

机器学习模型自我代码复现：KD树

KD树学习小结【待补充,数据结构 - KD树】

机器学习笔记之八—— knn-最简单的机器学习算法以及KD树原理

[机器学习 04] 树，集成学习-sklearn

统计学习笔记（3）——k近邻法与kd树

[AI] 最近邻KNN 及平衡KD 树学习笔记

kd树

【机器学习】【KNN】kd树，详解+Python实现手写数字的识别系统

机器学习（一）——k-近邻、kd树及其python实现

【机器学习实战】KNN分类器(未使用KD树搜索)

机器学习100天（三十三）：033 KD树的Python实现

【机器学习（二）】K近邻算法：原理、kd树构造和查找、案例分析、代码（机器学习库、自己实现）

【机器学习笔记】《统计学习方法》第三章 k近邻算法+kd树

简单粗暴理解与实现机器学习之K-近邻算法（五）：kd树的原理、构造方法、案例

机器学习笔记（三）——归一化、KD树、数值型特征无量纲化、数值型特征分箱等

机器学习第三周打卡：归一化+KD树+特征预处理

机器学习方法基础与概论（三）（k 近邻法 KNN，基本原理及 sklearn 代码示例，kd 树）

「学习笔记」网络战争 - KD-Tree - 最小割树 - 学习笔记

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)