统计学习方法——KNN - 代码天地

统计学习方法——KNN

编程语言 2019-04-06 21:30:50 阅读次数: 0

版权声明：如果有问题，请直接留言，我会尽快答复。如果您觉得本文不错，请点赞，谢谢。转载请显式标明作者与出处。 https://blog.csdn.net/Torres_10/article/details/89060604

KNN

k近邻（k-nearest neighbor, K-NN）是一种基本分类与回归方法

KNN根据其k个最近邻的训练实例的类别，通过多数表决等方式进行预测，不具有显式的学习过程

KNN相当于将特征空间划分为一些子空间，确定子空间里的每个点所属的类

KNN三要素：距离度量 k值的选择分类决策规则

距离度量
- 详见一般的Lp距离
k值的选择
- 在应用中，k值一般取一个比较小的数值，通常采用交叉验证法来选取最优的k值
  - 关于交叉验证法，可以考虑用k-fold来找k
  - 如k的候选为[3,5,7,9]，可以把数据集分成四份，每次取其中三份作为训练集和一个不同的k值，最后看哪个k值对应模型的Error最小
  - 除了交叉验证，也可以通过Grid Search来找到合适的k值
- k值的减小意味着整体模型变得复杂，容易发生过拟合
- k值的增大意味着整体模型变得简单
- 简单的方法：k选择一个不大不小的奇数（避免打平的情况）
分类决策规则
- 多数表决规则等价于经验风险最小化

K近邻法的实现：kd树

为了提高k近邻搜索的效率，考虑使用特殊的结构存储训练数据，以减少计算距离的次数

kd树是二叉树，表示对k维空间的一个划分

构造kd树，相当于不断地用垂直于坐标轴的超平面将k维空间切分，构造一系列k维超矩形区域，kd树的每一个节点对应于一个k维超矩形区域

wiki : https://zh.wikipedia.org/wiki/K-d树

reference
- 统计学习方法（李航）第3章

猜你喜欢

转载自blog.csdn.net/Torres_10/article/details/89060604

统计学习方法_kNN实现

统计学习方法——KNN

统计学习方法之kNN算法

03_KNN_统计学习方法

《统计学习方法》K近邻算法（KNN）

《统计学习方法》

统计学习方法

《统计学习方法》——第三章KNN及C++实现

李航-统计学习方法-笔记-3：K近邻法（knn）

统计学习方法之统计学习概论

统计学习方法——统计学习的分类

统计学习方法概论

统计学习方法--思想

统计学习方法(1)

(三)统计学习方法zz

统计学习方法：概论 (一)

统计学习方法总结

01 统计学习方法概论

统计学习方法笔记-概述

统计学习方法__01概论

统计学习方法概论（1）

统计学习方法之一

统计学习方法笔记——概论

统计学习方法笔记一

目录-统计学习方法

《统计学习方法》笔记

统计学习方法笔记三

统计学习方法笔记二

统计学习方法 | 概论

统计学习方法|Logistic回归

今日推荐

周排行

Grayscale的报告显示，机构投资者接受比特币

任意角度的场景文本检测论文简单总结

努力学习的意义

蒟蒻 Wendigo 表情包

Ubuntu 14.04 Install Sublime Text 3

守卫

python3中request.urlopen()和requests.get()方法的区别

花点时间顺顺Git（下）

docker安装ngnix进行挂载

spring boot 2 统一异常处理

每日归档

更多

2024-06-13(0)

2024-06-12(0)

2024-06-11(0)

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)