数据挖掘领域十大经典算法之—K-邻近算法/kNN（附代码） - 代码天地

数据挖掘领域十大经典算法之—K-邻近算法/kNN（附代码）

其他 2018-10-07 14:49:57 阅读次数: 0

又叫K-邻近算法，是监督学习中的一种分类算法。目的是根据已知类别的样本点集求出待分类的数据点类别。

简介

又叫K-邻近算法，是监督学习中的一种分类算法。目的是根据已知类别的样本点集求出待分类的数据点类别。

基本思想

kNN的思想很简单：在训练集中选取离输入的数据点最近的k个邻居，根据这个k个邻居中出现次数最多的类别(最大表决规则)，作为该数据点的类别。kNN算法中，所选择的邻居都是已经正确分类的对象。

e.g：下图中，绿色圆要被决定赋予哪个类，是红色三角形还是蓝色四方形?如果k=3，由于红色三角形所占比例为2/3，绿色圆将被赋予红色三角形那个类，如果k=5，由于蓝色四方形比例为3/5，因此绿色圆被赋予蓝色四方形类。

算法复杂度

kNN是一种lazy-learning算法，分类器不需要使用训练集进行训练，因此训练时间复杂度为0;kNN分类的计算复杂度和训练集中的文档数目成正比，也就是说，如果训练集中文档总数为n，那么kNN的分类时间复杂度为O(n);因此，最终的时间复杂度是O(n)。

扫描二维码关注公众号，回复： 3460378 查看本文章

优缺点

优点

理论成熟，思想简单，既可以用来做分类也可以用来做回归 ;

适合对稀有事件进行分类(例如：客户流失预测);

特别适合于多分类问题(multi-modal,对象具有多个类别标签，例如：根据基因特征来判断其功能分类)， kNN比SVM的表现要好。

缺点

当样本不平衡时，如一个类的样本容量很大，而其他类样本容量很小时，有可能导致当输入一个新样本时，该样本的K个邻居中大容量类的样本占多数;

计算量较大，因为对每一个待分类的文本都要计算它到全体已知样本的距离，才能求得它的K个最近邻点;

可理解性差，无法给出像决策树那样的规则。

代码

代码已在github上实现，这里也贴出来

我这里给大家准备了一些学习资料，大家需要的话可以加我QQ：3300863615 免费领取哦

猜你喜欢

转载自blog.csdn.net/wj1314250/article/details/82747920

数据挖掘领域十大经典算法之—K-邻近算法/kNN（附代码）

数据挖掘领域十大经典算法之—K-Means算法（超详细附代码）

数据挖掘领域十大经典算法之—CART算法（超详细附代码）

大数据挖掘领域十大经典算法之—CART算法（附代码）

数据挖掘领域十大经典算法之—SVM算法（超详细附代码）

数据挖掘十大算法（八）—— k-邻近算法（KNN）python和sklearn实现

数据挖掘领域十大经典算法之—C4.5算法（超详细附代码）

数据挖掘领域十大经典算法之—朴素贝叶斯算法（附代码）

数据挖掘十大经典算法（八）----KNN

数据挖掘领域的十大经典算法

数据挖掘领域十大经典算法初探

数据挖掘领域十大经典算法

数据挖掘十大经典算法之KNN算法

数据挖掘十大经典算法之——KNN 算法

数据挖掘十大经典算法之 KNN算法

数据挖掘领域十大经典算法之—SVM算法

数据挖掘十大经典算法之K-means 算法

数据挖掘十大经典算法之——K-Means 算法

十大经典数据挖掘算法之K-Means算法

数据挖掘十大经典算法之 K-Means算法

数据挖掘之十大经典算法

成都大数据分析：数据挖掘领域十大经典算法之—Apriori算法

数据挖掘十大经典算法（十）-----CART

数据挖掘十大经典算法

数据挖掘十大经典算法 .

数据挖掘十大经典算法----简介

数据挖掘十大经典算法（七）-----AdaBoost

数据挖掘十大经典算法（转载）

十大经典数据挖掘算法：EM

十大经典数据挖掘算法：SVM

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)