数据挖掘-分类算法-最近邻分类 - 代码天地

数据挖掘-分类算法-最近邻分类

其他 2020-04-03 22:59:02 阅读次数: 0

最近邻算法

基本思路：近朱者赤，近墨者黑
定义：以全部训练样本作为代表点，计算未知样本与所有训练样本的距离，并以最近邻者的类别作为决策未知样本类别的唯一依据
缺陷：对噪声数据过于敏感

K-最近邻算法（KNN）

目的：解决最近邻算法的缺陷
解决思路：把位置样本周边的多个最近样本计算在在，扩大参与决策的样本量，避免个别数据直接决定决策结果。ps:民主决策
基本思路：选择距离未知样本一定范围内确定个数的K个样本，该K个样本大多数属于某一类型，该未知样本判定为该类型。
实现步骤：

初始化距离为最大值
计算未知样本与每个训练样本的距离dist
连续性自变量：欧氏距离（通常）
分类变量：Jaccard距离或者基于简单匹配系数的距离等
得到前K个最邻近样本中的最大距离maxdist
如果dist<maxdist,则将该训练样本作为K-最近邻样本
重复234，直到未知样本和所有训练样本的距离都算完
统计K个最近邻样本中每个类别出现的次数
选择出现频率最大的类别作为该未知样本的类别
缺陷及改进策略：
样本不平衡-----附加权值-----和该样本距离小的邻居权值大，和该样本距离大的邻居权值则相对较小
需要进行繁重的距离计算----分组快速搜随近邻法-----将样本集按近邻关系分解成组，给出每组质心的位置，以质心作为代表点，和未知样本计算距离，选出距离最近的一个或若干个组，再在组的范围内应用一般的knn算法。
需要进行全部样本的存储-----压缩紧邻算法-----采取一定的算法产生一个新的样本集，该样本集拥有比原样本集少的多的样本数量，但仍然保持有对未知样本进行分类的能力。

R代码举例

发布了0 篇原创文章 · 获赞 0 · 访问量 11

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_45804816/article/details/105301627

数据挖掘-分类算法-最近邻分类

数据挖掘--“分类”详解、K最近邻、决策树、贝叶斯分类、支持向量机--算法讲解

KNN最近邻分类算法

数据挖掘---分类算法之K近邻（KNN）算法

最近邻分类器

【实践】数据挖掘DM课程课业打卡实验1 相似度、距离、最近邻分类器

KNN（K-最近邻分类）分类算法

基于KNN（K最近邻分类算法）的推荐算法

2、最近邻分类器

数据挖掘分类及常用算法

数据挖掘之分类算法

数据挖掘——分类算法——KNN

CS231n_Lecture2_图像分类（数据驱动方法、k最近邻算法、线性分类1）

K最近邻分类算法原理及实例分析

[K最近邻算法KNN]使用案例：酒的分类

K最近邻分类算法理论与实例分析

数据挖掘-KNN-K最近邻算法

K近邻分类算法

数据挖掘day30~33-《数据挖掘导论》第五章，5.1~5.3，基于规则、最近邻、贝叶斯分类器

数据挖掘---分类算法之SOFM算法

数据挖掘算法——常用分类算法总结

K近邻分类算法与kdTree实现的伪代码（构造kdTree 和 kdTree上搜索最近邻）

数据驱动的图像分类方式：K最近邻与线性分类器

机器学习系列-最近邻分类器

机器学习-*-KNN最近邻分类

A--最近邻分类器-KNN

TensorFlow实现最近邻分类器

数据分析与挖掘之分类算法

有监督的数据挖掘算法-分类

数据挖掘——charter 4 分类与回归算法

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)