数据分析与挖掘之分类算法

其他 2018-10-22 05:11:27 阅读次数: 0

常见的分类算法

1、 K-近邻算法（KNN）

2、贝叶斯分类器

3、决策树

4、人工神经网络

5、支持向量机（SVM）

K-近邻算法（KNN）

KNN是通过测量不同特征值之间的距离进行分类。

在KNN中，通过计算对象间距离来作为各个对象之间的非相似性指标，避免了对象之间的匹配问题，在这里距离一般使用欧氏距离或曼哈顿距离：

同时，KNN通过依据k个对象中占优的类别进行决策，而不是单一的对象类别决策。这两点就是KNN算法的优势。

思想总结：就是在训练集中数据和标签已知的情况下，输入测试数据，将测试数据的特征与训练集中对应的特征进行相互比较，找到训练集中与之最为相似的前K个数据，则该测试数据对应的类别就是K个数据中出现次数最多的那个分类，其算法的描述为：

1）计算测试数据与各个训练数据之间的距离；

2）按照距离的递增关系进行排序；

3）选取距离最小的K个点；

4）确定前K个点所在类别的出现频率；

5）返回前K个点中出现频率最高的类别作为测试数据的预测分类。

from numpy import *
import operator
#从列方向拓展
#tile(a,(2,1))  2行1列
def   knn(k,testdata,traindata,labels):
                traindatasize=traindata.shape[0]  #获取训练集行数
                dif=tile(testdata,(traindatasize,1))-traindate
                sqdif=dif**2
                sumsqdif=sqdif.sum(axis=1)  #求和  a.sum(axis=1) 各行求和  a.sum(axis=0) 各列求和
                distance=sumsqdif**0.5
                sortdistince=distance.argsort()  #从小到大排序并编号
                count={}
                for i in range(0,k):
                                vote=label[sortdistince[i]]
                                count[vote]=count.get(vote,0)+1
                sortcount=sorted(count.items(),operator.itemgetter(1).reverse=True)  #降序统计类别计数
                return sortcount[0][0]

猜你喜欢

转载自blog.csdn.net/weixin_42219287/article/details/82825965

数据分析与挖掘之分类算法

数据挖掘之分类算法

数据挖掘之分类

《统计学》学习笔记之分类数据分析

《数据分析实战》总结二之分类算法：决策树，朴素贝叶斯，SVM，KNN，Adaboost

数据挖掘之分类和预测简介

数据分析挖掘

数据分析与挖掘

数据挖掘入门系列教程（二）之分类问题OneR算法

数据分析——数据挖掘算法(决策树）

数据挖掘与数据分析

数据挖掘or数据分析？

《数据分析与挖掘实战》总结及代码练习---chap5 挖掘建模---5.1 分类与预测

python数据分析与挖掘之聚类kmeans算法

Python数据分析与挖掘

数据分析-挖掘建模

数据分析与挖掘练习

【Python数据分析】数据挖掘建模——分类与预测——回归分析

数据挖掘之分类和预测学习笔记

【Python数据分析】数据挖掘建模——分类与预测算法评价（含ROC曲线、F1等指标的解释）

天池数据挖掘比赛-心跳信号分类02-数据分析

数据挖掘天池竞赛——心电图心跳信号多分类预测Task2数据分析

【Python数据分析】数据挖掘建模——分类与预测——人工神经网络

【Python数据分析】数据挖掘建模——分类与预测——决策树

【海量数据挖掘/数据分析】之贝叶斯分类算法（朴素贝叶斯分类、贝叶斯分类计算流程、拉普拉斯修正、贝叶斯分类实例计算）

数据挖掘分类及常用算法

数据挖掘——分类算法——KNN

数据挖掘算法分析

Python数据分析分类算法交叉验证实现

数据分析---常见分类算法

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)