王权富贵：《机器学习实战》第二章重点 - 代码天地

王权富贵：《机器学习实战》第二章重点

其他 2019-03-04 10:11:19 阅读次数: 0

第二章：

这里的重点是几个python的用法：

1.获得排序索引值。 sortedDistIndicies = distances.argsort()

2.是创建字典来计数。 classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1

3.根据不同域来排序。 sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True)

4.第2和第3点可以组合在一起构成一个多数表决器

详细程序如下：

inX是输入向量[0,0]，dataSet是训练数据[[0,0],[9,9],[0,1]]，labels是对应标签[a,b,a]，k是取前几个高频率出现的类别这里取2。

def classify0(inX, dataSet, labels, k):
dataSetSize = dataSet.shape[0]
diffMat = tile(inX, (dataSetSize,1)) - dataSet

PS:tile(A,reps)把数据重复多少遍的意思。

tile(inX, (dataSetSize,1))=tile([0,0], (3,1))=[[0,0],[0,0],[0,0]]

sqDiffMat = diffMat**2
sqDistances = sqDiffMat.sum(axis=1) PS：axis=1是行相加的意思
distances = sqDistances**0.5 PS：到这步骤完成了欧式距离的计算
sortedDistIndicies = distances.argsort()

PS:这边argsort()是从小打到排列，不打乱原本顺序，只取出它的索引值。

一开始原本数据就就对应标签，现在数据还是对应标签。

classCount={}
for i in range(k):
voteIlabel = labels[sortedDistIndicies[i]]
classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1

PS:这里get(voteIlabel,0) + 1 是获得字典key对应的value。

如果字典没有对应key就创建一个key初始为0然后+1，如果有就+1。

比如一开始k=0（相当于1），inX[0,0]对应距离最小的是dataSet中的[0,0]对应标签为a。这里classCount[]={a:1}。

接下来k=1（相当于2），inX距离dataSet第二小的点是[0,1]对应标签是a。这里classCount[]={a:2}。

这里的k就是选取多少个最近的点，把他们对应的标签个数统计出来，下面做多数表决。

sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True)

PS:这里是按域排序operator.itemgetter(1)对应的就是字典里面value的域。（0对应的是key的域）。这里排序完就相当于多数表决。

return sortedClassCount[0][0]

猜你喜欢

转载自blog.csdn.net/a1103688841/article/details/87887297

王权富贵：《机器学习实战》第二章重点

《机器学习实战》-----第二章KNN

机器学习实战第二章 KNN算法的实现

机器学习实战第二章记录

《机器学习实战》笔记第二章（2）

[机器学习实战] 阅读第二章

[机器学习]第二章Numpy

机器学习第二章

第二章机器学习概述

王权富贵书评：《TensorFlow实战Google深度学习框架第二版》(郑泽宇梁博文顾思宇著)

Hibernate实战学习（第二章）

王权富贵：给Linux系统装配机器学习需要的软件

《机器学习实战》第二章学习笔记1（knn算法）

《机器学习实战》学习笔记第二章 —— K-近邻算法（一）

机器学习实战-学习笔记【第二章 KNN 近邻算法】

《机器学习实战》第二章学习笔记：K-近邻算法（代码详解）

Machine Learning in Action机器学习实战第二章 KNN算法（笔记）

《机器学习实战》第二章 - k-近邻算法

《机器学习实战》第二章——K-近邻算法

机器学习实战源码第二章KNN算法2.1

《机器学习实战》第二章——k-近邻算法——笔记

第二章 K-近邻算法（机器学习实战）

《机器学习实战之第二章k-近邻算法》

机器学习实战：基于Scikit-Learn和TensorFlow---第二章笔记

机器学习实战《Machine Learing in Action》——第二章python知识点

周志华《机器学习》第二章学习笔记

周志华机器学习笔记第二章

周志华机器学习第二章总结及课后答案

周志华机器学习总结第二章

百面机器学习第二章--经典算法

今日推荐

“开源信徒”周鸿祎开源360智脑大模型

华为ensp中vrrp虚拟路由器冗余协议原理及配置命令

基于Python爬虫广东广州水酒店宾馆数据可视化系统设计与实现(Django框架) 研究背景与意义、国内外研究现状

知识融合：知识图谱构建的关键技术

文心一言收费还是免费：全面解析其价格策略与服务价值

百万用户通话新风潮：仅需50秒，无界AI让彩铃变身短视频

【STM32项目】基于STM32多传感器融合的新型智能导盲杖设计（完整工程资料源码）

文生视频大模型Sora的复现经验

腾讯云函数计算技术：云原生架构下的Serverless与微服务新篇章

干货分享｜JumpServer 三种常见的文件传输方式效果对比

【榜单公布】2023年度征文活动已结束

微信小程序（一）域名备案及HTTPS访问

周排行

Android六大布局详解——RelativeLayout（相对布局）

div absolute 居中

dict字典练习题

Django的Models模型

rand和srand的用法

聊一聊你理解的多线程

基于python语言利用割线法原理求解函数最小值问题

贫富分化社会不平等相关10本书，好书7本

jQuery中的wrap()、unwrap()

Linux学习【1】： cat 命令详解

每日归档

更多

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)

2024-04-08(60)

2024-04-07(4)

2024-04-06(65)

2024-04-05(0)