机器学习笔记(一)k-NN算法 - 代码天地

机器学习笔记(一)k-NN算法

企业开发 2018-08-18 18:43:53 阅读次数: 0

简单地说,k-NN算法就是根据测量不同特征值之间的距离来进行分类的。
输入没有标签的数据后，将新数据的每个特征值的和样本集的数据进行比较，然后提取样本集中特征最相似的数据，通常选取前k个最相似的数据，所有称为k-邻近算法。
K-NN算法的一般流程：
（1）收集数据：可以使用任何方法。
（2）准备数据：计算所需要的数值。
（3）分析数据：可以使用任何方法。
（4）训练数据：不适用于k-NN算法。
（5）测试算法：计算准确率。
（6）使用算法：首先处理数据，输入样本数据输出结构化数据。
接着使用算法进行分类，对数据进行后续处理。

最常见的两点之间或多点之间的距离表示法，又称之为欧几里得度量，它定义于欧几里得空间中，如点 x = (x1,…,xn) 和 y = (y1,…,yn) 之间的距离为：
这里写图片描述

k-NN算法的核心代码如下：

def classify0(inX, dataSet, labels, k):  #inX输入测试数据,dataSet数据集,labels数据集的标签,k的大小
    dataSetSize = dataSet.shape[0]
    diffMat = tile(inX, (dataSetSize,1)) - dataSet 
    sqDiffMat = diffMat**2
    sqDistances = sqDiffMat.sum(axis=1)
    distances = sqDistances**0.5
    sortedDistIndicies = distances.argsort()     
    classCount={}          
    for i in range(k):
        voteIlabel = labels[sortedDistIndicies[i]]
        classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1
    sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True)
    return sortedClassCount[0][0]

(代码来自《机器学习实战 Peter Harrington》)

猜你喜欢

转载自blog.csdn.net/lf960731/article/details/81710401

机器学习笔记(一)k-NN算法

机器学习算法（一） k近邻（k-NN）算法

机器学习笔记 - k-NN算法的数学表达

机器学习实战笔记(一) K-近邻(k-NN)算法

【机器学习】来吧！k-NN！解析k-NN

机器学习实战笔记：k-means和k-NN (一)

机器学习：Parzen窗、k-nn

k-NN算法

K-NN算法学习总结

机器学习 | 机器学习100天(5) --- k-近邻算法(k-NN)

【机器学习】k-近邻算法（k-nearest neighbor, k-NN）

一、K近邻算法(K-NN，K-Nearest Neighbor Classifier )（有监督学习）

机器学习之K-NN（K近邻）

初探监督学习：使用OpenCV实现 k-NN 机器学习算法（分类模型）

教你用OpenCV实现机器学习最简单的k-NN算法

[机器学习]k-NN算法相关知识点

机器学习之分类算法k-NN介绍与代码实现（篇三）

K-NN算法概述

k-NN——算法实现

k-NN算法代码

k-NN算法简介

最新版学习笔记---Python机器学习基础教程（2）k近邻(K-NN)算法---附完整代码

K-NN学习与理解

应用机器学习（二）：k-NN 分类器

机器学习介绍/K-NN最近邻

sklearn库学习之K-NN算法

k-NN（k-近邻）算法

k-近邻算法(k-nn)

K-nn（k邻近学习）

K-NN近邻算法详解

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)