【机器学习】使用Scikit-Learn库实现K-近邻（KNN）算法 - 代码天地

【机器学习】使用Scikit-Learn库实现K-近邻（KNN）算法

其他 2018-05-26 00:29:10 阅读次数: 2

懒惰学习算法的典型例子。

KNN仅仅对训练集有记忆功能，不会从其他训练集中通过学习得到一个判别函数

参数化模型和非参数化模型：

1、 参数化模型，通过训练数据估计参数：感知机、逻辑回归、线性SVM

2、 非参数化模型，无法通过固定参数来进行表征，参数数量随训练数据的增加而递增：核SVM、决策树、KNN

KNN基于实例的学习，只对训练数据产生记忆，学习阶段的计算成本基本为0

KNN的实现过程：

1、选择近邻数量k和距离高度量方法

2、找到待分类样本的k个最近邻居

3、根据最近邻居的类标进行多数投票

KNN图：

KNN基于选定的距离度量标准，从训练数据集中找到与待预测目标点的k个距离最近（相似）的样本。

目标点的类标基于这k个最近的近邻的类标使用多数投票确定。

优点：分类器可以快速的适应新的训练数据

缺点：最坏情况下，复杂度随样本的数量的增多而呈线性增长

对于KNN来说，找到正确的k值是在欠拟合和过拟合中找到平衡点的关键所在。

必须保证所选的距离度量标准适用于数据集中的特征。

使用闵可夫斯基距离是对欧几里得距离及曼哈顿距离的一种泛化。

维度灾难：使得KNN算法易于过拟合，对于一个样本数量大小稳定的训练数据集，随着其特征数量的增加，样本中有具体的特征数量变得极其稀疏，也就是近邻距离过远。

本文使用的数据集和库文件定义在该章节有定义了，链接：http://mp.blog.csdn.net/postedit/79196206

实现代码：

from sklearn.neighbors import KNeighborsClassifier

knn = KNeighborsClassifier(n_neighbors=5, p=2, metric='minkowski')
knn.fit(X_train_std, y_train)

plot_decision_regions(X_combined_std, y_combined, 
                      classifier=knn, test_idx=range(105,150))

plt.xlabel('petal length [standardized]')
plt.ylabel('petal width [standardized]')
plt.legend(loc='upper left')
plt.tight_layout()
# plt.savefig('./figures/k_nearest_neighbors.png', dpi=300)
plt.show()

猜你喜欢

转载自blog.csdn.net/chenvast/article/details/79202283

【机器学习】使用Scikit-Learn库实现K-近邻（KNN）算法

简单粗暴理解与实现机器学习之K-近邻算法（二）：k近邻算法api初步使用、Scikit-learn工具、K-近邻算法API、案例

python机器学习（二）特征工程、K-近邻算法、KNN工作流程、scikit-learn实现K近邻算法、K值选择、距离计算、KD树

scikit-learn K-近邻算法（KNN）

《Scikit-learn机器学习》第4章 k-近邻算法小结

[scikit-learn 机器学习] 3. K-近邻算法分类和回归

用Scikit-learn进行机器学习（四）：Python实现KNN（K近邻算法）的底层实现原理及案例

基于scikit-learn包实现机器学习之KNN(K近邻)-完整示例

web安全之机器学习入门——3.1 KNN/k近邻算法 web安全之机器学习入门——2.机器学习概述 scikit-learn K近邻法类库使用小结 predict predict_proba区别的小例子

【Scikit-Learn】k-近邻算法实例

【Scikit-Learn】k-近邻算法回归拟合

【Scikit-Learn】k-近邻算法分类

Python scikit-learn，分类，K近邻算法，KNN，KNeighborsClassifier

基于scikit-learn实现k近邻算法（kNN）与超参数的调试

机器学习-KNN(K-近邻算法)

机器学习--k-近邻（kNN）算法

机器学习——K-近邻（KNN）算法

机器学习 K-近邻算法(KNN)

机器学习之k-近邻（kNN）算法与Python实现

sklearn 机器学习（二）——K-近邻（KNN）算法使用

scikit-learn机器学习（七）--K近邻法

【机器学习】使用Scikit-Learn库实现随机森林

机器学习---scikit-learn中KNN算法的封装

scikit-learn中的机器学习算法封装——kNN

Machine Learning | (3) Scikit-learn的分类器算法-k-近邻

机器学习--KNN（scikit-learn,sklearn）

机器学习--k-近邻（kNN, k-NearestNeighbor）算法

【机器学习实战】K- 近邻算法（KNN算法）

机器学习--k-近邻算法（kNN）学习笔记

机器学习之k-最近邻（kNN）算法

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)