scikit-learn使用KNN进行分类 - 代码天地

scikit-learn使用KNN进行分类

其他 2018-08-31 08:52:28 阅读次数: 0

k近邻算法的核心思想是未标记样本的类别，由距离其最近的k个邻居投票决定。

该算法具有准确性高，对异常值和噪声有较高的容忍度等优点。缺点是计算量比较大，内存消耗量也大。

demo code如下：

from sklearn.datasets.samples_generator import make_blobs
import matplotlib.pyplot as plt
import numpy as np
from sklearn.neighbors import KNeighborsClassifier


#生成数据

centers = [[-2,2], [2,2], [0,4]]
"""
生成60个样本，这60个样本分布在centers中心点周围，cluster_std指明生成点分布的松散程度，x是样本集，，y是类别
"""
X, y = make_blobs(n_samples=60,centers=centers, random_state=0, cluster_std=0.6)

#print(X)
#print(y)
plt.figure(figsize=(16,10), dpi=144)
c=np.array(centers)
plt.scatter(X[:,0], X[:,1], c=y, s=100, cmap='cool')
plt.scatter(c[:,0],c[:,1],s=100,marker='^', c='orange')

#plt.show()
#训练KNN模型
k = 5
clf = KNeighborsClassifier(n_neighbors=k)
clf.fit(X,y)


#X_sample=[0,2]
#y_sample = clf.predict(X_sample)
#报错误如下：Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.
#方法1
X_sample=[[0,2]]
y_sample = clf.predict(X_sample)
print('y_sample = ',y_sample)
#方法二
X_sample2=[0,2]
temp = np.array(X_sample2).reshape((1,-1))
print(type(temp))
y_sample2 = clf.predict(temp)
print('y_sample2 = ',y_sample2)
print(type(y_sample2))
#y_sample = clf.predict(np.array(X_sample).reshape((1,-1)))
neighbors = clf.kneighbors(temp, return_distance=False)
print(type(neighbors))

plt.scatter(X_sample2[0], X_sample2[1], marker='x',c=y_sample2[0], s=100, cmap='cool')
print('neightbors num ', neighbors[0])

for i in neighbors[0]:
    plt.plot([X[i][0], X_sample2[0]],[X[i][1], X_sample2[1]], 'k--', linewidth=0.6)

plt.show()


print('done')

猜你喜欢

转载自blog.csdn.net/szfhy/article/details/80188513

scikit-learn使用KNN进行分类

scikit-learn使用KNN进行回归

用Scikit-learn进行机器学习（二）：使用Scikit-learn进行KNN分析——如何进行电影分类

用Scikit-learn进行机器学习（三）：使用Scikit-learn进行KNN分析——鸢尾花的分类识别

scikit-learn 中KNN分类绘图

使用scikit-learn进行文本分类

使用scikit-learn对车辆情况进行分类

用Scikit-learn进行机器学习（五）：使用Scikit-learn进行KNN分析——KNN模型的提升KD-Tree的原理和KD-Tree癌症案例

Python scikit-learn，分类，K近邻算法，KNN，KNeighborsClassifier

使用scikit-learn 估计器分类

使用Scikit-learn实现分类（MNIST）

scikit-learn 常用分类算法的使用

scikit-learn中的KNN

使用scikit-learn进行预处理

scikit-learn中kNN模型的使用及源码解读

scikit-learn使用

scikit-learn 分类 KNeighborsClassifier

KNN scikit-learn相关参数

机器学习--KNN（scikit-learn,sklearn）

使用scikit-learn进行KMeans文本聚类

python 使用scikit-learn对数据进行预处理

Scikit-Learn的基本使用

Scikit-learn使用总结

【SciKit-Learn学习笔记】2：kNN分类/回归,在糖尿病数据集上的表现

scikit-learn: 使用conda安装scikit-learn

AI机器学习 | 基于librosa库和使用scikit-learn库中的分类器进行语音识别

scikit-learn选择正确的分类器

scikit-learn之分类算法

用scikit-learn估计器分类

scikit-learn 多分类混淆矩阵

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)