sklearn实战:使用knn算法进行分类及可视化 - 代码天地

sklearn实战:使用knn算法进行分类及可视化

其他 2018-06-08 05:08:43 阅读次数: 2

%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np

from sklearn.datasets.samples_generator import make_blobs
# 生成数据
centers = [[-2, 2], [2, 2], [0, 4]]
X, y = make_blobs(n_samples=60, centers=centers, random_state=0, cluster_std=0.60)

# X #矩阵，二维数组
y #y是数据集的类别labe

array([1, 0, 0, 1, 0, 1, 1, 0, 2, 2, 0, 0, 2, 2, 2, 2, 0, 0, 0, 0, 1, 1,
       2, 0, 0, 1, 2, 0, 0, 2, 2, 2, 1, 2, 1, 2, 2, 1, 0, 1, 1, 0, 1, 2,
       1, 1, 0, 1, 0, 2, 2, 1, 1, 2, 2, 0, 1, 2, 0, 1])

# 画出数据
plt.figure(figsize=(16,10), dpi=144)
c=np.array(centers)
plt.scatter(X[:, 0], X[:, 1], c=y,s=100, cmap='cool')         # 画出样本
#X[:, 0]所有点的x轴坐标， X[:, 1]所有点y轴坐标。s点的大小，c是一个数组类别0，1，2按类别作色
plt.scatter(c[:, 0], c[:, 1], s=100, marker='^', c='orange')   # 画出中心点

<matplotlib.collections.PathCollection at 0x2af64625588>

这里写图片描述

from sklearn.neighbors import KNeighborsClassifier
# 模型训练
k = 5
clf = KNeighborsClassifier(n_neighbors=k)
clf.fit(X, y);

# 进行预测
X_sample = np.array([[0, 2]])
y_sample = clf.predict(X_sample)
# y_sample
neighbors=clf.kneighbors(X_sample, return_distance=False)
neighbors #取出来的点是训练样本X里的索引

array([[16, 20, 48,  6, 23]], dtype=int64)

# 画出示意图
plt.figure(figsize=(16,10), dpi=144)
plt.scatter(X[:, 0], X[:, 1], c=y, s=100, cmap='cool');    # 样本
plt.scatter(c[:, 0], c[:, 1], s=100, marker='^', c='k');   # 中心点
plt.scatter(X_sample[0][0], X_sample[0][1], marker="x",
            c='r', s=200, cmap='cool')    # 待预测的点

for i in neighbors[0]:
    plt.plot([X[i][0], X_sample[0][0]], [X[i][1], X_sample[0][1]], 
             '-.', linewidth=0.6);    # 预测点与距离最近的 5 个样本的连线
#[X[i][0], X_sample[0][0]] , x坐标
# [X[i][1], X_sample[0][1]]，y坐标

这里写图片描述

猜你喜欢

转载自blog.csdn.net/douhh_sisy/article/details/80599038

sklearn实战:使用knn算法进行分类及可视化

KNN分类实战-----对鸢尾花数据进行分类(sklearn)

sklearn实战：使用knn进行回归拟合

使用KNN算法进行分类

KNN可视化

机器学习与深度学习——通过knn算法分类鸢尾花数据集iris求出错误率并进行可视化

sklearn的KNN算法的使用

KNN分类算法原理及实现及sklearn中的使用方法

机器学习——python可视化实现KNN算法

第4章决策树算法【分类】（五决策树sklearn总结和可视化总结）

sklearn学习笔记之knn分类算法

python 使用pyecharts进行可视化

使用matplotlib进行可视化

使用Python进行可视化呈现

t-SNE进行分类可视化

高维数据PCA降维可视化(KNN分类)

Python数据分析实战：使用pyecharts进行数据可视化

使用A*算法实现三维迷宫并进行可视化

算法可视化

sklearn中SVM的可视化

决策树可视化sklearn

利用sklearn获取手写数字数据集，并进行可视化

机器学习入门-加载sklearn中数据并用matplotlib进行可视化

用pyecharts对sklearn中的鸢尾花数据进行可视化展示

python数据可视化：使用Dash进行交互式可视化

使用Tensorboard进行结构可视化，以及网络运算过程可视化

TensorBoard进行可视化

KNN分类 KNN算法

机器学习实战——KNN分类算法

机器学习实战 -- kNN分类算法

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)