机器学习2--Sklearn分类器 - 代码天地

机器学习2--Sklearn分类器

其他 2018-07-09 12:08:09 阅读次数: 0

Sklearn 把所有机器学习的模式整合统一起来了，学会了一个模式就可以通吃其他不同类型的学习模式。
例如，分类器，

Sklearn 本身就有很多数据库，可以用来练习。以 Iris 的数据为例，这种花有四个属性，花瓣的长宽，茎的长宽，根据这些属性把花分为三类。

我们要用分类器去把四种类型的花分开。
今天用 KNN classifier，就是选择几个临近点，综合它们做个平均来作为预测值。

导入模块

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

创建数据
加载 iris 的数据，把属性存在 X，类别标签存在 y：

iris = datasets.load_iris()
iris_X = iris.data
iris_y = iris.target

观察一下数据集，X 有四个属性，y 有 0，1，2 三类：

print(iris_X[:2, :])
print(iris_y)

"""
[[ 5.1  3.5  1.4  0.2]
 [ 4.9  3.   1.4  0.2]]
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2]
 """

把数据集分为训练集和测试集，其中 test_size=0.3，即测试集占总数据的 30%：

X_train, X_test, y_train, y_test = train_test_split(
    iris_X, iris_y, test_size=0.3)

可以看到分开后的数据集，顺序也被打乱，这样更有利于学习模型：

print(y_train)

"""
[2 1 0 1 0 0 1 1 1 1 0 0 1 2 1 1 1 0 2 2 1 1 1 1 0 2 2 0 2 2 2 2 2 0 1 2 2
 2 2 2 2 0 1 2 2 1 1 1 0 0 1 2 0 1 0 1 0 1 2 2 0 1 2 2 2 1 1 1 1 2 2 2 1 0
 1 1 0 0 0 2 0 1 0 0 1 2 0 2 2 0 0 2 2 2 1 2 0 0 2 1 2 0 0 1 2]
 """

这里写图片描述

完整代码如下：

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

iris = datasets.load_iris()
iris_X = iris.data
iris_y = iris.target

print(iris_X[:2, :])
print(iris_y)

X_train, X_test, y_train, y_test = train_test_split(iris_X, iris_y, test_size=0.3)
print(y_train)

猜你喜欢

转载自blog.csdn.net/qq_16481211/article/details/80951868

机器学习2--Sklearn分类器

sklearn机器学习：AdaBoost分类器

机器学习分类实例(sklearn)

sklearn机器学习之逻辑回归分类器

机器学习29:Sklearn库常用分类器及效果比较

sklearn机器学习：随机森林分类器RandomForestClassifier

[机器学习] 贝叶斯分类器2

sklearn 的基本机器学习（分类方法）

机器学习sklearn（10）集成分类

机器学习sklearn（5）k近邻分类

[机器学习 02] 分类算法-sklearn

【机器学习】分类算法-sklearn转换器和估计器

机器学习基础之《分类算法（1）—sklearn转换器和估计器》

朴素贝叶斯-分类及Sklearn库实现（2）机器学习实战

机器学习sklearn基础（1）：多元逻辑回归分类器（pcolormesh说明及绘图）

机器学习之XGBoost分类器XGBClassifier-- xgb使用sklearn接口

【机器学习笔记day12】3. sklearn的分类器算法

机器学习sklearn（2）多元线性回归

sklearn机器学习：AdaBoost回归器

机器学习sklearn基础（2）：基于KNN分类器的有监督分类模型（数组去重方法np.unique()以及色级构建说明plt.get_cmap(..)(..)）

机器学习笔记之（2）——贝叶斯分类器

5.机器学习sklearn-----分类实例运动状态

机器学习三(sklearn逻辑回归多分类——数字识别)

[机器学习python实践(3)]Sklearn实现K近邻分类

6.sklearn（机器学习）—简介分类和回归

机器学习sklearn（7）朴素贝叶斯分类

机器学习sklearn（6）决策树分类

机器学习笔记——分类决策树的Sklearn实现

机器学习sklearn库安装与分类、回归数据集

机器学习实战----SKLearn实现SVM之minst分类

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)