sklearn 的通用的学习模式

最近学习到深度学习的卷积神经网络那里,感觉有点吃力了,所以先来一些比较轻松愉快的,先写写代码,获得一些继续学习的动力。

sklearn 的通用的学习模式

简介

这篇文章仅仅只是一个笔记,感受一下使用 scikit-learn 这个框架的基本步骤。
1、使用 scikit-learn 为我们提供的数据库,这样我们自己就不用手动输入数据啦;

iris = datasets.load_iris()
iris_X = iris.data
iris_y = iris.target

2、将给出的数据分为训练集和测试集;

X_train, X_test, y_train, y_test = train_test_split(iris_X, iris_y, test_size=0.3)

3、训练数据

knn = KNeighborsClassifier()
knn.fit(X_train, y_train)

4、预测数据

print(knn.predict(X_test))

安装 scikit-learn:

pip3 install -U scikit-learn

“-U” 表示更新操作。

代码实现

import numpy as np
from sklearn import datasets
from sklearn.cross_validation import train_test_split
from sklearn.neighbors import KNeighborsClassifier

iris = datasets.load_iris()
iris_X = iris.data
iris_y = iris.target

print(iris_X[:2, :])
# 标签的数据是整齐划一的
print(iris_y)

X_train, X_test, y_train, y_test = train_test_split(iris_X, iris_y, test_size=0.3)
# train_test_split 这个方法把标签数据打乱
# 在机器学习中认为无序的数据要比有序的数据的学习效果好
print(y_train)

## 训练开始
knn = KNeighborsClassifier()
# 就这一句话,帮你训练完成
knn.fit(X_train, y_train)
# 训练结束

# 把测试数据放进去
print("--- 机器学习的 sklearn 帮我们训练出来的结果 ---")
print(knn.predict(X_test))
print("--- sklearn 的真实数据结果 ---")
print(y_test)

猜你喜欢

转载自blog.csdn.net/lw_power/article/details/78335368
今日推荐