机器学习练习（一）——简单的Iris分类练习

Sklearn 本身就有很多数据库，可以用来练习。以 Iris 的数据为例，这种花有四个属性，花瓣的长宽，茎的长宽，根据这些属性把花分为三类。

我们要用分类器去把四种类型的花分开。

import numpy as np  #导入模块
from sklearn import datasets  #用数据库去学习，或者把数据库放到tenserflow模块练习
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier   # 会选择邻近几个点作为他的邻居，综合临近几个点模拟出数据的预测值
from sklearn.model_selection import cross_val_score
import matplotlib.pyplot as plt

iris = datasets.load_iris()  # 创建iris的数据，把属性存在X，类别标签存在y
# print(iris)
iris_X = iris.data
iris_y = iris.target

print(iris_X[:4,:])  # print出来iris的属性  每个sample四个属性，描述花的花瓣的长直径等
# print(iris_y)     # 有三个类的花0，1，2

X_train,X_test,y_train,y_test = \
   train_test_split(iris_X,iris_y,test_size = 0.3)
# 把所有的data分成了要用来学习的data和用来测试的data   X_test和y_test测试的比例占了总数据的30%

# X_train,X_test,y_train,y_test = \
#    train_test_split(iris_X,iris_y,random_state=4)

# print(y_train) # 打乱了数据，尽可能的把数据打乱在学习过程中比不乱的更好

knn = KNeighborsClassifier(n_neighbors=5) #定义用sklearn中的KNN分类算法
knn.fit(X_train,y_train)

knn.fit(X_train,y_train)    # 用KNN进行数据集的学习，把创建的data放进去，他就自动帮你完成train的步骤
print(knn.predict(X_test))   #这里的knn就是已经train好了的knn
# 用我的model的属性去预测它是哪一种花
print(y_test)    # 对比真实值
print(knn.score(X_test,y_test))

分类结果：

预测值：[1 2 1 1 2 2 1 1 2 1 0 1 0 2 2 0 1 1 1 0 2 1 2 2 2 1 1 2 1 1 1 1 0 2 0 0 2
2 2 0 2 1 2 2 0]

真实值：[1 2 1 1 2 2 1 1 2 1 0 1 0 2 2 0 2 1 1 0 2 1 2 2 2 1 1 2 1 2 2 1 0 2 0 0 2
2 2 0 2 1 2 2 0]

评分：0.933333333333

机器学习练习（一）——简单的Iris分类练习

猜你喜欢