版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/benzhaohao/article/details/80425415
一、安装sklearn
pip 安装
安装 Scikit-learn (sklearn) 最简单的方法就是使用 pip 安装它.
首先确认自己电脑中有安装
Python (>=2.6 或 >=3.3 版本)
Numpy (>=1.6.1)
Scipy (>=0.9)
然后打开cmd窗口,使用如下命令安装
pip3 install -U scikit-learn(因为我用的版本是python3,所以pip后面要加3)
ps:其实只要电脑中已经安装anaconda,那就不需要再安装sklearn了
扫描二维码关注公众号,回复:
4322694 查看本文章
可以使用 conda list 命令查看anaconda中是否有sklearn模块
二、使用sklearn中KNN算法识别 Iris(鸢尾花)类别
import numpy as np
from sklearn import datasets #从sklearn自带数据库中加载鸢尾花数据
from sklearn.model_selection import train_test_split #引入train_test_split函数
from sklearn.neighbors import KNeighborsClassifier #引入KNN分类器
iris=datasets.load_iris() #将鸢尾花数据存在iris中
iris_X=iris.data #指定训练数据iris_X
iris_y=iris.target #指定训练目标iris_y
# print(iris_X[:2,:]) //查看前两个例子的所有特征值
# print(iris_y) //查看目标标签名称
#使用train_test_split()函数将数据集分成用于训练的data和用于测试的data
X_train,X_test,y_train,y_test=train_test_split(iris_X,iris_y,test_size=0.3)
knn=KNeighborsClassifier() #调用KNN分类器
knn.fit(X_train,y_train) #训练KNN分类器
print(knn.predict(X_test)) #预测值
print(y_test) #真实值
输出结果
一二行实预测值,三四行是真实值