python机器学习(2)训练、交叉验证、测试

本节给小伙伴们提供一个最简单的例子,作为入门使用

特别说明:本教程来源于何先生的教材,结合自己的思考以及Andrew的教程形成,其中数据使用已经得到许可,下面不再注明

第一步:把数据读出来并且进行分组

import numpy as np
#将文本文件转换为numpy矩阵
with open(“prices.txt”,“r”) as file:
data = np.array([line.strip().split(",") for line in file],dtype=np.float32)
length =len(data)
#求出数据长度
n_train,n_cv = int(0.7length),int(0.15length)
#选出训练集和交叉集
idx = np.random.permutation(length)
#随机产生一个序列
train_idx,cv_idx = idx[:n_train],idx[n_train:n_train+n_cv]
test_idx = idx[n_train+n_cv:]
#把几个集都给选好
train,test,cv = data[train_idx],data[test_idx],data[cv_idx]
#以上完成了把数据从txt文本读出来并且完成分类的过程

  1. 说明,prices.txt文件应该和你创造的这个py文件在同一路径下
  2. 有关numpy的知识会慢慢补充出来
  3. 这里先写下np.random.permutation的作用 [超链接准备]

第二步,开始进行预测

默认你已经装好了scikit-learn 这个模块

发布了59 篇原创文章 · 获赞 19 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/weixin_43914889/article/details/88379056