机器学习——文件的读取

机器学习——文件的读取

(一).txt文件的读取

txt的链接
链接:https://pan.baidu.com/s/1fIAUdCDTpR7TiqLHZtx1yg
提取码:0929
python strip() 函数和 split() 函数的详解及实例

一直以来都分不清楚strip和split的功能,实际上strip是删除的意思;而split则是分割的意思。因此也表示了这两个功能是完全不一样的,strip可以删除字符串的某些字符,而split则是根据规定的字符将字符串进行分割。
split()函数
split():拆分字符串。通过指定分隔符对字符串进行切片,并返回分割后的字符串列表(list)

inst=[]
    data=[]
    with open('lenses.txt', 'r') as fr:
        for inst in fr.readlines():#一行一行的读取
            print(inst.strip().split('\t'))
            data.append(inst.strip().split('\t'))

    print('输出读取到的全部数据:')
    print(data)

在这里插入图片描述

(二)excel文件读取操作

excel文件链接:
链接:https://pan.baidu.com/s/1JTX7a4qwi9biuLecQfleUQ
提取码:0929

使用pandas读取文件,使用numpy选取那几列,和切片

import pandas as pd
import numpy as np
import xlrd
from numpy import *
import matplotlib.pyplot as plt
data = pd.read_excel('02.美国新冠肺炎疫情历史总数据9.9.xlsx')
X = np.array(data.drop(['时间','总确诊'],axis=1))
y = np.array(data['总确诊'])
print("新增_治愈_死亡(这三列数据)")
print(X)
print("总确诊(这列数据)")
print(y)

# 划分训练集和测试集

X_train = X[0:217]  # 0~216 作为训练集
y_train = y[0:217]
print("训练集:新增_治愈_死亡(这三列数据)")
print(X_train)
print("训练集:总确诊(这列数据)")
print(y_train)


X_test = X[217:226] # 216~225 作为测试集
y_test = y[217:226]
print("测试集:新增_治愈_死亡(这三列数据)")
print(X_test)
print("测试集:总确诊(这列数据)")
print(y_test)

猜你喜欢

转载自blog.csdn.net/qq_50675813/article/details/121101365