Pandas读取txt/csv文件

Pandas是python的一个数据分析包,是基于NumPy的一种工具提供了大量数据结构和函数,可以很方便的处理结构化数据,常见数据结构有:

Series:一维数组与Numpy中的一维array类似

DataFrame:二维的表格型数据结构可以将DataFrame理解为Series的容器

Time- Series:以时间为索引的Series

Panel :三维的数组,可以理解为DataFrame的容器

 

首先新建data.txt文件,内容如下:

书名    作者    评价    评论人数
离开的,留下的那不勒斯四部曲NO.3    〔意〕埃莱娜·费兰特    9.2    218人评价
原来你还在这里    辛夷坞    9.0    351人评价
失踪的孩子那不勒斯四部曲NO.4    〔意〕埃莱娜·费兰特    9.4    159人评价
美丽新世界    〔英〕奥尔德斯 ·赫胥黎     8.8    15人评价
第十年的情人节东野圭吾载誉回归,口碑爆棚全新力作    〔日〕东野圭吾    8.4    732人评价
沉沦    郁达夫    8.2    1868人评价
白鹿原20周年精装典藏版    陈忠实    9.6    1595人评价
小王子(作家榜经典)大星文化出品,全新未删减珍藏版    〔法〕安托万·德·圣-埃克苏佩里    9.4    1016人评价
杀死一只知更鸟    〔美〕哈珀·李    9.4    557人评价
华氏451布拉德伯里逝世5周年精装纪念版    〔美〕雷·布拉德伯里    0    4人评价
哈利·波特与被诅咒的孩子第一部 和 第二部    〔英〕J.K.罗琳    8.2    257人评价

然后开始读取数据

import pandas as pd

data = pd.read_csv('data.txt')  # 读取训练数据
print(data)
  1. 打印data结果如下

第一行为列名,第一列为数据当前索引

2.获取数据大小

print(data.shape) 

得到结果为:

(11, 1)

表示数据总共有11行,一列

3.取得每行数据

for index in data.index:  # type(data)为datafram
    print('当前索引:' + str(index))
    print(list(data.loc[index])) #type(data.loc[indexs])为series

结果如下:

4.取数据后N行数据

csv_batch_data = data.tail(N)  # 取后N条数据


5.读取前N行数据
 

data = pd.read_csv('data.txt',nrows=N) 

猜你喜欢

转载自blog.csdn.net/feiyang5260/article/details/84851065