python学习[3]_按日期分割数据集

按日期分割数据集

-1、 首先我这里的数据集,形式如下图:
这里写图片描述

这里可以看见第一行为数据的属性,最后一个为时间,格式为.csv文件,我希望按日期(年月日)划分出数据,即按天将数据分割出来。
  • 2、由于数据集较大,因次需要导入pandas,利用pandas将csv文件导入到Python中。

  • 3、假设导入的变量为d,那么2014年11月18号这天的数据即可以这样截取:d[d[‘time’].str.contains(r’2014-11-18’)]

  • 4、最后再将结果导出为csv文件即可。

import pandas
d = pandas.read_csv('d1828.csv')
d1118=d[d['time'].str.contains(r'2014-11-18')]
d1119=d[d['time'].str.contains(r'2014-11-19')]
d1120=d[d['time'].str.contains(r'2014-11-20')]
d1121=d[d['time'].str.contains(r'2014-11-21')]
d1122=d[d['time'].str.contains(r'2014-11-22')]
d1123=d[d['time'].str.contains(r'2014-11-23')]
d1124=d[d['time'].str.contains(r'2014-11-24')]
d1125=d[d['time'].str.contains(r'2014-11-25')]
d1126=d[d['time'].str.contains(r'2014-11-26')]
d1127=d[d['time'].str.contains(r'2014-11-27')]
d1128=d[d['time'].str.contains(r'2014-11-28')]
d1118.to_csv('d1118.csv')
d1119.to_csv('d1119.csv')
d1120.to_csv('d1120.csv')
d1121.to_csv('d1121.csv')
d1122.to_csv('d1122.csv')
d1123.to_csv('d1123.csv')
d1124.to_csv('d1124.csv')
d1125.to_csv('d1125.csv')
d1126.to_csv('d1126.csv')
d1127.to_csv('d1127.csv')
d1128.to_csv('d1128.csv')
  • 5、这里d1828.csv文件中含有18号到28号的日期,因此最后导出的文件是2014年11月18号到2014年12月28号的文件。

  • 6、同理,当得到某一天的数据后,如果还想继续按时间(即小时)划分,也是同样的方法。用pandas进行较大数据处理时,速度也很快。

猜你喜欢

转载自blog.csdn.net/yuxiao_v/article/details/60354532