读取csv文件
import pandas as pd
data = pd.read_csv("./train.csv")
对csv文件进行操作
data = data.query("x > 1.0 & x < 1.25 & y > 2.5 & y < 2.75")
place_count = data.groupby('place_id').aggregate(np统计方法)
tf = place_count[place_count.row_id > 3].reset_index()
data[data.a>0] 查询整张表
.reset_index() 还原索引
.isin() 类似mysql的in查询, 可以增加条件, df[df.E.isin(['a','d'])&df.D.isin([0,])]
data['字段'] 获取一列数据
time_value = pd.to_datetime(data['time'], unit='s')
time_value = pd.DatetimeIndex(time_value)
data = data.drop(['time'], axis=1)