Python中Pandas库 Dataframe的基本操作

Python中Pandas库 Dataframe的基本操作:

import numpy as np
import pandas as pd

# 创建一个dataframe
df = pd.DataFrame(np.arange(9).reshape(3,3),index=list('abc'),columns=['c1','c2','c3'])

df['c1'] , df.c1 # 选择表格中的c1列,返回的是Series类型
df[['c1']] # 选择表格中的c1列,返回的是dataframe类型

df[['c1','c2']] # 选择c1, c2列,返回dataframe,注意是[['列名1','列名2']]

df[0:2] # 返回第1行到第2行的所有行,前闭后开
df[1:2] # 返回第1行,如果用df[1]会报错,返回的是dataframe

df.iloc[1:2] #返回第1行,dataframe类型
df.iloc[-1] #返回最后1行,Series类型

df.head()  # 返回df的前几行数据,默认为前五行,需要前十行则df.head(10)
df.tail()  # 返回df的后几行数据,默认为后五行,需要后十行则df.tail(10)

df.index # 索引
df.columns # 列名
df.values # 以nparray返回df内的数据
df.describe() # 描述性统计
df.T # 转置


# 输出到Excel
writer1 = pd.ExcelWriter('quote2.xlsx')
feeder1.dataframe.to_excel(writer1, sheet_name = '热卷')
writer1.save()

# 从excel中读取数据,传入dataframe
df = pd.read_excel(r"C:\Users\longsheng\PycharmProjects\myReconnaissance\quote2.xlsx", sheetname=0)

df.dropna()#将所有含有nan项的行删除
df.fillna(method='ffill') #在列方向上以前一个值作为值赋给NaN

# 合并
df = pd.merge(df, df1, left_index=True, right_index=True, how='outer')
df = pd.concat([df, df1['列名']], axis=1)






猜你喜欢

转载自blog.csdn.net/kissazhu/article/details/78114196