python 之 Pandas基础

from pandas import Series,DataFrame
import pandas as pd
import numpy as np

data = Series([1,2,3,4],index = ['a','b','c','d'])

print(data)

data = {'a':[1,2,3],'b':['we','you','they'],'c':['btc','eos','ae']}
df = DataFrame(data)

print(df)

#创建一个日期范围
dates = pd.date_range('20200401',periods=7)

print('---'*100)
dfs = pd.DataFrame(np.random.randn(7,4), index=dates, columns=list('ABCD'))

#查看顶部数据行
print(dfs.head())
print('---'100)
#查看底部的数据行
print(dfs.tail(3))
print('---'
100)
#显示索引,列和底层numpy数据
print(dfs.index)
print(dfs.columns)
print(dfs.values)
#描述显示数据的快速统计摘要,参考以下示例代码
print(dfs.describe())
#调换数据,参考以下示例代码
print(dfs.T)
#通过轴排序,参考以下示例程序
print(dfs.sort_index(axis=1,ascending=False))
#按值排序,参考以下示例程序
print(dfs.sort_values(by='B'))
#选择一列,产生一个系列,相当于df.A,参考以下示例程序
print('---'100)
#选择一列,产生一个系列
print(dfs['A'])
#选择通过[]操作符,选择切片行。
print(dfs[0:3])
print(dfs['20200401':'20200403'])
print('---'
100)
#使用标签获取横截面
print(dfs.loc[dates[0]])
#通过标签选择多轴
print(dfs.loc[:,['A','B']])
#显示标签切片,包括两个端点
print(dfs.loc['20200401':'20200402',['A','B']])
#减少返回对象的尺寸(大小)
print(dfs.loc['20200401',['A','B']])
#获得标量值
print(dfs.loc[dates[0],'A'])
print('-----'20)
#通过传递的整数的位置选择
print(dfs.iloc[3])
#通过整数切片
print(dfs.iloc[3:5,0:2])
#通过整数位置的列表
print(dfs.iloc[[1,2,4],[0,2]])
#明确切片行
print(dfs.iloc[2:3,:])
#明确切片列
print(dfs.iloc[:,1:3])
#要明确获取值
print(dfs.iloc[1,1])
#要快速访问标量
print(dfs.iat[1,1])
print('----'
50)
#使用单列的值来选择数据
print(dfs[dfs.A > 1])
#从满足布尔条件的DataFrame中选择值
print(dfs[dfs>0])
#使用isin()方法进行过滤
print(dfs[dfs['D'].isin(['0'])])

猜你喜欢

转载自blog.51cto.com/14388114/2484050