pandas库

import pandas as pd
import numpy as np

# Series
# 由一组数据(各种Numpy数据类型),以及一组与之相关的标签数据(即索引)组成
s = pd.Series([1, 3, 5, np.nan, 6, 8])
# 获取索引值
print(s[1])

# DataFrame
# DataFrame是一个表格型的数据结构,它含有一组有序的列,每一列的数据结构都是相同的,
# 而不同的列之间则可以是不同的数据结构(数值、字符、布尔值等)。或者以数据库进行类比,
# DataFrame中的每一行是一个记录,名称为Index的一个元素,而每一列则为一个字段,是这个记录的一个属性。
# DataFrame既有行索引也有列索引,可以被看做由Series组成的字典(共用同一个索引)。
dates = pd.date_range('20130101',periods=6)
df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('ABCD'))
# 查看前面两条数据
print(df.head(2))
# 查看最后两条数据
print(df.tail(2))
# 使用 describe() 函数对于数据的快速统计汇总
print(df.describe())
# 使用sort_values()按列对 DataFrame 进行排序
print(df.sort_values('A'))
# 按index选择多列数据
print(df['2013-01-01':'2013-01-03'])
# 选取第一、三行,第一、二列的数据
print(df.iloc[[0,2],[0,1]])
# 筛选出A大于0.1的数据,并且B大于0.1的数据
print(df[(df.A > 0.1) & (df.B > 0.1)])

这里写图片描述
这里写图片描述

猜你喜欢

转载自blog.csdn.net/daaikuaichuan/article/details/80639433
今日推荐