Series数据结构
实际上是介绍一些Series的基本属性,和结构之间的关联并不大
#制造Series
#可以直接用list传入数据,或者传入字典或标量
import pandas as P
import numpy as N
s1 = P.Series([1,2,3,4])
s2 = P.Series({'A':1,'B':2,'C':3})
s3 = P.Series(N.random.randn(10))
#索引
s[tag or location]
#加入新数据,类似dataframe加入新列的操作(本质接近,都是加入一个低纬度的单位数据)
#s3[10]=100
#标签对齐
我觉得这个翻译也不太好,这个更接近与一些标签的匹配特性
实际意义就是如果两个Series相结合,index相同的会放在一起处理,不同的会分开并且与nan一起处理
#DataFrame数据结构
#传入DataFrame,可以传入行列表,字典或者多维元祖
#d1 = [1,2,3,4]
d = [[1,2,3,4],[5,6,7]]
d_1 = P.DataFrame(d,index = ['one','two'],columns = ['a','b','c','d'])
d_2= {'A':[1,2,3],'B':[1,2,4],'C':[6,1,7]}#key为列标签元素的维度必须相同,否则报错
d2 = P.DataFrame(d_2,index)
d_3 = {('a','b'):{('A','B'):3,('A','C'):4},
('a','c'):{('A','B'):3,('A','D'):5}
}
d3 = P.DataFrame(d_3)#用多维元祖有点抽象,大概意思是字典内的key是分类,value的字典也是分类,传入后,pandas会自动对有分类的填充对应值,没有对应值的则填入nan