数据类型-DataFrame

数据类型-DataFrame

  • DataFrame是由多个Series数据列组成的表格数据类型,每行Series值都增加了一个共用的索引
  • 既有行索引,又有列索引
    • 行索引,表明不同行,横向索引,叫index,0轴,axis=0
    • 列索引,表名不同列,纵向索引,叫columns,1轴,axis=1
  • DataFrame数据类型可视为:二维 带标签 数组
  • 每列值的类型可以不同
  • 基本操作类似Series,依据行列索引操作
  • 常用于表达二维数据,但也可以表达多维数据(Dataframe嵌套,极少用)

DataFrame数据类型创建

Python list列表 创建DataFrame

df = pd.DataFrame([True,1,2.3,'a','你好']) #1维

df = pd.DataFrame([[True,1,2.3,'a','你好'],[1,2,3,4,5]]) #2维

df = pd.DataFrame([[[True,1,2.3,'a','你好'],[1,2,3,4,5]],[[True,1,2.3,'a','你好'],[1,2,3,4,5]]]) #3维,不建议

Python 字典 创建DataFrame

df = pd.DataFrame({'one':[1,2,3,4],'two':[9,8,7,6]})

df = pd.DataFrame({'one':[1,2,3,4],'two':[9,8,7,6]},index = ['a','b','c','d']) #自定义行索引

df = pd.DataFrame({
    'A' : 1,
    'B' : 2.3,
    'C' : ['x','y',5] #需要多行
})

dt = {
    'one':pd.Series([1,2,3],index=['a','b','c']),
    'two':pd.Series([9,8,7,6],index=['a','b','c','d',])
}
d = pd.DataFrame(dt) #one two自动列索引,abcd自动行索引.每个元素对应DataFrame的一列,每个元素内的键值对应一行

pd.DataFrame(dt,index=['b','c','d'],columns=['two','three']) #数据根据行列索引自动补齐

ndarray数组 创建DataFrame

df = pd.DataFrame(np.arange(10).reshape(2,5)) #自动生成行/列索引

df = pd.DataFrame(np.random.randn(6,4),index=[1,2,3,4,5,6],columns=['a','b','c','d']) #自定义行列索引

Series 创建DataFrame

e = pd.DataFrame([pd.Series([1,2,3]),pd.Series([9,8,7,6])],index=['a','b'])

DataFrame属性

di = {
    '姓名':['张三','李四','王五','赵六'],
    '性别':['','','',''],
    '年龄':[12,22,32,42],
    '地址':['北京','上海','广州','深圳']
}
d = pd.DataFrame(di,index=['d1','d2','d3','d4'])

d
d.head() # 显示头部几行
d.tail(3) # 显示末尾几行
d.info() # 相关信息概览

d.shape # 行数 列数
d.dtypes # 列数据类型

d.index # 获取行索引
d.columns # 获取列索引
d.values # 获取值

猜你喜欢

转载自www.cnblogs.com/yoyo1216/p/10131724.html