数据挖掘工具pandas(一)Pandas的数据结构、dataFrame的三种创建方法

一,为什么使用pandas

  • pandas的行、列索引更加灵活
  • pandas处理缺失值优于numpy

二,pandas的数据结构

  • Series(一维数据)
  • DataFrame(二维数据)
  • panel(三维结构数据/面板数据)

三,创建dataFrame第一种方法

import pandas as pd
import numpy as np
a = pd.DataFrame(np.arange(10).reshape(2,5))

# index是行索引,columns是列索引
b = pd.DataFrame(np.arange(10).reshape(2,5),index=list('bc'),columns=list('qwert'))
print(b)

# -------------output---------------------
   q  w  e  r  t
b  0  1  2  3  4
c  5  6  7  8  9

二,创建dataFrame第二种方法(字典)

import pandas as pd

d1 = {
    "name" : ["xiaoming","xiaofang","xiaoli"],
    "age" : [20,32,24],
    "tel" : [10086,10000,10010],
}
a = pd.DataFrame(d1)
print(a)

三,创建dataFrame第三种方法(列表)

import pandas as pd
d2 = [
    {"name" : "xiaoming", "age": 22,"tel":10086 },
    {"name" : "xiaofang", "age": 32,"tel":10000 },
    {"name" : "xiaoli", "age": 24,"tel":10010 },
]
a = pd.DataFrame(d2)
print(a)

猜你喜欢

转载自blog.csdn.net/TFATS/article/details/106280463