Python数据分析--Pandas入门--Series与DataFrame创建

Pandas中Series,DataFrame创建

1.简介Series与DataFrame

Pandas共有两种数据结构,分别是DataFrame 和Series.
DataFrame是一种类似于excel表格的数据格式,有行有列.
从DataFrame中取出一列 则是一个Series.
DataFrame中每一列都是一个不同的数据类型.

2.Pandas的导入

pandas一般与numpy一起使用.

import pandas as pd

3.Pandas中DataFrame的创建

创建方式一:使用Pandas.DataFrame()创建.

import pandas as pd
index1 = ["stu1", "stu2", "stu3", "stu4"]
columns1 = ["姓名", "年龄", "性别", "职业"]
data1 = [['A', 18, '男', '数据分析'],
         ['B', 19, '男', '机器学习'],
         ['C', 20, '女', "深度学习"],
         ['D', 19, '男', "搬砖"],
         ]
#逐个传入行索引、列索引、数据部分
df = pd.DataFrame(index=index1, columns=columns1, data=data1)
# 创建DF时,可以省略行索引、列索引; 数据部分不能少
# 创建DF时,省略行索引、列索引。默认是0 1 2 3...
# df = pd.DataFrame(data=data1)

创建方式二:使用字典(dict)创建

import pandas as pd
data_dict = {
    
    "姓名": ["A", "B", "C", "D"],
             "年龄": [18, 19, 20, 19],
             "性别": ['男', '男', '女', '男'],
             "职业": ['数据分析', '机器学习', "深度学习", "搬砖"]
             }

df = pd.DataFrame(data_dict, index=index1)

print("df\n", df)

4.Pandas中Series的创建

创建方式一:使用Pandas.Series()创建.

import pandas as pd
se = pd.Series(index=["stu1", "stu2", "stu3", "stu4"],
              data=["A", "B", "C", "D"]                )

创建方式二:使用字典类型创建.

import pandas as pd
se = pd.Series({
    
    "stu1": "A", "stu2": "B", "stu3": "C", "stu4": "D"})

创建方式三:从DataFrame中取出一列

import pandas as pd
data_dict = {
    
    "姓名": ["A", "B", "C", "D"],
             "年龄": [18, 19, 20, 19],
             "性别": ['男', '男', '女', '男'],
             "职业": ['数据分析', '机器学习', "深度学习", "搬砖"]
             }

df = pd.DataFrame(data_dict, index=index1)

se=df["姓名"]
print("series\n", se, type(se)

猜你喜欢

转载自blog.csdn.net/qq_43944517/article/details/119843842