pandas入门: 创建DataFrame的三种方式

import pandas as pd
import numpy as np

def create_from_dict(): # 从字典中创建df
    # 使用字典创建df, 字典的每一项采用不同的series创建方式
    df = pd.DataFrame({'A': 1.,
                        'B': pd.Timestamp('20191213'),
                        'C': pd.Series(1, index=list(range(4)), dtype='float32'),
                        'D': np.array([3] * 4, dtype='int32'),
                        'E': pd.Categorical(["test", "train", "test", "train"]),
                        'F': 'foo'
                       })
    print(df)

    # 使用字典创建df, 字典中每一项的值是列表
    df = pd.DataFrame({'A': [3, 4, 8, 9], 'B': [1.2, 2.4, 4.5, 7.3], 'C': ["aa", "bb", "cc", "dd"]})
    print(df)


def create_from_np_array(): # 从numpy数组中创建df
    df = pd.DataFrame(np.random.randn(3, 3), columns=list("ABC"))
    print(df)


def create_from_list(): # 从嵌套列表中创建df
    df = pd.DataFrame([["12", "34", "56"], [1, 2, 3]], columns=["A", "B", "C"])
    print(df)


def main():
    create_from_dict() # 从字典中创建df
    create_from_np_array() # 从numpy数组中创建df
    create_from_list() # 从嵌套列表中创建df


if __name__ == '__main__':
    main()

发布了79 篇原创文章 · 获赞 45 · 访问量 22万+

猜你喜欢

转载自blog.csdn.net/jp_666/article/details/103836269