python DataFrame创建及基本操作

1.DataFrame创建

pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

data:numpy ndarray(结构化或同类),dict或DataFrame,Dict可以包含Series,数组,常量或类似列表的对象

index:dataframe的索引,如果没有自定义,则默认为RangeIndex(0,1,2,…,n)

columns:dataframe的列标签,如果没有自定义,则默认为RangeIndex(0,1,2,…,n)

dtype:默认None,要强制的数据类型。 只允许一个dtype

copy:boolean,默认为False 

# 从np.array 转换为 pd.DataFrame
data = np.array([['','Col1','Col2'],
                ['Row1',1,2],
                ['Row2',3,4]])

pd.DataFrame(data=data[1:,1:],
             index=data[1:,0],
             columns=data[0,1:])

#      Col1 Col2
# Row1    1    2
# Row2    3    4

# 直接采用字典做参数
my_dict = {1: ['1', '3'], 2: ['1', '2'], 3: ['2', '4']}
print(pd.DataFrame(my_dict))
#    1  2  3
# 0  1  1  2
# 1  3  2  4

# 用一个DataFrame做输入参数
my_df = pd.DataFrame(data=[4,5,6,7], index=range(0,4), columns=['A'])
print(pd.DataFrame(my_df))
#    A
# 0  4
# 1  5
# 2  6
# 3  7

# 输入一个Series
my_series = pd.Series({"United Kingdom":"London", "India":"New Delhi", "United States":"Washington", "Belgium":"Brussels"})
print(pd.DataFrame(my_series))
#                          0
# Belgium           Brussels
# India            New Delhi
# United Kingdom      London
# United States   Washington

需要注意,以字典的方式创建,字典的键当做DataFrame的列名,当每个键对应的value值的个数为1时,必须输入index;以Series的方式创建,Series的索引是DataFrame的索引。

发布了43 篇原创文章 · 获赞 28 · 访问量 5万+

猜你喜欢

转载自blog.csdn.net/xiaoxiaoliluo917/article/details/85265736
今日推荐