Python学习---Pandas

Pandas: 是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

基本语法

要使用pandas,首先需要了解他主要两个数据结构:Series和DataFrame

Series的字符串表现形式为:索引在左边,值在右边。由于我们没有为数据指定索引。于是会自动创建一个0到N-1(N为长度)的整数型索引

import pandas as pd
import numpy as np
example1=pd.Series([1,3,6,2.0,44,1])

在这里插入图片描述
DataFrame是一个表格型的数据结构,它包含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔值等)。DataFrame既有行索引也有列索引, 它可以被看做由Series组成的大字典。

#建立一个6*4的矩阵数据
data=pd.date_range('20210309',periods=6)
example2=pd.DataFrame(np.random.randn(6,4),index=data,columns=['1','2','3','4'])#index行标签 columns 列标签

在这里插入图片描述

print(example2['2'])
a=pd.DataFrame(np.arange(12).reshape((3,4)))#没有给定行标签和列标签的数据 
print(example2.index)#对列的序号
print(example2.columns)#每种数据的名称

在这里插入图片描述

#选取DataFrame中的数据
print(example2[0:3])
print(example2["20210309","20210310"]
print(example2.loc['20210309'])#获取特定行内容
#过标签名字选择某一行数据, 或者通过选择某行或者所有行(:代表所有行)然后选其中某一列或几列数据
print(example.loc['1':'2'])
print(example2.iloc[2,1]
print(example2.iloc[3:5,1:3])
print(example2.iloc[1,2,3],[1:3])

在这里插入图片描述
在这里插入图片描述

根据位置设置 loc 和 iloc

利用索引或者标签确定需要修改值的位置

example2.iloc[1,2]=666
example.loc['20210310','B']=999

在这里插入图片描述
处理丢失数据

example2.dropna(axis=0,how='any')#0: 对行进行操作; 1: 对列进行操作,'any': 只要存在 NaN 就 drop 掉; 'all': 必须全部是 NaN 才 drop 
example2.fillna(value=0)#将 NaN 的值用其他值代替

Pandas 导入导出
pandas可以读取与存取的资料格式有很多种,像csv、excel、json、html与pickle等
详细解释 https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html

扫描二维码关注公众号,回复: 13464395 查看本文章
#查看DataFrame的前几行以及后几行
data=pd.read_csv('data.csv')
data.head(n=5)  # 可以添加参数n,表示显示几行
data.tail()

plot 出图:数据可视化

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
data=pd.Series(np.random.randn(1000),index=np.arange(1000))
# 为了方便观看效果, 我们累加这个数据
data.cumsum()
# pandas 数据可以直接观看其可视化形式
data.plot()
plt.show()
data = pd.DataFrame(
    np.random.randn(1000,4),
    index=np.arange(1000),
    columns=list("ABCD")
    )
data.cumsum()
data.plot()
plt.show()

Reference

莫烦python
https://mofanpy.com/tutorials/data-manipulation/np-pd/pd-plot/

未完待续…

猜你喜欢

转载自blog.csdn.net/m0_50945459/article/details/114587501