Pandas库的基本使用 pip安装 Series DataFrame

安装pip

pip是Python的包管理工具，熟悉Linux的朋友应该对包管理工具很熟悉（yum），一些库被集成在了pip中，因此我们需要安装pip（win10）

在官方下载地址：https://pypi.org/project/pip/#files，下载.tar.gz包
在自定义位置解压pip包
使用cmd进入自定义路径，执行python setup.py install
添加pip环境变量，在PATH后添加Python安装路径/Scripts
新建cmd或者重启Pycharm，输入pip命令，出现使用说明则为配置成功

Pandas简介

Pandas是基于Numpy构建的拥有更高级数据结构以及分析能力的工具包
两个核心的数据结构：

Series（一维序列）
DataFrame（类似数据库表，二维表结构，与json的锲合度很高）

Pandas可以对数据进行导入、清洗、处理、统计和输出，对于不是很复杂的数据，使用几句pandas代码就可以对数据进行规整

Series

Series 是定长的字典序列，相当于两个ndarray，一列是数据，一列可以是索引

# Series 创建方式一 直接调用Series创建,可以手动指定索引（相当于字典的key）
x1 = Series([1, 2, 3, 4])
x2 = Series(data=[1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
print(x1)
print(x2)
# Series 创建方式二 以字典方式创建Series，先以字典方式存储，再调用Series
s = {'a': 1, 'b': 2, 'c': 3, 'd': 4}
x3 = Series(s)
print(x3)

输出

当前所使用的python版本是： 3.7.2
0    1
1    2
2    3
3    4
dtype: int64
a    1
b    2
c    3
d    4
dtype: int64
a    1
b    2
c    3
d    4
dtype: int64

DataFrame

DataFrame有行索引和列索引，可以看做是有相同索引组成的Series

# 在这里，列索引是科目名称，行索引是五虎上将的姓名
data = {'Chinese': [66, 95, 93, 90, 80], 'English': [65, 85, 92, 88, 90], 'Math': [30, 98, 96, 77, 90]}
df1 = DataFrame(data)
df2 = DataFrame(data, index=['Zhangfei', 'Guanyu', 'Zhaoyun', 'huangzhong', 'Machao'])
print(df1)
print(df2)

输出

   Chinese  English  Math
0       66       65    30
1       95       85    98
2       93       92    96
3       90       88    77
4       80       90    90
            Chinese  English  Math
Zhangfei         66       65    30
Guanyu           95       85    98
Zhaoyun          93       92    96
huangzhong       90       88    77
Machao           80       90    90

说明不指定index的DataFrame和Series一样，默认index都是0,1,2,3...

解决报错

```
提示安装xlrd
```
```
pip install xlrd
```

ModuleNotFoundError: No module named 'openpyxl'

pip install openpyxl

Pandas库的基本使用 pip安装 Series DataFrame

Pandas库的基本使用 pip安装 Series DataFrame

安装pip

Pandas简介

Series

DataFrame

解决报错

猜你喜欢