提示:转载请注明出处,若本文无意侵犯到您得合法权益,请及时与作者联系。
前言
本篇博客是作者学习莫烦Python相关Pandas的笔记,如果你向观看莫烦Python的代码,可以进入传送门:莫烦Python之Pandas
一、Numpy 和 Pandas 有什么不同?
Pandas是一个开源的,BSD许可的库(基于numpy),为Python编程语言提供高性能,易于使用的数据结构和数据分析工具,权威内容可以访问官方中文文档。
如果用 python 的列表和字典来作比较, 那么可以说 Numpy 是列表形式的,没有数值标签,而 Pandas 就是字典形式。Pandas是基于Numpy构建的,让Numpy为中心的应用变得更加简单。
要使用pandas,首先需要了解他主要两个数据结构:Series和DataFrame。
二、一维数据结构Series
Series是Pandas中的一维数据结构,类似于Python中的列表和Numpy中的Ndarray,不同之处在于:Series是一维的,能存储不同类型的数据,有一组索引与元素对应。也就是加了索引的一维数据结构(索引不一定是0 1 2 3的数字)
1.创建Series
pd.Series()是带标签的一维数组,其基于Numpy的ndarray 结构。
创建Serise有以下四种常见的形式:
(1)pd.Series([list],index=[list]) 第一个参数为数据,第二个参数为索引(可选,若不指明则默认从零开始)
(2)pd.Series(np.arange(6))
(3)pd.Series({dict}) 通过字典创建
(4)通过DataFrame中某一行或者某一列创建序列
2.访问Series属性
Series.values | 返回Series的数据的值 |
Series.index | 返回Series的索引的值 |
Series.name | 返回Series的名字 |
3.访问Series的索引
三、二维数据结构DataFrame
DataFrame创建的两种方式:
1. 通过二维数组创建
2. 通过字典的方式创建,此种方法创建同时还要注意:字典中的value值只能是一维数组 或 单个的简单数据类型,如果是数组,要求所有数组长度一致,如果是单个数据,则会使每行添加相同数据。(待续)