Python模块(二)——Pandas(一)

提示:转载请注明出处,若本文无意侵犯到您得合法权益,请及时与作者联系。


前言

本篇博客是作者学习莫烦Python相关Pandas的笔记,如果你向观看莫烦Python的代码,可以进入传送门:莫烦Python之Pandas


一、Numpy 和 Pandas 有什么不同

 Pandas是一个开源的,BSD许可的库(基于numpy),为Python编程语言提供高性能,易于使用的数据结构和数据分析工具,权威内容可以访问官方中文文档

如果用 python 的列表和字典来作比较, 那么可以说 Numpy 是列表形式的,没有数值标签,而 Pandas 就是字典形式。Pandas是基于Numpy构建的,让Numpy为中心的应用变得更加简单。

要使用pandas,首先需要了解他主要两个数据结构:Series和DataFrame。

二、一维数据结构Series

Series是Pandas中的一维数据结构,类似于Python中的列表和Numpy中的Ndarray,不同之处在于:Series是一维的,能存储不同类型的数据,有一组索引与元素对应。也就是加了索引的一维数据结构(索引不一定是0 1 2 3的数字)

1.创建Series

pd.Series()是带标签的一维数组,其基于Numpy的ndarray 结构。

创建Serise有以下四种常见的形式:

(1)pd.Series([list],index=[list])  第一个参数为数据,第二个参数为索引(可选,若不指明则默认从零开始)

(2)pd.Series(np.arange(6)) 

(3)pd.Series({dict}) 通过字典创建

(4)通过DataFrame中某一行或者某一列创建序列 

2.访问Series属性

Series.values 返回Series的数据的值
Series.index 返回Series的索引的值
Series.name 返回Series的名字

3.访问Series的索引

三、二维数据结构DataFrame

DataFrame创建的两种方式:
       1. 通过二维数组创建
       2. 通过字典的方式创建,此种方法创建同时还要注意:字典中的value值只能是一维数组 或 单个的简单数据类型,如果是数组,要求所有数组长度一致,如果是单个数据,则会使每行添加相同数据。(待续)

猜你喜欢

转载自blog.csdn.net/qq_41959920/article/details/109266619
今日推荐