Python数据分析之 Pandas Series对象

一起养成写作习惯!这是我参与「掘金日新计划 · 4 月更文挑战」的第5天,点击查看活动详情

Pandas 是基于 NumPy 设计实现的 Python 数据分析库,Pandas 提供了大量的能让我们高效处理数据的函数和方法,也纳入了很多数据处理的库以及一些数据模型,可以说非常强大。

可以使用以下命令进行安装:

conda install pandas
#
pip install pandas
复制代码

Series数据结构

Pandas 最常用的数据结构主要有两种:Series 和 DataFrame,这篇文章主要介绍一下Series及如何创建Series对象。

Series 是一维数组,由一列索引index和一列值values组成,索引和值是一一对应的,可以存储不同种类的数据类型,字符串、布尔值、数字、Python对象等都可以。

创建Series对象

创建Series对象的格式如下:

s = pd.Series(data, index)
复制代码

参数data为数据,可以是字典、列表、Numpy的 ndarray 数组等;
参数index为索引,值必须唯一,类似于Python字典的键,可以不传,默认为从0开始递增的整数。

  • 从列表创建:
data = ["a", "b", "c", "d", "e"]
s = pd.Series(data)
s
复制代码
  • 从字典创建:

当data为字典时,如果没有传入索引的话,会按照字典的键来构造索引,索引对应的值就是字典的键对应的值。

data = {"a": 1, "b": 2, "c": 3}
s = pd.Series(data)
s
复制代码

结果输出如下:

a    1
b    2
c    3
dtype: int64
复制代码
  • 从 ndarray 数组创建:

ndarray 为Numpy 的数组类型,在之前的文章Python数据分析之 Numpy 的简单使用已经介绍过。

data = np.array([1, 2, 3, 4])
s = pd.Series(data)
s
复制代码

我们可以通过创建的Series对象,调用相应的属性和方法来进行数据的处理分析等,下篇文章继续介绍。

原创不易,如果小伙伴们觉得有帮助,麻烦点个赞再走呗~

最后,感谢女朋友在工作和生活中的包容、理解与支持 !

猜你喜欢

转载自juejin.im/post/7084925907307069447