利用Python进行数据分析 第5章 pandas入门

pandas库,含有使数据清洗和分析工作变得更快更简单的数据结构和操作工具。pandas是基于NumPy数组构建。

pandas常结合数值计算工具NumPy和SciPy、分析库statsmodels和scikitlearn,和可视化库matplotlib等工具一同使用。

5.1 pandas数据结构介绍

pandas的主要数据结构:Series和DataFrame

(1)Series

Series是一种类似于一维数组的对象,由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成:

可通过Series的values和index属性获取其数组表示形式和索引对象:

可创建自定义的索引:

扫描二维码关注公众号,回复: 7434003 查看本文章

 1)与普通NumPy数组相比,可通过索引的方式选取Series中的单个或一组值:

 2)

(2)DataFrame

(3)索引对象

5.2 基本功能

猜你喜欢

转载自www.cnblogs.com/ElonJiang/p/11629073.html