Pandas常用数据结构

Pandas概述

  Pandas(Python Data Analysis Library )是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。它是使Python成为强大而高效的数据分析环境的重要因素之一。

  Pandas专用于数据预处理和数据分析的Python第三方库,最适合处理大型结构化表格数据

  •   Pandas是2008年Wes McKinney于AQR资本做量化分析师时创建
  •   Pandas借鉴了R的数据结构
  •   Pandas基于Numpy搭建,支持Numpy中定义的大部分计算
  •   Pandas含有使数据分析工作更简单高效的高级数据结构和操作工具
  •   Pandas底层用Cython和C做了速度优化,极大提高了执行效率

  Pandas 常用的数据结构有两种:Series 和 DataFrame

Series简介

  Series 是一个带有 名称 和索引的一维数组,在 Series 中包含的数据类型可以是整数、浮点、字符串、Python对象等。

猜你喜欢

转载自www.cnblogs.com/zry-yt/p/11794941.html