安装 pandas 库
pip install pandas
基本概念
Series 是带有标签的一维数组,可以保存任何数据类型,轴标签统称为索引
# 导入numpy、pandas模块
import numpy
import pandas
a = numpy.random.rand(5)
s = pandas.Series(a)
print(s)
print(type(s)) # 查看数据类型
# .index:查看series索引,类型为rangeindex
print(s.index,type(s.index))
# .values:查看series值,类型是ndarray
print(s.values,type(s.values))
- series相比于ndarray,是一个自带索引index的数组 → 一维数组 + 对应索引,当只看series的值的时候,就是一个ndarray
- series和ndarray较相似,索引切片功能差别不大
- series和字典相比,series更像一个有顺序的字典(字典本身不存在顺序),其索引原理与字典相似(一个用key,一个用index)
Series 创建
字典创建
# Series 创建方法一:由字典创建,字典的key就是index,values就是values
import numpy
import pandas
dic = {"a":1,"b":2,"c":3}
s = pandas.Series(dic)
print(s)
数组创建
# Series 创建方法二:由数组创建(一维数组)
import numpy
import pandas
ar = numpy.random.randn(5)
s = pandas.Series(ar)
print(ar)
print(s) # 默认index是从0开始,步长为1的数字
s = pandas.Series(ar,index = ["a","b","c","d","e"],dtype = numpy.object)
# index参数:设置index,长度保持一致
# dtype参数:设置数值类型
print(s)
标量创建
# Series 创建方法三:由标量创建
import numpy
import pandas
s = pandas.Series(10,index = range(0,4))
print(s)
# 如果data是标量值,则必须提供索引。该值会重复,来匹配索引的长度
name:名称属性
import numpy
import pandas
# name为Series的一个参数,创建一个数组的名称
s = pandas.Series(numpy.random.rand(5),name = "test")
print(s)
# .name方法:输出数组的名称,输出格式为str,如果没用定义输出名称,输出为None
s2 = s.rename("demo")
# .rename()重命名一个数组的名称,并且新指向一个数组,原数组不变
print(s)
print(s2)