Series基本概念
Series:是带有标签的一维数组,可以保存任何数据类型(整数/字符串/浮点数/Python对象等/)
import numpy as np
import pandas as pd
s = pd.Series(np.random.rand(5))
print(s,type(s))
print('----------------------------------')
'''
Series相比于ndarray,是一个自带索引index的数组---->一维数组+对应索引
'''
print(s.index,type(s.index))
print(s.values,type(s.values))
# 当只看series的时候,就是一个ndarry
# series和dictx相比,series更像是有顺序的字典,其索引原理和字典类似(一个用key,一个用index)
结果如下:
0 0.682789
1 0.073801
2 0.082718
3 0.351880
4 0.541636
dtype: float64 <class 'pandas.core.series.Series'>
----------------------------------
RangeIndex(start=0, stop=5, step=1) <class 'pandas.core.indexes.range.RangeIndex'>
[0.68278949 0.07380133 0.08271778 0.35187966 0.54163636] <class 'numpy.ndarray'>
Series的创建
Series创建方法1:由字典创建,字典的key就是index,values就是values
dic = {'a':1,'b':2,'c':3,'4':4,'5':5}
s = pd.Series(dic)
print(s)
结果如下:
4 4
5 5
a 1
b 2
c 3
dtype: int64
Series创建方法2:由数组创建(一维数组)
arr = np.random.randn(5)
s = pd.Series(arr)
print(arr)
print(s)
# 默认index就是从0开始,步长为1的数字
print('-----------------------------------------')
s = pd.Series(arr,index = ['a','b','c','d','e'],dtype = np.object)
print(s)
# index参数:设置index,长度保持一致
# dtype参数:设置数值类型
结果如下:
[-0.76285911 0.92188938 -0.64413812 -0.04823922 1.56716603]
0 -0.762859
1 0.921889
2 -0.644138
3 -0.048239
4 1.567166
dtype: float64
-----------------------------------------
a -0.762859
b 0.921889
c -0.644138
d -0.0482392
e 1.56717
dtype: object
Series 创建方法3:由标量创建
s = pd.Series(10,index=range(4))
print(s)
print(range(4))
结果如下:
0 10
1 10
2 10
3 10
dtype: int64
range(0, 4)