Pandas-Series

Pandas含有使数据分析工作变得更快更简单的高级数据结构和操作工具，pandas基于numpy构建。

两个主要数据结构：Series和DataFrame。

Series：一种类似于一位数组的对象，由一组数据和一组与之相关的数据标签组成。

产生Series：

1.仅由一维列表即可产生最简单的Series:

obj = Series([-1, 5, 7, 9])

		0   -1
		1    5
		2    7
		3    9
		dtype: int64

	  2.通过字典创建Series

		这时，字典中的键就是Series中的索引，字典中的值就是Series中的值

	    3.创建带有索引的Series：

			obj2 = Series([4, 7, -5, 3],index = ['d', 'b', 'a', 'c'])

	Series常用函数：

		obj.values  (没有括号，常识性用函数在后面加括号)

		obj.index

		分别是获得了其数组表现形式和索引对象

			如：array([-1,  5,  7,  9], dtype=int64)

			    Index(['d', 'b', 'a', 'c'], dtype='object')

                  obj['a'],obj2[['c', 'a', 'b']]:可通过索引方式选取,更改Series中的单个或一组值

		  numpy的数组运算都会保留索引和值之间的链接：

			obj2[obj2 > 0](返回>0的部分，有索引和值)

			obj2 * 2

		  判断是否存在某个索引：'b' in obj2   (返回布尔值)

                  Series()传入一个字典，一个索引数组，就会创建一个Series，左边是索引数组，右边是索引数组在字典对应                   值，如果没有对应值 返回NAN(not a number)

		  pandas的notnull 和 isnull 用于检测缺失数据：

			pd.isnull(obj4)  返回一个Series 左边索引值 右边布尔值

		  Series一个重要功能:在算术运算中会自动对齐不同索引的数据

			obj3+obj4  最终得到的Series 相同的索引值对应的数据相加，不同的任然存在，不进行运算

	 	  Series name属性：obj4.name = 'population'

				   obj4.index.name = 'state'

			state
			california        NaN
			ohio          35000.0
			oregon        16000.0
			texas         71000.0
			Name: population, dtype: float64

		    Series的索引可以通过赋值的方式就地修改：obj.index = ['Bob', 'Steve', 'Jeff', 'Ryan']