Python之Pandas（1）

import numpy as np
import pandas as pd
In [2]:

#Series：一维数组，与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近，其区别是：List中的元素可以是不同的数据类型，而Array和Series中则只允许存储相同的数据类型，这样可以更有效的使用内存，提高运算效率。
#Time- Series：以时间为索引的Series。
#DataFrame：二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器。以下的内容主要以DataFrame为主。
#Panel ：三维的数组，可以理解为DataFrame的容器。
In [9]:

#series 是带有标签的一维数组，可以保存任何的数据类型
#Series 就如同列表一样，一系列数据，每个数据对应一个索引值。
#Series 就是“竖起来”的 list：
rng = np.random.RandomState(1)
ar = rng.rand(5)
print(ar)
s = pd.Series(rng.rand(5))
print(s)

#index 查看series的索引，类型是RangeIndex
print(s.index)
#values 是series的值，类型是ndarray
print(s.values)
#series 相对于数组多了一个标签，类似字典,字典的key就是index，value就是数组
[4.17022005e-01 7.20324493e-01 1.14374817e-04 3.02332573e-01
 1.46755891e-01]
0    0.092339
1    0.186260
2    0.345561
3    0.396767
4    0.538817
dtype: float64
RangeIndex(start=0, stop=5, step=1)
[0.09233859 0.18626021 0.34556073 0.39676747 0.53881673]
In [15]:

rng = np.random.RandomState(1)
ar = rng.rand(5)
s = pd.Series(ar)
s.rename("Kobe")
a    99
b    66
c    77
dtype: int64
Out[15]:
0    0.417022
1    0.720324
2    0.000114
3    0.302333
4    0.146756
Name: Kobe, dtype: float64
In [19]:

#字典创建Series
s1 = pd.Series({"Jack":90,"Rose":80,"Tom":70},name = "homework")
print(s1)
Jack    90
Rose    80
Tom     70
Name: homework, dtype: int64
In [21]:

#index创建Series
#series的创建
s = pd.Series([99,66,77],index = ['a','b','c'],name = "homework")
print(s)
a    99
b    66
c    77
Name: homework, dtype: int64

import numpy as np
import pandas as pd
In [2]:

#Series：一维数组，与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近，其区别是：List中的元素可以是不同的数据类型，而Array和Series中则只允许存储相同的数据类型，这样可以更有效的使用内存，提高运算效率。
#Time- Series：以时间为索引的Series。
#DataFrame：二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器。以下的内容主要以DataFrame为主。
#Panel ：三维的数组，可以理解为DataFrame的容器。
In [9]:

#series 是带有标签的一维数组，可以保存任何的数据类型
#Series 就如同列表一样，一系列数据，每个数据对应一个索引值。
#Series 就是“竖起来”的 list：
rng = np.random.RandomState(1)
ar = rng.rand(5)
print(ar)
s = pd.Series(rng.rand(5))
print(s)

#index 查看series的索引，类型是RangeIndex
print(s.index)
#values 是series的值，类型是ndarray
print(s.values)
#series 相对于数组多了一个标签，类似字典,字典的key就是index，value就是数组
[4.17022005e-01 7.20324493e-01 1.14374817e-04 3.02332573e-01
 1.46755891e-01]
0    0.092339
1    0.186260
2    0.345561
3    0.396767
4    0.538817
dtype: float64
RangeIndex(start=0, stop=5, step=1)
[0.09233859 0.18626021 0.34556073 0.39676747 0.53881673]
In [15]:

rng = np.random.RandomState(1)
ar = rng.rand(5)
s = pd.Series(ar)
s.rename("Kobe")
a    99
b    66
c    77
dtype: int64
Out[15]:
0    0.417022
1    0.720324
2    0.000114
3    0.302333
4    0.146756
Name: Kobe, dtype: float64
In [19]:

#字典创建Series
s1 = pd.Series({"Jack":90,"Rose":80,"Tom":70},name = "homework")
print(s1)
Jack    90
Rose    80
Tom     70
Name: homework, dtype: int64
In [21]:

#index创建Series
#series的创建
s = pd.Series([99,66,77],index = ['a','b','c'],name = "homework")
print(s)
a    99
b    66
c    77
Name: homework, dtype: int64

猜你喜欢