Pandas基础总结之创建Series和DataFrame

这是一篇最基础的Pandas用法总结，也方便自己日后进行复习与查询。

1. 创建Series的三种方法

1.1 基于Python中的列表创建

myList = ['a', 'b', 'c', 'd']     # 创建一个列表
s1 = pd.Series(data = myList)
print(s1)
--------------------------------
输出：
0    a
1    b
2    c
3    d
dtype: object

注意：

创建时data参数名可以省略
输出中左边的那一列叫做索引，默认为从0开始的递增整数。
索引是用来做什么的呢，就像字典中的key一样，可以根据key直接查找到它所对应的值。
例如：

print(s1[1])
[out]:
'b'

1.2 基于numpy中的数组创建

myArray = np.array([5, 15, 25, 35])    # 创建一个numpy一维数组
print(myArray)
'''
[out]: 
array([ 5, 15, 25, 35])
'''

s2 = pd.Series(data = myArray)
print(s2)
--------------------------------
[out]：
0     5
1    15
2    25
3    35
dtype: int32

1.3 基于Python中的字典创建

myDict = {'小明':89, '小红':75, '小兰':97}
s3 = pd.Series(data = myDict)
print(s3)
--------------------------------
[out]：
小明    89
小红    75
小兰    97
dtype: int64

注意：
在该种方法中，字典的key为该Series的索引

2. 创建DataFrame的四种方法

创建DataFrame的前三种方法与上述创建Series的方法类似，只不过把数据从一维扩展到了二维。

2.1 基于Python中的列表创建

myList2 = [['a', 'b', 'c'], [10, 20, 30], [1.1, 2.2, 3.3]]    # 这是一个嵌套列表
df1 = pd.DataFrame(data = myList2)
print(df1)
--------------------------------
[out]:
     0    1    2
0    a    b    c
1   10   20   30
2  1.1  2.2  3.3

注意:

在DataFrame中有两种索引，一种叫行索引，即为最左侧的那一列，默认从0递增的整数。通过它能定位到某一行的所有数据。
另一种叫列索引，即为最上方的那一行，默认从0自增的整数。通过它能定位到某一列的所有数据。（DataFrame中数据的定位方法比较多样，且比Series复杂，我们放到以后的文章中专门讲解，这里只有个基本概念就好）
嵌套列表中，大列表下的每一个小列表，在创建的DataFrame中为一横行。

2.2 基于numpy中的数组创建

myArray2 = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])     # 创建了一个二维数组
print(myArray2)
'''
[out]:
array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])
'''

df2 = pd.DataFrame(data = myArray2)
print(df2)
--------------------------------
[out]:
   0  1  2
0  1  2  3
1  4  5  6
2  7  8  9

2.3 基于Python中的字典创建

myDict2 = {'id':[1,2,3],'name':['Alice','Bob','Cindy'],'math':[90,89,99]}
df3 = pd.DataFrame(data = myDict2)
print(df3)
--------------------------------
[out]:
   id   name  math
0   1  Alice    90
1   2    Bob    89
2   3  Cindy    99

注意：

在刚才创建Series时，字典的每一个key对应一个value，而创建DataFrame时，字典的每一个key都对应一个列表
字典的key成为了该DataFrame中的列索引

2.4 基于Series创建

把我们在第一部分创建的s1和s2拿来，创建一个字典

myDict3 = {'one': s1, 'two': s2}
df4 = pd.DataFrame(data = myDict3)
print(df4)
--------------------------------
[out]:
  one  two
0   a    5
1   b   15
2   c   25
3   d   35

Fantine_Deng

发布了1 篇原创文章 · 获赞 4 · 访问量 314

私信关注

Pandas基础总结之创建Series和DataFrame

1. 创建Series的三种方法

1.1 基于Python中的列表创建

1.2 基于numpy中的数组创建

1.3 基于Python中的字典创建

2. 创建DataFrame的四种方法

2.1 基于Python中的列表创建

2.2 基于numpy中的数组创建

2.3 基于Python中的字典创建

2.4 基于Series创建

猜你喜欢