Python-pandas--set_index与reset_index

set_index()

  • 函数原型:DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)
  • 参数解释:
    keys:列标签或列标签/数组列表,需要设置为索引的列
    drop:默认为True,删除用作新索引的列
    append:默认为False,是否将列附加到现有索引
    inplace:默认为False,适当修改DataFrame(不要创建新对象)
    verify_integrity:默认为false,检查新索引的副本。否则,请将检查推迟到必要时进行。将其设置为false将提高该方法的性能。

入门级api

#!/usr/bin/python3
# -*- coding: utf-8 -*-
# @Time    : 2019-06-06 13:09
# @Author  : LiYahui
# @Description :  set_index demo
import pandas as pd

data = {'A': ['A0', 'A1', 'A2', 'A3', 'A4', 'A5', 'A6', 'A7', 'A8', 'A9', 'A10', 'A11'],
        'B': ['B0', 'B1', 'B2', 'B3', 'B4', 'B5', 'B6', 'B7', 'B8', 'B9', 'B10', 'B11'],
        'C': ['C0', 'C1', 'C2', 'C3', 'C4', 'C5', 'C6', 'C7', 'C8', 'C9', 'C10', 'C11'],
        'D': ['D0', 'D1', 'D2', 'D3', 'D4', 'D5', 'D6', 'D7', 'D8', 'D9', 'D10', 'D11']}
df = pd.DataFrame(data)
# print(df)
'''
      A    B    C    D
0    A0   B0   C0   D0
1    A1   B1   C1   D1
2    A2   B2   C2   D2
3    A3   B3   C3   D3
4    A4   B4   C4   D4
5    A5   B5   C5   D5
6    A6   B6   C6   D6
7    A7   B7   C7   D7
8    A8   B8   C8   D8
9    A9   B9   C9   D9
10  A10  B10  C10  D10
11  A11  B11  C11  D11
'''
# drop=True
df1 = df.set_index("A", drop=True, append=False, inplace=False, verify_integrity=False)
# print(df1)
'''
       B    C    D
A                 
A0    B0   C0   D0
A1    B1   C1   D1
A2    B2   C2   D2
A3    B3   C3   D3
A4    B4   C4   D4
A5    B5   C5   D5
A6    B6   C6   D6
A7    B7   C7   D7
A8    B8   C8   D8
A9    B9   C9   D9
A10  B10  C10  D10
A11  B11  C11  D11
'''
# drop=False
df2 = df.set_index("A", drop=False, append=False, inplace=False, verify_integrity=False)
# print(df2)
'''
       A    B    C    D
A                      
A0    A0   B0   C0   D0
A1    A1   B1   C1   D1
A2    A2   B2   C2   D2
A3    A3   B3   C3   D3
A4    A4   B4   C4   D4
A5    A5   B5   C5   D5
A6    A6   B6   C6   D6
A7    A7   B7   C7   D7
A8    A8   B8   C8   D8
A9    A9   B9   C9   D9
A10  A10  B10  C10  D10
A11  A11  B11  C11  D11
'''
# append=True
df3 = df.set_index("A", drop=False, append=True, inplace=False, verify_integrity=False)
# print(df3)
'''
          A    B    C    D
   A                      
0  A0    A0   B0   C0   D0
1  A1    A1   B1   C1   D1
2  A2    A2   B2   C2   D2
3  A3    A3   B3   C3   D3
4  A4    A4   B4   C4   D4
5  A5    A5   B5   C5   D5
6  A6    A6   B6   C6   D6
7  A7    A7   B7   C7   D7
8  A8    A8   B8   C8   D8
9  A9    A9   B9   C9   D9
10 A10  A10  B10  C10  D10
11 A11  A11  B11  C11  D11
'''

# inplance=True
df4 = df.set_index("A", drop=False, append=True, inplace=True, verify_integrity=False)
print(df4)
# 不知道为什么
'''
None
'''

reset_index()

  • 函数原型:DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill='')
  • 参数解释:
    level:int、str、tuple或list,默认无,仅从索引中删除给定级别。默认情况下移除所有级别。控制了具体要还原的那个等级的索引
    drop:drop为False则索引列会被还原为普通列,否则会丢失
    inplace:默认为false,适当修改DataFrame(不要创建新对象)
    col_level:int或str,默认值为0,如果列有多个级别,则确定将标签插入到哪个级别。默认情况下,它将插入到第一级。
    col_fill:对象,默认‘’,如果列有多个级别,则确定其他级别的命名方式。如果没有,则重复索引名
  • 注:reset_index还原分为两种类型,第一种是对原DataFrame进行reset,第二种是对使用过set_index()函数的DataFrame进行reset
#!/usr/bin/python3
# -*- coding: utf-8 -*-
# @Time    : 2019-06-06 13:21
# @Author  : LiYahui
# @Description : reset_index demo
import pandas as pd

data = {'A': ['A0', 'A1', 'A2', 'A3', 'A4', 'A5', 'A6', 'A7', 'A8', 'A9', 'A10', 'A11'],
        'B': ['B0', 'B1', 'B2', 'B3', 'B4', 'B5', 'B6', 'B7', 'B8', 'B9', 'B10', 'B11'],
        'C': ['C0', 'C1', 'C2', 'C3', 'C4', 'C5', 'C6', 'C7', 'C8', 'C9', 'C10', 'C11'],
        'D': ['D0', 'D1', 'D2', 'D3', 'D4', 'D5', 'D6', 'D7', 'D8', 'D9', 'D10', 'D11']}
df = pd.DataFrame(data)
# print(df)
'''
      A    B    C    D
0    A0   B0   C0   D0
1    A1   B1   C1   D1
2    A2   B2   C2   D2
3    A3   B3   C3   D3
4    A4   B4   C4   D4
5    A5   B5   C5   D5
6    A6   B6   C6   D6
7    A7   B7   C7   D7
8    A8   B8   C8   D8
9    A9   B9   C9   D9
10  A10  B10  C10  D10
11  A11  B11  C11  D11
'''
# drop=True
df1 = df.set_index("A", drop=True, append=False, inplace=False, verify_integrity=False)
# print(df1)
'''
       B    C    D
A                 
A0    B0   C0   D0
A1    B1   C1   D1
A2    B2   C2   D2
A3    B3   C3   D3
A4    B4   C4   D4
A5    B5   C5   D5
A6    B6   C6   D6
A7    B7   C7   D7
A8    B8   C8   D8
A9    B9   C9   D9
A10  B10  C10  D10
A11  B11  C11  D11
'''
# drop=False
df2 = df1.reset_index(drop=False)
# print(df2)
'''
      A    B    C    D
0    A0   B0   C0   D0
1    A1   B1   C1   D1
2    A2   B2   C2   D2
3    A3   B3   C3   D3
4    A4   B4   C4   D4
5    A5   B5   C5   D5
6    A6   B6   C6   D6
7    A7   B7   C7   D7
8    A8   B8   C8   D8
9    A9   B9   C9   D9
10  A10  B10  C10  D10
11  A11  B11  C11  D11
'''
# drop=True
df3=df1.reset_index(drop=True)
# print(df3)
'''
      B    C    D
0    B0   C0   D0
1    B1   C1   D1
2    B2   C2   D2
3    B3   C3   D3
4    B4   C4   D4
5    B5   C5   D5
6    B6   C6   D6
7    B7   C7   D7
8    B8   C8   D8
9    B9   C9   D9
10  B10  C10  D10
11  B11  C11  D11
'''
df4=df.reset_index(drop=False)
# print(df4)
'''
    index    A    B    C    D
0       0   A0   B0   C0   D0
1       1   A1   B1   C1   D1
2       2   A2   B2   C2   D2
3       3   A3   B3   C3   D3
4       4   A4   B4   C4   D4
5       5   A5   B5   C5   D5
6       6   A6   B6   C6   D6
7       7   A7   B7   C7   D7
8       8   A8   B8   C8   D8
9       9   A9   B9   C9   D9
10     10  A10  B10  C10  D10
11     11  A11  B11  C11  D11
'''
df5=df.reset_index(drop=True)
print(df5)
'''
      A    B    C    D
0    A0   B0   C0   D0
1    A1   B1   C1   D1
2    A2   B2   C2   D2
3    A3   B3   C3   D3
4    A4   B4   C4   D4
5    A5   B5   C5   D5
6    A6   B6   C6   D6
7    A7   B7   C7   D7
8    A8   B8   C8   D8
9    A9   B9   C9   D9
10  A10  B10  C10  D10
11  A11  B11  C11  D11
'''

添加多个字段的index

demo级别的代码

#!/usr/bin/python3
# -*- coding: utf-8 -*-
# @Time    : 2019-06-06 13:28
# @Author  : LiYahui
# @Description : reset_index_demo2
import pandas as pd

data = {'a': ['bar', 'bar', 'foo', 'foo'],
        'b': ['one', 'two', 'one', 'two'],
        'c': ['z', 'x', 'y', 'w'],
        'd': [1.0, 2.0, 3.0, 4.0]}
df = pd.DataFrame(data)
# print(df)
'''
     a    b  c    d
0  bar  one  z  1.0
1  bar  two  x  2.0
2  foo  one  y  3.0
3  foo  two  w  4.0
'''
df1 = df.set_index(['a', 'b'])
# print(df1)
'''
         c    d
a   b          
bar one  z  1.0
    two  x  2.0
foo one  y  3.0
    two  w  4.0
'''
df2 = df1.reset_index()
# print(df2)
'''
     a    b  c    d
0  bar  one  z  1.0
1  bar  two  x  2.0
2  foo  one  y  3.0
3  foo  two  w  4.0
'''
df3 = df1.reset_index(['a', 'b'])
print(df3)
'''
     a    b  c    d
0  bar  one  z  1.0
1  bar  two  x  2.0
2  foo  one  y  3.0
3  foo  two  w  4.0
'''
df4 = df1.reset_index('a')
# print(df4)
'''
       a  c    d
b               
one  bar  z  1.0
two  bar  x  2.0
one  foo  y  3.0
two  foo  w  4.0
'''
df5=df1.reset_index('b')
print(df5)
'''
       b  c    d
a               
bar  one  z  1.0
bar  two  x  2.0
foo  one  y  3.0
foo  two  w  4.0
'''

转载于:https://www.jianshu.com/p/abf38d68829c

猜你喜欢

转载自blog.csdn.net/weixin_34033624/article/details/91149206
今日推荐