Introdução à análise de dados Python (5): operações de alinhamento do Pandas

É um processo importante de limpeza de dados. Ele pode ser calculado de acordo com o alinhamento do índice. Se a posição não estiver alinhada, NaN pode ser preenchido, e NaN também pode ser preenchido no final

Rastreador Python, análise de dados, desenvolvimento de sites e outros vídeos tutoriais de casos são gratuitos para assistir online

https://space.bilibili.com/523606542 

Grupo de intercâmbio de aprendizagem Python: 1039645993

Operação de alinhamento em série

1. Série alinhada por linha e índice

Código de amostra:

s1 = pd.Series(range(10, 20), index = range(10))
s2 = pd.Series(range(20, 25), index = range(5))

print('s1: ' )
print(s1)

print('') 

print('s2: ')
print(s2)

resultado da operação:

s1: 
0    10
1    11
2    12
3    13
4    14
5    15
6    16
7    17
8    18
9    19
dtype: int64

s2: 
0    20
1    21
2    22
3    23
4    24
dtype: int64

2. Operação de alinhamento em série

Código de amostra:

# Series 对齐运算
s1 + s2

resultado da operação:

0    30.0
1    32.0
2    34.0
3    36.0
4    38.0
5     NaN
6     NaN
7     NaN
8     NaN
9     NaN
dtype: float64

Operação de alinhamento DataFrame

1. DataFrame alinhado por índice de linha e coluna

Código de amostra:

df1 = pd.DataFrame(np.ones((2,2)), columns = ['a', 'b'])
df2 = pd.DataFrame(np.ones((3,3)), columns = ['a', 'b', 'c'])

print('df1: ')
print(df1)

print('') 
print('df2: ')
print(df2)

resultado da operação:

df1: 
     a    b
0  1.0  1.0
1  1.0  1.0

df2: 
     a    b    c
0  1.0  1.0  1.0
1  1.0  1.0  1.0
2  1.0  1.0  1.0

2. Operação de alinhamento do DataFrame

Código de amostra:

# DataFrame对齐操作
df1 + df2

resultado da operação:

     a    b   c
0  2.0  2.0 NaN
1  2.0  2.0 NaN
2  NaN  NaN NaN

Preencha dados desalinhados para realizar operações

1. fill_value

Ao usar add, sub, div e mul, especifique o valor de preenchimento por meio de fill_value, e os dados desalinhados serão calculados com o valor de preenchimento

Código de amostra:

print(s1)
print(s2)
s1.add(s2, fill_value = -1)

print(df1)
print(df2)
df1.sub(df2, fill_value = 2.)

resultado da operação:

# print(s1)
0    10
1    11
2    12
3    13
4    14
5    15
6    16
7    17
8    18
9    19
dtype: int64

# print(s2)
0    20
1    21
2    22
3    23
4    24
dtype: int64

# s1.add(s2, fill_value = -1)
0    30.0
1    32.0
2    34.0
3    36.0
4    38.0
5    14.0
6    15.0
7    16.0
8    17.0
9    18.0
dtype: float64


# print(df1)
     a    b
0  1.0  1.0
1  1.0  1.0

# print(df2)
     a    b    c
0  1.0  1.0  1.0
1  1.0  1.0  1.0
2  1.0  1.0  1.0


# df1.sub(df2, fill_value = 2.)
     a    b    c
0  0.0  0.0  1.0
1  0.0  0.0  1.0
2  1.0  1.0  1.0

Tabela de métodos aritméticos:

Análise de dados Python Operação de alinhamento do Pandas

Acho que você gosta

Origin blog.csdn.net/m0_48405781/article/details/115264766
Recomendado
Clasificación