problema
Al usar el método read_csv de pandas, agregará automáticamente una columna de números de fila de forma predeterminada.
Manifestación
El contenido de test.csv es el siguiente:
姓名,年龄
小兔子昂,8
大兔子昂,13
El código test.py es el siguiente:
#引入pandas库,并改成pd方便使用,(打的字就少了)
import pandas as pd
dataframe = pd.read_csv("test.csv")
print(dataframe)
Los resultados son los siguientes:
姓名 年龄
0 小兔子昂 8
1 大兔子昂 13
Se puede encontrar que los pandas agregan automáticamente el número de fila cuando se agrega la primera columna.
resolver
Agregue dicho parámetro a read_csv,index_col=0
El código modificado es el siguiente:
#引入pandas库,并改成pd方便使用,(打的字就少了)
import pandas as pd
dataframe = pd.read_csv("test.csv",index_col=0)
print(dataframe)
resultado de la operación
年龄
姓名
小兔子昂 8
大兔子昂 13
Copiar
Puede ver que se ha eliminado el número de línea. Aunque el encabezado es incorrecto , la salida al archivo es normal.
otro
Si necesita abrirlo con Excel, debe guardar el archivo csv en formato de codificación ANSI ; de lo contrario, se distorsionará . Al mismo tiempo, se debe agregar un parámetro a read_csv encoding="gbk"
, para que Python pueda leerlo sin errores.
Si desea saber más sobre el parámetro index_col:
La diferencia entre pandas parámetro read_csv index_col = None, 0, False