Resumen de varios problemas con la importación de archivos CSV

Lea directamente con python (no recomendado), varias transcodificación y caracteres ilegibles, si desea dibujar una imagen, aún necesita colocarla en un DataFrame o matriz, ¿por qué molestarse? En el uso de herramientas, todavía insistimos en [no pida primero una comprensión profunda y fácil de usar], [no cargue la máquina si la gente puede evitarlo]! El siguiente es el registro de los problemas que genera el head iron con python:

①UnicodeDecodeError: el códec 'utf-8' no puede decodificar el byte 0xc8 en la posición 0: byte de continuación no válido, error de decodificación Unicode: el códec "utf-8" no puede decodificar el byte 0xc8 en la posición 0: byte de continuación no válido.

STR se almacena y transmite en bytes, y todos los bytes se leen del disco. Ahora no se puede convertir en str, y Python informará un error.

Solución ①: encoding='unicode_escape' realiza una conversión inversa del texto almacenado codificado al leerlo y obtiene directamente los datos del texto original.

Solución ②: codificación = 'GB18030', GB18030 es la última codificación china que incluye caracteres minoritarios. GB18030 es compatible con GBK y GB2312. Se recomienda usar GB18030 directamente para información china.

②ValueError: nombre ya utilizado como nombre o título. El nombre ya se ha utilizado. Si hay un nombre duplicado en el encabezado de la tabla, Python informará un error.

He aquí cómo hacerlo cuidadosamente:

Si abre+pd.read_csv(), por supuesto que no hay caracteres chinos u otros caracteres similares en su tabla, así que no la abra, así que no es imposible. ¡Se recomienda hacer una tabla con números en inglés!

f = open(str) # str es el nombre de la ruta del archivo, recuerde incluir comillas

pd.read_csv(f) # Genera un tipo de datos DataFrame y puedes hacer lo que quieras

 

Supongo que te gusta

Origin blog.csdn.net/lizhyangmm/article/details/128013649
Recomendado
Clasificación