[Python - pandas-1] pandas lee el archivo csv

Usa pandas para leer archivos csv

Introducción a los parámetros básicos de read_csv ()

filepath_or_buffer: la ruta y el nombre del archivo csv, str type
sep: separator, default sep = ','
header: column name, default'infer ', cuando el csv leído tiene un nombre, no es necesario configurarlo, y si no hay nombre, configúrelo como encabezado = Ninguno
nombres: cuando cabecera = Ninguno, puede asignar valores a cada nombre de columna, nombres predeterminados = Ninguno
index_col: seleccione una columna como índice de la fila, predeterminado index_col = Ninguno
usecols: seleccione una columna fija, predeterminado usecols = Ninguno
skiprows: to El número de filas para omitir (int) o el índice de las filas para omitir (lista), el valor predeterminado de skiprows = Ninguno

nrows: el número máximo de filas, el valor predeterminado nrows = Ninguno
codificación: formato de codificación, cuando hay un mensaje confuso de que utf-8 tiene un error, es obligatorio Cambie el formato de codificación, como'ANSI ', etc., la codificación predeterminada =' utf-8 '

Ejemplo 1 Leer archivo csv y agregar título con Nombre

El caso de header = None es el siguiente,

data = pd.read_csv('学生月考成绩表.csv',sep=',',header=None,names= ['Name','Name1','Name2','Name3','Name4','Name5','Name6'])
data

Inserte la descripción de la imagen aquí
Cuando header = 0, se cambia el nombre del título original

data = pd.read_csv('学生月考成绩表.csv',sep=',',header=0,names= ['Name','Name1','Name2','Name3','Name4','Name5','Name6'])
data

Inserte la descripción de la imagen aquí

Ejemplo 2 Seleccione una determinada columna de datos como índice de la fila

data = pd.read_csv('学生月考成绩表.csv',sep=',',index_col = 'Name')
data

Inserte la descripción de la imagen aquí

data = pd.read_csv('学生月考成绩表.csv',sep=',',index_col = 'Name')
data.loc['zhangsan','Ranking']

Inserte la descripción de la imagen aquí

Ejemplo 3 Seleccionar filas y columnas fijas de datos

Seleccione la columna 3, fila 4

data = pd.read_csv('学生月考成绩表.csv',sep=',',usecols=['Math'])
data

Inserte la descripción de la imagen aquí

data = pd.read_csv('学生月考成绩表.csv',sep=',',usecols=['Math'],skiprows=[1,2,3,5])
data

Inserte la descripción de la imagen aquí

Ejemplo 4 Seleccione el número máximo de filas en un archivo csv

data = pd.read_csv('学生月考成绩表.csv',sep=',',nrows = 3) #提取前三行数据
data

Inserte la descripción de la imagen aquí

Ejemplo 5 Al leer un archivo csv, se cambia el formato de codificación

Ahora cambie la columna "Nombre" al formato de caracteres chinos, de la siguiente manera
Inserte la descripción de la imagen aquí

data = pd.read_csv('学生月考成绩表.csv')
data

Error de aviso: UnicodeDecodeError: el códec 'utf-8' no puede decodificar el byte 0xd5 en la posición 0: byte de continuación no válido
Inserte la descripción de la imagen aquí
Cambie el tipo de codificación, la pantalla es normal.

data = pd.read_csv('学生月考成绩表.csv',encoding='ANSI')
data

Inserte la descripción de la imagen aquí

referencia

【1】https://blog.csdn.net/qq_22290797/article/details/104706093

Supongo que te gusta

Origin blog.csdn.net/qq_22290797/article/details/104741567
Recomendado
Clasificación