Respuestas a los ejercicios extraescolares de preprocesamiento de datos y operaciones de agregación y agrupación de datos de Pandas

Respuestas a los ejercicios extraescolares de preprocesamiento de datos y operaciones de agregación y agrupación de datos de Pandas

Capítulo 4

inserte la descripción de la imagen aquí

inserte la descripción de la imagen aquí

Pregunta de respuesta corta
Pregunta de respuesta corta
1. En el proceso de preprocesamiento de datos, se seleccionará un método de procesamiento apropiado de acuerdo con la situación real de los datos. Las operaciones de preprocesamiento comúnmente utilizadas incluyen limpieza de datos, fusión de datos, remodelación de datos y conversión de datos. Estas operaciones también contienen diferentes métodos de procesamiento de datos, como la detección de valores nulos y faltantes, el procesamiento de valores repetidos y el procesamiento de valores atípicos en el proceso de limpieza de datos.
2. Las operaciones de fusión de datos comúnmente utilizadas en Pandas son: la función concat () significa apilar múltiples objetos a lo largo de un eje, la función merge () significa fusionar diferentes objetos de acuerdo con una o más claves y el método join (). significa fusionar datos de acuerdo con el índice o la columna especificada, y el método combine_first() significa completar los datos fusionados.
Pregunta del programa
1. Respuesta:
importar pandas como pd

importar numpy como np

grupo_a = pd.DataFrame({'A': [2,3,5,2,3],

                         'B': ['5',np.nan,'2','3','6'],

                         'C': [8,7,50,8,2],

                       'key': [3,4,5,2,5]})

grupo_b = pd.DataFrame({'A': [3,3,3],

                    'B': [4,4,4],

                    'C': [5,5,5]})

imprimir(grupo_a)

imprimir(grupo_b)

2.答案:
grupo_a = grupo_a.combinar_primero(grupo_b)

Grupo A

3.答案:
group_a.rename(columnas={'clave':'D'})

Capítulo 5

inserte la descripción de la imagen aquí

inserte la descripción de la imagen aquí
Pregunta de respuesta corta
1. El proceso de agregación de grupos generalmente se divide, aplica y fusiona. Dividir es dividir el conjunto de datos en varios grupos de acuerdo con ciertas reglas; la aplicación es el proceso de realizar una serie de operaciones en los datos agrupados; fusionar es integrar los resultados de estas operaciones.

2. Existen principalmente cuatro métodos de agrupación de uso común, a saber: lista o matriz, la longitud de la lista o matriz debe ser coherente con la longitud del eje de agrupación, el nombre de una columna en el DataFrame, diccionario o objeto Serie, y función.

Pregunta del programa
1. Respuesta:
importar pandas como pd

studnets_data = pd.DataFrame({'Grado':['Estudiante de primer año','Estudiante de segundo año','Junior',

                                        '大四','大二','大三',

                                         '大一','大三','大四'],

                               '姓名':['李宏卓','李思真','张振海',

                                       '赵鸿飞','白蓉','马腾飞',

                                       '张晓凡','金紫萱','金烨'],

                               '年龄':[18,19,20,21,

                                        19,20,18,20,21],

                               '身高':[175,165,178,175,

                                       160,180,167,170,185],

                               '体重':[65,60,70,76,55,

                                       70,52,53,73]})

datos = studnets_data.groupby('calificación')

Estudiante de primer año = dict([x para x en datos])['大一']

imprimir (estudiante de primer año)

2. Respuesta:
datos = datos.aplicar(max)

del datos['grado']

imprimir (datos)

3. Respuesta:
Junior = dict([x para x en datos])['junior']

print(estudiante de primer año['peso'].aplicar('media'))

print(Junior['peso'].aplicar('media'))

continuará

Supongo que te gusta

Origin blog.csdn.net/qq_68890680/article/details/130177345
Recomendado
Clasificación