4. Las operaciones de polimerización en los datos y filtro de detección de valores atípicos
4.1: DESCRIBIR
A. usando la función: DataFrame.describe (Self, percentiles = Ninguno, la incluyen = Ninguno, el EXCLUDE = Ninguno)
B. Análisis de parámetro:
C. combate:
. Un C1 ejemplo Oficial
. C2
barra de ejercicios E.
5. Ordenar
A. Uso de las funciones: DataFrame.take (self, índice, eje = 0, is_copy = True, ** kwargs) de nuevo a la posición axial de los elementos en un índice dado.
----- Take () función acepta una lista de índice, numérico
----- EG: df.take ([1,3,4,2,5])
----- medios pueden np.random función .permutation () ordenó al azar
B. parámetros analíticos:
C. combate:
. C1 oficial Enlaces
C2.
secuenciación aleatoria C3, el muestreo.
sección de práctica E.
5. Datos de la / polimerización GroupBy procesamiento de datos avanzada Grupo
A. Uso de las funciones: Series.groupby (auto, por = Ninguno , eje = 0, nivel = Ninguno, as_index = Verdadero, ordenar = True, group_keys = True, apretón = False, False observada, ** kwargs)
B. parámetros analíticos:
C. Ejemplos:
. un C1 ejemplo oficial
. C2
sección D.
agregación de datos es el paso final del procesamiento de datos, por lo general para hacer cada matriz para generar un solo valor.
proceso de clasificación de datos:
----- paquete: primeros datos se dividen en grupos
----- con el procesamiento de la función: Los datos para diferentes aplicaciones diferentes conjuntos de funciones a los datos convert
----- combinado: diferentes grupos para dar el el resultado de la fusión juntos
el núcleo del proceso de clasificación de datos:
función ----- GroupBy ()
----- grupos ver las propiedades de agrupación
sección de práctica E.
6. La agregación de datos avanzado
A. Uso de las funciones: DataFrame.groupby (auto, por = Ninguno , eje = 0, nivel = Ninguno, as_index = Verdadero, ordenar = True, group_keys = True, apretón = False, False observada, ** kwargs)
B. parámetros analíticos:
C. descripción:
uso después de GroupBy paquete de transformada pueden ser utilizados para proporcionar funciones personalizadas y aplicar lograr más de computación
---- df.groupby ( 'item') [ 'precio'] sum () y df. .groupby ( 'item') [ ' precio']. aplicar (suma) casi
---- aplicará transforman y calcula, en pasados a la función de aplicar la transformada o
---- aplican transformar y también puede pasar una expresión lambda
D. ejemplos reales:
. Dl Baidu con un conjunto de datos avanzadas agregación artículos relacionados, esto puso que sea fácil de ver
D2 de.
data.groupby ( 'item') [ 'precio.'] Aplicar (SUM).
de acuerdo a paquete elemento , tome la columna de precios, el precio de cada uno buscando SUMA
Aplicar
Transformar
** Transformar columna de concordancia índice de valor volverá automáticamente, no pesado; Aplicar devolver un valor en función de agrupación, de-duplicación.
Editor de envío: contenido de la compilación de datos de aprendizaje,
artículos para el blanco también pueden ser vistos por la industria de generación de más edad, con el fin de evitar el conocimiento equivocado, el artículo si hay un error, por favor cruces amigo señaló, el fin de aprender rápidamente corregido, consulte la sección de comentarios -