procesamiento de datos pitón (VI) de la limpieza de datos: la estandarización y con guión

1. La normalización de datos y la normalización de

. Una normalización: el conjunto de datos se calcula, de manera que los datos están en un rango específico \

. B Normalización:

c. Eliminar los valores atípicos

2. El almacenamiento de datos

a. Guardar la base de datos SQLite

b. Exportar a un archivo csv sencilla

3. Encontrar el método de limpieza de datos es adecuado para proyectos

Escribir el guión (para determinar la estructura del código, para su uso posterior, el aprendizaje y el intercambio) si el código que puede ayudar a ahorrar tiempo y mejorar la eficiencia

4. Limpieza de Datos guión

4.1 Zen especificación de código Python que ver, para hacer el código más claro

4.2 hacer el código más reutilizable genérico

4.3 documentar el código

La lista principal tarea que hay que hacer

scripting

escritura de optimización

Añadir algunas cadenas y documentos como una función en línea comentarios

La prueba con nuevos datos

En busca de scripts de prueba de datos similares

Módulo incorporado prueba unittest / nariz / biblioteca PYtest

 

Supongo que te gusta

Origin www.cnblogs.com/qiu-hua/p/12622818.html
Recomendado
Clasificación