1. La normalización de datos y la normalización de
. Una normalización: el conjunto de datos se calcula, de manera que los datos están en un rango específico \
. B Normalización:
c. Eliminar los valores atípicos
2. El almacenamiento de datos
a. Guardar la base de datos SQLite
b. Exportar a un archivo csv sencilla
3. Encontrar el método de limpieza de datos es adecuado para proyectos
Escribir el guión (para determinar la estructura del código, para su uso posterior, el aprendizaje y el intercambio) si el código que puede ayudar a ahorrar tiempo y mejorar la eficiencia
4. Limpieza de Datos guión
4.1 Zen especificación de código Python que ver, para hacer el código más claro
4.2 hacer el código más reutilizable genérico
4.3 documentar el código
La lista principal tarea que hay que hacer
scripting
escritura de optimización
Añadir algunas cadenas y documentos como una función en línea comentarios
La prueba con nuevos datos
En busca de scripts de prueba de datos similares
Módulo incorporado prueba unittest / nariz / biblioteca PYtest