Directorio de artículos
Prefacio
En el proceso de estudio del curso "Tecnología y aplicación de la ciencia de datos", debido a que los ejemplos del libro de texto se basaban en una versión de Python que era demasiado antigua, una pequeña cantidad de funciones proporcionadas en el libro de texto no se pudieron usar o se cambiaron sus nombres. en Python 3.6 y versiones posteriores., este artículo se basará en la versión Python 3.7, corrija estos "errores" (y después de solucionar todos los posibles "errores", se enviará un correo electrónico unificado al editor en jefe ), y al mismo tiempo, registraré mi proceso de aprendizaje aquí.Todos los comentarios realizados
Consejo: El siguiente es el texto de este artículo, los siguientes casos son como referencia.
1. Corrección de "errores"
1.Matplotlib informa un error al dibujar un histograma. AttributeError: el objeto 'Rectángulo' no tiene la propiedad 'normada'
Coordenadas: "Capítulo 4 Visualización de datos" - "4.2 Exploración visual de datos" - "4.2.1 Dibujar gráficos comunes" - "5. Histograma" (P73) - "Descripción de parámetros" - "normal"Cuando use Pandas para dibujar un histograma, de la siguiente manera:
values.hist(bins=100, alpha=0.3, color='k', normed=True)
Al ejecutar el código, aparece el siguiente mensaje de error:
AttributeError:'Rectangle' object has no property 'normed'
Causas y soluciones a los problemas.
Esto se debe a que este atributo ya no está definido en la nueva versión de la biblioteca pandas.
- Puede eliminar este atributo, es decir,
value.hist(bins=100, alpha=0.3, color='k') - También puedes usar el atributo de densidad, es decir,
value.hist(bins=100, alpha=0.3, color='k',density=True)
Nota: El atributo normado/ densidad se utiliza para establecer si se normaliza el histograma. El valor predeterminado es Falso.
- Cuando densidad = Falso, los valores de datos generan el mapa de densidad (es decir, los datos se distribuyen según la densidad de probabilidad) (consulte la Figura 1 a continuación);
- Cuando densidad = Verdadero, los valores de datos generan un histograma (consulte la Figura 2 a continuación)
2. cross_validation ya no se usa desde la versión 0.18 de scikit-learn
Coordenadas: "Capítulo 5 Aprendizaje automático" - "5.2.3 Evaluación del desempeño del análisis de regresión" - "Ejemplo 5-2"Cuando ingresamos el código, aparecerán los siguientes errores:
from sklearn import cross_validation
DeprecationWarning: This module was deprecated in version 0.18 in favor of the model_selection module into which all the refactored classes and functions are moved. Also note that the interface of the new CV iterators are different from that of this module. This module will be removed in 0.20.
from sklearn.cross_validation import *
ModuleNotFoundError: No module named 'sklearn.cross_validation'
Causas y soluciones a los problemas.
cross_validation ya no se usa desde la versión 0.18 de scikit-learn y se eliminará por completo en la versión 0.20.
Solo necesitamos cambiar cross_validation a model_selection.
2. Comentarios
Resumir
Consejo: aquí hay un resumen del artículo:
Por ejemplo: lo anterior es de lo que hablaremos hoy. Este artículo solo presenta brevemente el uso de pandas, y pandas proporciona una gran cantidad de funciones y métodos que nos permiten procesar datos rápidamente. y convenientemente.