Comentarios y "errores" realizados en "Tecnología y aplicación de ciencia de datos" (Edición de ingeniería electrónica 2018) basado en Python3.7 (actualizado el 11.04.2021)


Prefacio

En el proceso de estudio del curso "Tecnología y aplicación de la ciencia de datos", debido a que los ejemplos del libro de texto se basaban en una versión de Python que era demasiado antigua, una pequeña cantidad de funciones proporcionadas en el libro de texto no se pudieron usar o se cambiaron sus nombres. en Python 3.6 y versiones posteriores., este artículo se basará en la versión Python 3.7, corrija estos "errores" (y después de solucionar todos los posibles "errores", se enviará un correo electrónico unificado al editor en jefe ), y al mismo tiempo, registraré mi proceso de aprendizaje aquí.Todos los comentarios realizados


Consejo: El siguiente es el texto de este artículo, los siguientes casos son como referencia.

1. Corrección de "errores"

1.Matplotlib informa un error al dibujar un histograma. AttributeError: el objeto 'Rectángulo' no tiene la propiedad 'normada'

Coordenadas: "Capítulo 4 Visualización de datos" - "4.2 Exploración visual de datos" - "4.2.1 Dibujar gráficos comunes" - "5. Histograma" (P73) - "Descripción de parámetros" - "normal"

Cuando use Pandas para dibujar un histograma, de la siguiente manera:

values.hist(bins=100, alpha=0.3, color='k', normed=True)

Al ejecutar el código, aparece el siguiente mensaje de error:

AttributeError:'Rectangle' object has no property 'normed'

Causas y soluciones a los problemas.

Esto se debe a que este atributo ya no está definido en la nueva versión de la biblioteca pandas.

  1. Puede eliminar este atributo, es decir,
    value.hist(bins=100, alpha=0.3, color='k')
  2. También puedes usar el atributo de densidad, es decir,
    value.hist(bins=100, alpha=0.3, color='k',density=True)

Nota: El atributo normado/ densidad se utiliza para establecer si se normaliza el histograma. El valor predeterminado es Falso.

  1. Cuando densidad = Falso, los valores de datos generan el mapa de densidad (es decir, los datos se distribuyen según la densidad de probabilidad) (consulte la Figura 1 a continuación);
  2. Cuando densidad = Verdadero, los valores de datos generan un histograma (consulte la Figura 2 a continuación)

Figura 1
Figura II

2. cross_validation ya no se usa desde la versión 0.18 de scikit-learn

Coordenadas: "Capítulo 5 Aprendizaje automático" - "5.2.3 Evaluación del desempeño del análisis de regresión" - "Ejemplo 5-2"

Cuando ingresamos el código, aparecerán los siguientes errores:

from sklearn import cross_validation

DeprecationWarning: This module was deprecated in version 0.18 in favor of the model_selection module into which all the refactored classes and functions are moved. Also note that the interface of the new CV iterators are different from that of this module. This module will be removed in 0.20.
from sklearn.cross_validation import *

ModuleNotFoundError: No module named 'sklearn.cross_validation'

Causas y soluciones a los problemas.

cross_validation ya no se usa desde la versión 0.18 de scikit-learn y se eliminará por completo en la versión 0.20.
Solo necesitamos cambiar cross_validation a model_selection.

2. Comentarios




Resumir

Consejo: aquí hay un resumen del artículo:
Por ejemplo: lo anterior es de lo que hablaremos hoy. Este artículo solo presenta brevemente el uso de pandas, y pandas proporciona una gran cantidad de funciones y métodos que nos permiten procesar datos rápidamente. y convenientemente.

Supongo que te gusta

Origin blog.csdn.net/A_No2Tang/article/details/115606484
Recomendado
Clasificación