Fuentes y tipos de datos

La mayor parte de los datos de la base de datos existente, y si no, entonces usted puede ir a una gran cantidad de ingenieros reptiles se reúnen para ofrecer. También se puede derivar de la grabación habitual, los datos de todas partes de todos modos, en su mayoría disponibles.

El tipo de datos

Podemos dividir los datos en datos de acuerdo con la clasificación de la máquina de aprendizaje:

  • Tipo nominal: tipo de la variable de destino resulta valor nominal de solamente centrado en objetivos limitados, tales como verdadero y falso (tipo variable objetivo nominal se utiliza principalmente para la clasificación)
  • Numérico: variable de objetivo puede ser valores numéricos a partir del conjunto infinito de valores, como 0.100,42.001 otro (principalmente para análisis de regresión variable objetivo numérico)

Distribución de datos per se

  • discreto
  • continuo

Entonces, ¿qué son los datos continuo, discreto y? En primer continua de datos es regular, datos discretos hay ley

  • Las variables discretas son variables discretas cuyos valores sólo puede ser comparado con el cálculo unidad natural o entero. Por ejemplo, tamaño de la clase, el número de objetivos, si se trata de una categoría, etc.

  • Se refiere a los datos continuos puede ser cualquier valor dentro de un intervalo especificado, por ejemplo, en los datos de taquilla, tamaño pétalo datos de distribución

La mayoría de las características del mundo real no es una variable continua, tales como la clasificación, texto, imágenes y otras características para hacer declaraciones de variables no continuas necesitan hacer enunciado matemático de estas características, y por lo tanto utiliza la extracción de características. Sklearn.feature_extraction proporciona una extracción de características de muchas maneras

variables de clasificación de extracción de características

Vamos a las ciudades y el medio ambiente como un diccionario de datos para extraer características.

sklearn.feature_extraction.DictVectorizer (escasa = True)

Numpy a la lista de mapa en una matriz o matriz scipy.sparse

  • Si la representación de matriz dispersa se convierte en scipy.sparse, activado por defecto

método

fit_transform (x, y)

Aplicación y Transformación lista mapa X, y es el tipo de destino

inverse_transform (X [, dict_t

Supongo que te gusta

Origin blog.csdn.net/qq_42370150/article/details/104966365
Recomendado
Clasificación