[Descargo de responsabilidad] Si hay alguna infracción, informe el contenido de este blog. Se eliminará el uso no comercial. Si hay una infracción, infórmeme y lo eliminaré
Si la respuesta no es oportuna o no comprende, agrégueme WeChat island68 QQ823173334 Si puede, indíquelo en CSDN
Espero comunicarme contigo a través de la plataforma de CSDN
Mantener para uso propio
"Introducción a la ciencia de datos" a fines del otoño 19
1. La ecuación de regresión entre el producto (X, piezas) y el costo unitario (Y, yuan / pieza) de una mercancía es ^ Y = 100-1.2X, lo que significa ().
El costo unitario aumenta en 100 yuanes por cada unidad de producción adicional | El costo unitario disminuye en 1.2 yuanes por cada unidad de producción adicional | El costo unitario disminuye en un promedio de 1.2 yuanes por cada unidad de producción adicional
2. La relación entre variables generalmente se puede dividir en relación determinista y ().
Relación no determinista | relación lineal | relación de función | relación de correlación
3. Según la relación de mapeo diferente, se puede dividir en regresión lineal y ().
Regresión logarítmica | Regresión no lineal | Regresión logística | Regresión múltiple
4. El tipo de datos aplicable para la agrupación de K-means es ().
Datos numéricos | Datos de caracteres | Datos de voz | Todos los datos
5. La agrupación es un tipo de ().
Aprendizaje supervisado | Aprendizaje no supervisado | Aprendizaje de refuerzo | Aprendizaje semi-supervisado
6. En el modelo de regresión lineal univariante, los términos residuales siguen la distribución ().
Poisson | Normal | Lineal | No lineal
7. Cuando se utiliza el método de mínimos cuadrados para estimar los parámetros de regresión lineal múltiple, el objetivo es ().
Minimizar la varianza # Minimizar la desviación estándar | Minimizar la suma residual de cuadrados | Maximizar la entropía de la información
8. Por ejemplo, asigne el valor del atributo de ingreso salarial a [-1,1] o [0,1] perteneciente a la ()
transformación de función simple en la transformación de datos | normalización | construcción de atributos | dispersión de atributos continuos
9. Las dos tablas asociadas con la base de datos almacenan la información personal del usuario, pero cuando la información personal del usuario cambia, solo se actualizan los datos de una tabla. En este momento, hay datos inconsistentes en las dos tablas, que pertenecen a ()
Valores atípicos | Valores perdidos | Valores inconsistentes | Valores duplicados
10. El perceptrón monocapa está compuesto por () neuronas de capa.
Uno | dos | tres | cuatro
11. La agrupación de BFR se utiliza para agrupar datos en () Espacio euclidiano
Dimensión alta | Dimensión media | Dimensión baja | Dimensión media alta
12. El método más simple y básico de agrupamiento es ().
Agrupación de particiones | agrupación jerárquica | agrupación de densidad | agrupación de distancia
13. El atributo binario que solo es importante para valores distintos de cero se llama: (), donde los datos de la cesta de la compra pertenecen a este atributo.
Atributo de conteo | Atributo discreto | Atributo binario asimétrico # Atributo simétrico
14. Un perceptrón de una sola capa tiene () capas de neuronas funcionales.
Uno | dos | tres | cuatro
15. Al construir una nueva tasa de pérdida de línea indicadora, cuando excede el rango normal de la tasa de pérdida de línea, se puede juzgar que el usuario de esta línea puede tener un comportamiento anormal como robo de electricidad y fugas. Pertenece a () la
conversión de funciones simples en la transformación de datos Construcción | Atribución continua de atributos
16. En el análisis de regresión, la variable independiente es () y la variable dependiente es ().
Variables discretas, variables discretas | variables continuas, variables discretas | variables discretas, variables continuas | variables continuas, variables continuas
17. La confianza (confianza) es un índice para medir la medida de interés ().
Simplicidad | Determinismo | Practicidad | Novedad
18. La tarea principal de la inspección de calidad de datos es verificar si hay "datos sucios" en los datos originales. En resumen, los datos sucios no incluyen los siguientes ()
valores ordinarios | valores atípicos | valores inconsistentes | valores duplicados
19. Una red con desviaciones y al menos () capas ocultas de tipo S más una () capa de salida puede aproximarse a cualquier número racional.
1, lineal | 2, lineal | 1, no lineal | 2, no lineal
20. ¿Cuál de los siguientes no es una transformación de datos ()
transformación de función simple | normalización | fusión de atributos | discretización continua de atributos
21. La complejidad computacional del algoritmo Apriori se ve afectada por ().
Umbral de soporte | Número de artículos | Número de transacciones | Ancho promedio de transacciones
22. El método de agrupamiento jerárquico es ()
método de agregación | método de separación | método de combinación | método de comparación
23. El proceso de aprendizaje del perceptrón multicapa incluye ().
Propagación hacia adelante de la señal | Propagación hacia atrás de la señal | Propagación hacia adelante del error | Propagación hacia atrás del error
24. El método para seleccionar el valor K en la agrupación K-means es ().
Clasificación de densidad | método del codo | método del muslo | selección aleatoria
25. El siguiente ejemplo pertenece a la categoría de () para
detectar si hay una cara en la imagen | clasificar a los clientes de acuerdo con el tamaño del riesgo de préstamo | reconocer números escritos a mano | estimar el tráfico del centro comercial
26. Las métricas de evaluación de las reglas de asociación incluyen principalmente: ().
Soporte | Confianza | Precisión | Tasa de error
27. Los elementos básicos del método vecino k-más cercano incluyen ().
Medición de distancia | selección de valor k | tamaño de muestra | regla de decisión de clasificación
28. ¿En qué circunstancias no necesita dividirse el nodo? ()
Las muestras contenidas en el nodo actual pertenecen a la misma categoría | El conjunto de atributos actual está vacío, o todas las muestras tienen el mismo valor en todos los atributos | El conjunto de muestras contenido en el nodo actual está vacío | Hay subconjuntos que no se pueden clasificar básicamente correctamente
29. Las características básicas de la recopilación de registros del sistema son ()
alta disponibilidad | alta confiabilidad | escalabilidad | alta eficiencia
30. Las siguientes opciones son objetos de BFR: ()
conjuntos descartados | conjuntos temporales | conjuntos comprimidos | conjuntos retenidos
31. Para los perceptrones multicapa, la capa () tiene neuronas funcionales con funciones de activación.
Capa de entrada | Capa oculta | Capa de salida
32. El método de resolución de parámetros para la estimación de parámetros de regresión unaria es ().
Método de máxima verosimilitud | Método de estimación de distancia | Método de mínimos cuadrados | Método de distancia euclidiana
33. ¿Cuáles son las propiedades de la ciencia de datos ()
efectividad | disponibilidad | inesperado | comprensible
34. Los principales métodos de agrupamiento son ().
Agrupación de particiones | agrupación jerárquica | agrupación de densidad | agrupación de distancia
35. La clasificación de relevancia se puede dividir en () según la dirección correspondiente.
Correlación positiva | Correlación negativa | Correlación izquierda | Correlación derecha
36. Las tablas cruzadas pueden ayudar a las personas a descubrir las interacciones entre variables.
Bien | mal
37. El algoritmo de BP estándar es un algoritmo que actualiza los parámetros de manera uniforme después de leer todos los conjuntos de datos.
Bien | mal
38. Las reglas de asociación pueden ser ampliamente utilizadas en los campos de comunicaciones, finanzas, transporte, atención médica y análisis de comportamiento de los usuarios de la web.
Bien | mal
39. Cuando las características son discretas, la ganancia de información se puede utilizar como estadística de evaluación.
Bien | mal
40. Dado un conjunto de datos, si hay un hiperplano S que puede dividir correctamente parte de los puntos de instancia positivo y negativo del conjunto de datos a ambos lados del hiperplano, se dice que el conjunto de datos es un conjunto de datos separable linealmente.
Bien | mal
41. Las reglas de asociación que no satisfacen una medida de evaluación dada son aburridas.
Bien | mal
42. Cuanto más similares son los dos objetos, mayor es su disimilitud.
Bien | mal
43. El árbol de decisión también puede representar la distribución de probabilidad condicional de una clase bajo una condición de característica dada. Esta distribución de probabilidad se define en una partición del espacio de características. El espacio de características se divide en unidades disjuntas o regiones, y cada unidad se define. la distribución de probabilidad de una clase constituye una distribución de probabilidad condicional
del | equivocada
44. Cuanto mayor es la ganancia de información de una característica, menos importante es.
Bien | mal
45. La entropía de la información, menor será la pureza de la muestra se unen
a | equivocada
46. Si al menos un subconjunto de un conjunto de candidatos es infrecuente, dicho conjunto de candidatos definitivamente es infrecuente según el atributo antimonotónico de soporte.
Bien | mal
47. EDA puede maximizar la visión del analista sobre el conjunto de datos y la estructura subyacente del conjunto de datos, y proporcionar al analista todo tipo de información contenida en el conjunto de datos.
Bien | mal
48. A medida que aumenta la dimensión, el volumen del espacio de características aumenta rápidamente, haciendo que los datos disponibles sean densos.
Bien | mal
49. En los modelos de regresión lineal múltiple, los coeficientes de regresión parcial estandarizados no tienen unidades.
Bien | mal
50. Al clasificar el árbol de decisión, la instancia del nodo se divide a la fuerza en la categoría con una gran probabilidad condicional. Correcto
| incorrecto
51. La probabilidad previa de cada clase se puede estimar por la proporción de registros de entrenamiento que pertenecen a esa clase.
Bien | mal
52. El algoritmo K-Means es la agrupación de densidad.
Bien | mal
53. Las reglas de asociación se pueden generar por enumeración.
Bien | mal
54. La adquisición de datos proporciona material y base para el análisis de datos, que aquí solo incluye datos adquiridos directamente.
Bien | mal
55. La historia de la cerveza y los pañales es un ejemplo típico de análisis de conglomerados.
Bien | mal
56. La composición básica de un árbol de decisión consiste en nodos y aristas dirigidas ¿Cuáles son los dos tipos de nodos y cuáles son sus significados? ¿Y la idea básica del árbol de decisión?
57. ¿Qué tipo de problemas resuelven los perceptrones de una o varias capas?
58. ¿Qué es una red neuronal? ¿Cuáles son los componentes más básicos de las redes neuronales?