[Aiqi producido] - [Computadora Nankai] "Introducción a la ciencia de datos" al final de la evaluación de otoño de otoño de 19, materiales de referencia

[Descargo de responsabilidad] Si hay alguna infracción, informe el contenido de este blog. Se eliminará el uso no comercial. Si hay una infracción, infórmeme y lo eliminaré

Si la respuesta no es oportuna o no comprende,   agrégueme WeChat island68 QQ823173334 Si  puede, indíquelo en CSDN    

Espero comunicarme contigo a través de la plataforma de CSDN

Mantener para uso propio

"Introducción a la ciencia de datos" a fines del otoño 19

1. La ecuación de regresión entre el producto (X, piezas) y el costo unitario (Y, yuan / pieza) de una mercancía es ^ Y = 100-1.2X, lo que significa ().
El costo unitario aumenta en 100 yuanes por cada unidad de producción adicional | El costo unitario disminuye en 1.2 yuanes por cada unidad de producción adicional | El costo unitario disminuye en un promedio de 1.2 yuanes por cada unidad de producción adicional

2. La relación entre variables generalmente se puede dividir en relación determinista y ().
Relación no determinista | relación lineal | relación de función | relación de correlación

3. Según la relación de mapeo diferente, se puede dividir en regresión lineal y ().
Regresión logarítmica | Regresión no lineal | Regresión logística | Regresión múltiple

4. El tipo de datos aplicable para la agrupación de K-means es ().
Datos numéricos | Datos de caracteres | Datos de voz | Todos los datos

5. La agrupación es un tipo de ().
Aprendizaje supervisado | Aprendizaje no supervisado | Aprendizaje de refuerzo | Aprendizaje semi-supervisado

6. En el modelo de regresión lineal univariante, los términos residuales siguen la distribución ().
Poisson | Normal | Lineal | No lineal

7. Cuando se utiliza el método de mínimos cuadrados para estimar los parámetros de regresión lineal múltiple, el objetivo es ().
Minimizar la varianza # Minimizar la desviación estándar | Minimizar la suma residual de cuadrados | Maximizar la entropía de la información

8. Por ejemplo, asigne el valor del atributo de ingreso salarial a [-1,1] o [0,1] perteneciente a la ()
transformación de función simple en la transformación de datos | normalización | construcción de atributos | dispersión de atributos continuos

9. Las dos tablas asociadas con la base de datos almacenan la información personal del usuario, pero cuando la información personal del usuario cambia, solo se actualizan los datos de una tabla. En este momento, hay datos inconsistentes en las dos tablas, que pertenecen a ()
Valores atípicos | Valores perdidos | Valores inconsistentes | Valores duplicados

10. El perceptrón monocapa está compuesto por () neuronas de capa.
Uno | dos | tres | cuatro

11. La agrupación de BFR se utiliza para agrupar datos en () Espacio euclidiano
Dimensión alta | Dimensión media | Dimensión baja | Dimensión media alta

12. El método más simple y básico de agrupamiento es ().
Agrupación de particiones | agrupación jerárquica | agrupación de densidad | agrupación de distancia

13. El atributo binario que solo es importante para valores distintos de cero se llama: (), donde los datos de la cesta de la compra pertenecen a este atributo.
Atributo de conteo | Atributo discreto | Atributo binario asimétrico # Atributo simétrico

14. Un perceptrón de una sola capa tiene () capas de neuronas funcionales.
Uno | dos | tres | cuatro

15. Al construir una nueva tasa de pérdida de línea indicadora, cuando excede el rango normal de la tasa de pérdida de línea, se puede juzgar que el usuario de esta línea puede tener un comportamiento anormal como robo de electricidad y fugas. Pertenece a () la
conversión de funciones simples en la transformación de datos Construcción | Atribución continua de atributos

16. En el análisis de regresión, la variable independiente es () y la variable dependiente es ().
Variables discretas, variables discretas | variables continuas, variables discretas | variables discretas, variables continuas | variables continuas, variables continuas

17. La confianza (confianza) es un índice para medir la medida de interés ().
Simplicidad | Determinismo | Practicidad | Novedad

18. La tarea principal de la inspección de calidad de datos es verificar si hay "datos sucios" en los datos originales. En resumen, los datos sucios no incluyen los siguientes ()
valores ordinarios | valores atípicos | valores inconsistentes | valores duplicados

19. Una red con desviaciones y al menos () capas ocultas de tipo S más una () capa de salida puede aproximarse a cualquier número racional.
1, lineal | 2, lineal | 1, no lineal | 2, no lineal

20. ¿Cuál de los siguientes no es una transformación de datos ()
transformación de función simple | normalización | fusión de atributos | discretización continua de atributos

21. La complejidad computacional del algoritmo Apriori se ve afectada por ().
Umbral de soporte | Número de artículos | Número de transacciones | Ancho promedio de transacciones

22. El método de agrupamiento jerárquico es ()
método de agregación | método de separación | método de combinación | método de comparación

23. El proceso de aprendizaje del perceptrón multicapa incluye ().
Propagación hacia adelante de la señal | Propagación hacia atrás de la señal | Propagación hacia adelante del error | Propagación hacia atrás del error

24. El método para seleccionar el valor K en la agrupación K-means es ().
Clasificación de densidad | método del codo | método del muslo | selección aleatoria

25. El siguiente ejemplo pertenece a la categoría de () para
detectar si hay una cara en la imagen | clasificar a los clientes de acuerdo con el tamaño del riesgo de préstamo | reconocer números escritos a mano | estimar el tráfico del centro comercial

26. Las métricas de evaluación de las reglas de asociación incluyen principalmente: ().
Soporte | Confianza | Precisión | Tasa de error

27. Los elementos básicos del método vecino k-más cercano incluyen ().
Medición de distancia | selección de valor k | tamaño de muestra | regla de decisión de clasificación

28. ¿En qué circunstancias no necesita dividirse el nodo? ()
Las muestras contenidas en el nodo actual pertenecen a la misma categoría | El conjunto de atributos actual está vacío, o todas las muestras tienen el mismo valor en todos los atributos | El conjunto de muestras contenido en el nodo actual está vacío | Hay subconjuntos que no se pueden clasificar básicamente correctamente

29. Las características básicas de la recopilación de registros del sistema son ()
alta disponibilidad | alta confiabilidad | escalabilidad | alta eficiencia

30. Las siguientes opciones son objetos de BFR: ()
conjuntos descartados | conjuntos temporales | conjuntos comprimidos | conjuntos retenidos

31. Para los perceptrones multicapa, la capa () tiene neuronas funcionales con funciones de activación.
Capa de entrada | Capa oculta | Capa de salida

32. El método de resolución de parámetros para la estimación de parámetros de regresión unaria es ().
Método de máxima verosimilitud | Método de estimación de distancia | Método de mínimos cuadrados | Método de distancia euclidiana

33. ¿Cuáles son las propiedades de la ciencia de datos ()
efectividad | disponibilidad | inesperado | comprensible

34. Los principales métodos de agrupamiento son ().
Agrupación de particiones | agrupación jerárquica | agrupación de densidad | agrupación de distancia

35. La clasificación de relevancia se puede dividir en () según la dirección correspondiente.
Correlación positiva | Correlación negativa | Correlación izquierda | Correlación derecha

36. Las tablas cruzadas pueden ayudar a las personas a descubrir las interacciones entre variables.
Bien | mal

37. El algoritmo de BP estándar es un algoritmo que actualiza los parámetros de manera uniforme después de leer todos los conjuntos de datos.
Bien | mal

38. Las reglas de asociación pueden ser ampliamente utilizadas en los campos de comunicaciones, finanzas, transporte, atención médica y análisis de comportamiento de los usuarios de la web.
Bien | mal

39. Cuando las características son discretas, la ganancia de información se puede utilizar como estadística de evaluación.
Bien | mal

40. Dado un conjunto de datos, si hay un hiperplano S que puede dividir correctamente parte de los puntos de instancia positivo y negativo del conjunto de datos a ambos lados del hiperplano, se dice que el conjunto de datos es un conjunto de datos separable linealmente.
Bien | mal

41. Las reglas de asociación que no satisfacen una medida de evaluación dada son aburridas.
Bien | mal

42. Cuanto más similares son los dos objetos, mayor es su disimilitud.
Bien | mal

43. El árbol de decisión también puede representar la distribución de probabilidad condicional de una clase bajo una condición de característica dada. Esta distribución de probabilidad se define en una partición del espacio de características. El espacio de características se divide en unidades disjuntas o regiones, y cada unidad se define. la distribución de probabilidad de una clase constituye una distribución de probabilidad condicional
del | equivocada

44. Cuanto mayor es la ganancia de información de una característica, menos importante es.
Bien | mal

45. La entropía de la información, menor será la pureza de la muestra se unen
a | equivocada

46. ​​Si al menos un subconjunto de un conjunto de candidatos es infrecuente, dicho conjunto de candidatos definitivamente es infrecuente según el atributo antimonotónico de soporte.
Bien | mal

47. EDA puede maximizar la visión del analista sobre el conjunto de datos y la estructura subyacente del conjunto de datos, y proporcionar al analista todo tipo de información contenida en el conjunto de datos.
Bien | mal

48. A medida que aumenta la dimensión, el volumen del espacio de características aumenta rápidamente, haciendo que los datos disponibles sean densos.
Bien | mal

49. En los modelos de regresión lineal múltiple, los coeficientes de regresión parcial estandarizados no tienen unidades.
Bien | mal

50. Al clasificar el árbol de decisión, la instancia del nodo se divide a la fuerza en la categoría con una gran probabilidad condicional. Correcto
| incorrecto

51. La probabilidad previa de cada clase se puede estimar por la proporción de registros de entrenamiento que pertenecen a esa clase.
Bien | mal

52. El algoritmo K-Means es la agrupación de densidad.
Bien | mal

53. Las reglas de asociación se pueden generar por enumeración.
Bien | mal

54. La adquisición de datos proporciona material y base para el análisis de datos, que aquí solo incluye datos adquiridos directamente.
Bien | mal

55. La historia de la cerveza y los pañales es un ejemplo típico de análisis de conglomerados.
Bien | mal

56. La composición básica de un árbol de decisión consiste en nodos y aristas dirigidas ¿Cuáles son los dos tipos de nodos y cuáles son sus significados? ¿Y la idea básica del árbol de decisión?


57. ¿Qué tipo de problemas resuelven los perceptrones de una o varias capas?


58. ¿Qué es una red neuronal? ¿Cuáles son los componentes más básicos de las redes neuronales?


 

96 artículos originales publicados · elogiados 7 · 20,000+ vistas

Supongo que te gusta

Origin blog.csdn.net/island33/article/details/105113899
Recomendado
Clasificación