1.1 de entrenamiento / desarrollo / prueba de conjunto - la profundidad del aprendizaje lección "Mejora de DNN" -Stanford profesor Andrew Ng

conjuntos de formación / desarrollo / prueba (Tren / dev / Conjuntos de pruebas)

Usted ya sabe, por lo que esta semana, vamos a seguir aprendiendo funcionamiento la eficacia de la red neuronal, que abarca más de ajuste de parámetros, cómo construir los datos, y cómo asegurarse de algoritmos de optimización en funcionamiento rápidamente, por lo que el aprendizaje del algoritmo de autoaprendizaje para completar en un plazo razonable .

La primera semana, que hablar primero de los problemas en la máquina de aprendizaje de redes neuronales, redes neuronales y luego al azar, sino también aprender alguna operación de redes neuronales para asegurar que los conocimientos adecuados, con estas preguntas, que comienzan la lección de hoy.

Tomar las decisiones correctas en la configuración de entrenamiento, validación y prueba de conjuntos de datos le ayudarán a crear redes neuronales eficiente en gran medida. Cuando el entrenamiento de la red neuronal, tenemos que tomar muchas decisiones, tales como:

  1. ¿Cuántas capas de red neuronal artificial
  2. Conteniendo cada uno un número de unidades ocultas
  3. ¿Cuál es la tasa de aprendizaje
  4. ¿Qué función de activación utilizando capas

Aquí Insertar imagen Descripción

Creación de una nueva aplicación, es imposible para nosotros predecir estos parámetros súper y otra información desde el principio. De hecho, la aplicación de la máquina de aprendizaje es un proceso muy iterativo, por lo general al inicio del proyecto, vamos a tener primero una idea preliminar, como la construcción contiene un número específico de capas, el número de unidades ocultas o el número de conjuntos de datos y así sucesivamente redes neuronales, a continuación, la codificación, y tratar de ejecutar el código, ejecute la prueba y obtener los resultados de estos configuración de la red neural o colado, puede volver a refinar sus ideas basadas en la salida, las tácticas de cambio, o para encontrar un mejor redes neuronales siguen iteración actualizar su programa.

Ahora, ya en el procesamiento del lenguaje natural el aprendizaje profundo, en muchas áreas de la visión artificial, reconocimiento de voz y aplicaciones de datos estructurada, logrando un gran éxito. Los datos estructurados es que lo abarca todo, desde la publicidad de la red de búsqueda. Que incluye no sólo la búsqueda del motor de búsqueda Web Web también incluye sitios de compras, de acuerdo con las entradas de la barra de búsqueda de todo resultado de la transmisión del sitio. Y luego a la seguridad informática, logística, tales como la determinación del conductor en caso de que recoja amplia gama, y ​​la lista continúa.

He encontrado que puede haber personas en el procesamiento del lenguaje natural le gustaría poner un pie en el campo de la visión artificial, reconocimiento de voz o de expertos con experiencia quieren unirse a la industria de la publicidad, o, algunas personas quieren saltar a la industria de la logística desde el campo de la seguridad informática, en mi opinión, de un campo o campos de aplicación tienen que ser experiencia intuitiva, por lo general no se pueden transferir a otras aplicaciones, la mejor decisión sobre la cantidad de datos que tiene, el número de entidades de entrada de las configuraciones de equipo, la GPU de la formación o de la CPU , GPU y CPU 's configuración específica y muchos otros factores.

Aquí Insertar imagen Descripción

Hasta el momento, creo que, para muchas aplicaciones, incluso conocedor sazonado de aprendizaje profundo es poco probable que empezar a parámetros preestablecidos que mejor se ajuste al súper, por lo que la profundidad del aprendizaje es una aplicación típica de un proceso iterativo que requiere más de veces el ciclo con el fin de encontrar un corazón para la aplicación de redes neuronales, la eficiencia del proceso de reciclaje es un factor clave para determinar el grado de avance del proyecto, y crear conjunto de datos de entrenamiento, validación y prueba de conjuntos de alta calidad también ayuda a mejorar la circulación eficiencia.

Aquí Insertar imagen Descripción

Se supone que los datos de entrenamiento que representa por un rectángulo, que suelen utilizar estos datos en partes, como parte del conjunto de entrenamiento, como parte de la simple conjunto de validación cruzada, a veces llamado conjunto de validación, por conveniencia, lo llamo conjunto de validación ( dev el conjunto ), son, de hecho, el mismo concepto, como la última parte de la prueba.

A continuación, comenzó a entrenar el algoritmo, mediante un simple conjunto de validación validación cruzada o conjunto para seleccionar el mejor modelo, bien probada, se seleccionó el modelo final, entonces puede ser evaluada en la prueba, para la evaluación objetiva la salud del algoritmo.

En el aprendizaje y el desarrollo de la era de los datos de máquina pequeña, la práctica común es poner todos los datos de tres siete, a menudo se dice que el 70% del conjunto de validación, el 30% del conjunto de prueba, si no se establece explícitamente el conjunto de validación, puede seguir el entrenamiento de 60%, 20 % y 20% de la validación del conjunto de prueba divididas. Se trata de las mejores prácticas de aprendizaje automático generalmente aceptados en los años anteriores.

Aquí Insertar imagen Descripción

Si tan sólo 100, 1.000 o 10.000 de datos, luego dividir la relación anterior es muy razonable.

Pero en la era de los grandes datos, la cantidad de datos que puede ser de un millón de nivel, entonces el conjunto de validación y el porcentaje de prueba de la cantidad total de datos tienden a ser más pequeños. Debido a que el propósito de la verificación es verificar diferente conjunto de algoritmos, que algoritmo de prueba es más potente, y por lo tanto, el conjunto de validación que ser lo suficientemente grande como para evaluar, por ejemplo, dos o incluso 10 algoritmos diferentes, y determinar rápidamente qué algoritmo es más eficaz. Es posible que no tenga que dedicar el 20% de los datos como un conjunto de validación.

Aquí Insertar imagen Descripción

Por ejemplo, tenemos un millón de datos, a continuación, tomar 10000 datos suficientes para evaluar identificar las mejores algoritmos que realizan 1-2. Del mismo modo, de acuerdo con la selección final del clasificador, el principal objetivo del equipo de prueba se evaluará correctamente el rendimiento del clasificador, por lo que si usted tiene un millón de puntos de datos que necesitamos sólo 1000 de datos, sería suficiente para evaluar clasificador individual y una evaluación precisa de la clasificación el rendimiento es. Supongamos que tenemos 100 millones de datos, en el que el conjunto de validación como 10.000, 10.000 como el conjunto de ensayo, tomando 100 Miles 10.000, la relación es de 1%, que es: conjunto de entrenamiento 98%, de validación y de prueba cada uno representaron 1 %. Para la cantidad de datos que un millón de aplicaciones, el conjunto de entrenamiento se explica para los conjuntos de 99,5%, de validación y de prueba cada representaron el 0,25%, o conjunto de validación 0,4%, el aparato de prueba 0,1%.

En resumen, en el aprendizaje de máquina, por lo general dividir la muestra en conjunto de entrenamiento, validación y prueba de conjuntos de tres piezas, el tamaño relativamente pequeño del conjunto de datos de la relación de división tradicional, cuanto mayor sea el conjunto de datos, sistema de validación y prueba de conjunto de menos de 20% o 10% de los datos totales. Más tarde voy a dar una orientación específica sobre cómo dividir el conjunto de validación y prueba de conjunto.

Otra tendencia en el estudio a fondo moderna es que más y más personas en los conjuntos de entrenamiento y prueba coincide con la distribución sin el entrenamiento, si usted quiere construir un gran número de usuarios pueden subir imágenes de la aplicación, el objetivo es identificar y presentar todos los gatos imagen, puede que los usuarios están amantes de los gatos, las series de entrenamiento se puede descargar de Internet el gato imágenes, y validación y de prueba son subidos por el usuario en la aplicación de cuadros del gato, es decir, el conjunto de entrenamiento podría ser de la red atrapado abajo en la imagen. Los conjuntos de validación y pruebas son imágenes subido por el usuario. Los resultados gato muchas imágenes de alta resolución en las páginas web, post-producción muy profesional, y así los usuarios subir imágenes pueden ser tomadas usando un teléfono móvil, de baja resolución, bastante vagos, estos dos tipos de datos informal de forma diferente para esta situación , basado en la experiencia, sugiero que se asegure de verificar y prueba de conjuntos de datos de la misma distribución, en este tema voy a hablar más. Debido a que se utiliza el equipo de prueba para evaluar los diferentes modelos para optimizar el rendimiento tanto como sea posible. Si la verificación y de prueba de la misma distribución serán muy buenas.

Aquí Insertar imagen Descripción

Sin embargo, debido a la profundidad del algoritmo de aprendizaje requiere una gran cantidad de datos de entrenamiento, con el fin de obtener mayor conjunto de datos de entrenamiento, podemos utilizar la popular variedad de estrategias creativas, tales como rastreo web, el precio es de conjunto de entrenamiento y un conjunto de datos de validación y pruebas de información puede que no haya de la misma distribución. Pero mientras siga esta regla de oro, se encuentra un algoritmo de aprendizaje automático se vuelve más rápido. Voy a explicar esta regla de oro con más detalle en una lección posterior.

Por último, incluso si no hay un conjunto de pruebas, no importa, el objetivo de la prueba es el conjunto final del sistema de redes neuronales específicos necesarios para la estimación no sesgada, si las estimaciones no imparcial no pueden proporcionar el equipo de prueba. Así que si solamente conjunto de validación, no hay un conjunto de pruebas, lo que tenemos que hacer es, en la formación en el conjunto de entrenamiento, probar un modelo diferente marco para la evaluación de estos modelos en el conjunto de validación, a continuación, iterar y seleccionando el modelo aplicable. Debido a que la prueba de verificación ya cubierto conjunto de datos centralizada, que ya no puede proporcionar una evaluación objetiva del rendimiento. Por supuesto, si usted no necesita una estimación no sesgada, eso está bien.

Aquí Insertar imagen Descripción

En el aprendizaje de máquina, aunque sólo un conjunto de entrenamiento y un conjunto de validación, y ningún conjunto de pruebas independientes, en cuyo caso, el conjunto de entrenamiento es también conocido como el conjunto de entrenamiento y validación del conjunto se llama el equipo de prueba, pero en aplicaciones prácticas, es tan simple conjunto de prueba de validación cruzada utilizado, no aplicar plenamente las funciones del término, ya que se ajusta sobre el conjunto de datos para verificar un conjunto de prueba. Si un equipo te dice que acaba de crear un conjunto de entrenamiento y un conjunto de pruebas, voy a ser muy prudente, pensando que en realidad no están entrenando conjunto de validación, ya que el conjunto de datos de validación exceso de ajuste para el equipo de prueba, de manera que éstos cambiar el nombre para el equipo, lo renombró como "conjunto de validación de formación" en lugar de "prueba de conjunto de entrenamiento", puede no ser fácil. Incluso si pienso "conjunto de validación Formación" es más preciso en términos profesionales. De hecho, si usted no necesita una evaluación objetiva del rendimiento del algoritmo, entonces esto es posible.

Aquí Insertar imagen Descripción

Por lo tanto, construir una validación de la formación y la prueba de conjuntos para acelerar la integración de las redes neuronales pueden ser más efectivamente medir el algoritmo de sesgo y la varianza para ayudarnos de manera más eficiente seleccionar el método apropiado para optimizar el algoritmo.

Por supuesto PPT

Aquí Insertar imagen Descripción
Aquí Insertar imagen Descripción
Aquí Insertar imagen Descripción
Aquí Insertar imagen Descripción

Ha publicado 187 artículos originales · alabanza 7 Ganador · vistas 10000 +

Supongo que te gusta

Origin blog.csdn.net/weixin_36815313/article/details/105386164
Recomendado
Clasificación