Notas de lectura: Pitón de la programación de la red neuronal [Inglés] Tariq Rashid (Tariq Rashid)

Notas de lectura: Pitón de la programación de la red neuronal [Inglés] Tariq Rashid (Tariq Rashid)

2020 lectura febrero, de una imprimación de redes neuronales. En Inglés y buscar el código fuente de ollas fieles por favor deje un buzón de mensajes.

Pitón de programación de redes neuronales [Inglés] Tariq Rashid (Tariq Rashid)
Cómo leer este libro:
Este libro es la estructura muy clara, la entrada para completamente basado en redes neuronales. Antes de leer dos capítulos terminado de leer la esencia de la misma. El primer capítulo es lo básico, y lo básico es muy importante leer el código puede entender este segundo capítulo de la comprensión. El segundo capítulo es el núcleo de una serie de cuestiones problemáticas de reconocimiento de imágenes "reconocimiento de escritura digitales", y entrenar una red neuronal para resolver el problema. Antes del comienzo del tema, hay tutorial portátil jupyter. Después vamos a explicar con gran detalle cómo esta materia en cada parte del código está escrito. Elija usted mismo otra vez siguieron el libro para entender en el interior portátil jupyter. (Recomendado elija usted mismo, no copiar y pegar)

El siguiente extracto del libro propio informe:

El primer capítulo de la red neuronal funciona
un predictor
si la máquina recibe una entrada sencilla, y tener debidamente en predecir la salida, por lo que llamaremos predictor. El uso de una función lineal como modelo, y un valor de gradiente se puede ajustar como un parámetro. Una buena manera de mejorar estos modelos se basan en una comparación entre el modelo y el conocido ejemplo del mundo real, para dar el parámetro de ajuste de error del modelo de compensación.
En segundo lugar, la clasificación se
utiliza para separar la naturaleza lineal de cosas diferentes, es decir, un clasificador de formación lineal para ajustar la inclinación de la línea divisoria, se puede clasificar correctamente. Configuración de una función lineal: y = ax, A es el parámetro de la pendiente. El algoritmo de ordenador es como sigue:
(1) Un valor aleatorio como el valor de error E es un objetivo deseado - valor de salida real.
(2) la relación entre la cantidad de cambio para encontrar el valor de error E a A.
(3) el parámetro de ajuste basado en el valor de error actual.
La adición de un factor de ajuste L, llamada la tasa de aprendizaje. Utilizando el tipo de aprendizaje se puede ajustar para mejorar la tasa, por lo que un solo muestras de entrenamiento no puede dominar todo el proceso de aprendizaje. En tercer lugar, la red neuronal
de la señal (1) de alimentación hacia adelante
en la fase de entrenamiento de la red, los datos transmitidos desde la capa de entrada, la capa de salida.
• W está oculta input_hidden = X-la I
O = oculto sigmoide (X-oculto)
X-hidden_output • W es O = Salida oculto
de salida O sigmoide = (X-salida)
de propagación inversa (2) error del valor de salida de las muestras de entrenamiento de la red neural en valor, se calcula el error. La propagación de error de la parte posterior de salida a la red. Tenemos que utilizar este error para ajustar la red neuronal en sí, la actualización de los pesos, con objeto de optimizar el valor de salida de la red neuronal.
(3) la actualización de los pesos
red neural error es un funciones de ponderación enlace interno. red neuronal mejorada, medios que cambiando los pesos de reducir este error. Por función de error de descenso de gradiente, dar pequeños pasos, los pesos de manera iterativa mejoradas.

Capítulo II entrenar a su red neuronal
I. Antecedentes y recopilación de datos de tareas
1 RESUMEN: reconocimiento de escritura digital, reconocimiento de imágenes es un problema en sí. Por ejemplo, dada imágenes digitales escritas a mano como se muestra, la red neural determina el número requerido que representa de 0 a 9 que.
2. Conjunto de datos: bases de datos dígitos manuscrita MNIST. Este experimento utiliza un pequeño subconjunto del conjunto de datos, los datos de entrenamiento 100 casos de cada diez casos, los datos de prueba. formato de datos es un archivo csv. Se muestra a continuación se carga en una parte del editor de texto MNIST conjunto de prueba. El primer valor es una etiqueta, es decir, el escritor real deseada representación digital, tales como "7" o "9" valores Posteriormente, separados por comas, es un valor de píxel de dígitos escritos a mano. Tamaño de la matriz de píxeles 28 se multiplica por 28, es 784 después de que el valor de la etiqueta.
3. Experimento Medio Ambiente: python3.7
En segundo lugar, la estructura de red
de la red neuronal en la capa de entrada, una capa oculta y la capa de salida de 3 capas. En el que, la capa de entrada de 28 * 28 = 784 nodos, que representan todos los píxeles; capa de salida nodos 10, 10 representan el estado en el que 0-9. Selección de nodos en la capa oculta se interpone entre la capa de entrada y la capa de salida, tentativamente 100, posterior ajustable.
En tercer lugar, el procedimiento experimental y el código
1. Construcción de un marco de red
construida función de inicialización de clase neuralNetwork comprende __init __ (self, inputnodes, hiddennodes , outputnodes, learningrate), el tren función de formación (sí, inputs_list, targets_list) y consulta consulta de función (auto, inputs_list )
(1) función de inicialización:
función de inicialización se utiliza para inicializar la red. Inicializar la capa de red para establecer el nodo de entrada, el número de capas ocultas y los nodos de la capa de salida del nodo. Al mismo tiempo necesario para inicializar los pesos, el establecimiento de la función de tasa de aprendizaje y la activación.
(2) la función de formación:
primera señal de alimentación hacia adelante función de formación interna para obtener un resultado de salida, la propagación hacia atrás de error de cálculo, se utiliza para actualizar los pesos.
funciones (3) consulta:
función de consulta es una función de la red después de que se complete la formación, los datos de las llamadas durante el ensayo y la investigación, sólo una parte de la señal de alimentación hacia adelante interna.
2. Formación de la red
(1) inicialización de la red, lee los datos de entrenamiento (2) Formación de red: 100 menos datos de entrenamiento, por lo tanto proporciona cinco entrenamiento repetitivo.
En cuarto lugar, los experimentos
se pueden encontrar, el valor de salida máximo de la posición "7" de la etiqueta en el vector, por lo tanto se determina que 7. Por lo tanto, el éxito de la formación de la red, puede ser predicciones más precisas. Las pruebas con el conjunto de datos de prueba, de la siguiente manera: Como el número del conjunto seleccionado de datos de entrenamiento y prueba de conjuntos de datos, por lo que la tasa de precisión del 60%, si el aumento en el número de conjuntos de datos, el rendimiento mejorará.

Este blog es una obra original, dio la bienvenida a la guía, reproduce, por favor asegúrese de indicar la fuente, adjuntar un enlace a este artículo, gracias!

Publicado 20 artículos originales · ganado elogios 1 · visitas 200

Supongo que te gusta

Origin blog.csdn.net/weixin_43973433/article/details/104888185
Recomendado
Clasificación