RNN, LSTM y GRU Perfil

ilustración RNN

Esta es la estructura de la red, y relacionada con el tiempo, con el fin de mostrar mejor se puede ampliar en el tiempo

Aquí Insertar imagen Descripción
Puesto en marcha por el tiempo de formación
Aquí Insertar imagen Descripción
Aquí Insertar imagen Descripción

LSTM

Referencia: Referencia 1, referencia 2, la referencia 3
Aquí Insertar imagen Descripción
Aquí Insertar imagen Descripción
¿Por tanh?
Con el fin de superar los desaparece gradiente, necesitamos una segunda derivada de la función se puede mantener durante una larga distancia antes de llegar a cero. tanh es una función adecuado que tiene tal propiedad a.
¿Por qué utilizar sigmoide?
Desde la salida de la función sigmoide puede ser 0 o 1, que puede ser utilizado para determinar olvidar o recordar información.

El efecto de tres puertas:
Aquí Insertar imagen Descripción
cuando ft = 0, it = 1, información del historial de estado interno se descarta contiene CT-1, la información de historial se borra, entonces sólo el estado interno del registro de la información en tiempo ct t-1, y también candidato tiene la forma
cuando ft = 1, cuando se 0 =, sólo el estado interno de la información de la historia de copiar ct estado interno previo de CT-1, sin necesidad de escribir la nueva información presentada por el XT.

ecuación puerta olvidada:
Aquí Insertar imagen Descripción
donde Wf * [h, x] puede escribirse como las formas siguientes,
Aquí Insertar imagen Descripción
puerta de entrada:
Aquí Insertar imagen Descripción
el estado de la celda de memoria:
Aquí Insertar imagen Descripción
Aquí Insertar imagen Descripción
compuertas de salida:
Aquí Insertar imagen Descripción
la salida final:
Aquí Insertar imagen Descripción

GRÚA

Aquí Insertar imagen Descripción
Fórmula:
Aquí Insertar imagen Descripción
La puerta de entrada, puerta olvidar, la salida de la puerta se convierte en dos puertas: olvidando puertas y puerta puertas de entrada en una única actualización (Actualizar Gate) y una puerta de restablecimiento (Reset Gate).
El estado de los medios de salida en un solo estado:

Publicado 70 artículos originales · ganado elogios 1 · vistas 2410

Supongo que te gusta

Origin blog.csdn.net/weixin_43794311/article/details/105182494
Recomendado
Clasificación