Interpretação do princípio de ConvLSTM

ConvLSTM foi proposto pela primeira vez pelo artigo "Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting" .

Para entender o ConvLSTM, devemos primeiro revisar o princípio de funcionamento do LSTM .
insira a descrição da imagem aqui
O LSTM é muito bom no processamento de informações temporais e espaciais. Mas para gráficos tridimensionais, porque há informações espaciais ricas e cada ponto tem uma forte correlação com seus arredores, isso traz redundância.É difícil para o LSTM tradicional descrever essa característica espacial.

Como o LSTM usa um estado totalmente conectado de entrada oculta e uma conversão de estado-saída oculta, ele também pode ser chamado de Fully Connected-LSTM, FC-LSTM.


Para superar as deficiências do LSTM no processamento de informações tridimensionais, o ConvLSTM converte a entrada 2D no LSTM em um tensor 3D, e as duas últimas dimensões são dimensões espaciais (linhas e colunas). Para os dados a cada tempo t, o ConvLSTM substitui parte da operação de conexão no LSTM por uma operação de convolução, ou seja, prevê através da entrada atual e do estado passado dos vizinhos locais.

insira a descrição da imagem aqui



A expressão do LSTM é a seguinte:
insira a descrição da imagem aqui
ConvLSTM adiciona a operação de convolução de extração de recursos espaciais à rede LSTM e substitui algumas operações de conexão no LSTM por operações de convolução. Ou seja:
insira a descrição da imagem aqui
entre eles, ∗ ** significa operação de convolução.





参考
[1] 《Rede LSTM convolucional: uma abordagem de aprendizado de máquina para previsão a curto prazo》

Acho que você gosta

Origin blog.csdn.net/qq_42757191/article/details/126400739
Recomendado
Clasificación