pytorch nn.LSTM()パラメータ説明

入力データフォーマット:
INPUT(seq_len、BATCH、input_size)
H0(num_layers * num_directions、BATCH、hidden_​​size)
表示:CO(num_layers * num_directions、BATCH、hidden_​​size)

输出数据格式:
出力(seq_len、バッチ、hidden_​​size * num_directions)
HN(num_layers * num_directions、バッチ、hidden_​​size)
CN(num_layers * num_directions、バッチ、hidden_​​size)

輸入トーチ
としてNN torch.nn輸入
torch.autogradインポート変数から

建物ネットワークモデル#---入力行列前記番号input_size、前記出力行列hidden_​​sizeの数、層num_layers
入力= torch.randn(5,3,10) - >(seq_len、BATCH_SIZE、input_size)
RNN = nn.LSTM(10 、20,2) - >(input_size、hidden_​​size、num_layers)
H0 = torch.randn(2,3,20) - >(* num_layers 1、BATCH_SIZE、hidden_​​size)。
表示:CO = torch.randn(2,3,20) - >(* num_layers 1、BATCH_SIZE、hidden_​​size。)
num_directions = 1のLSTMため一方向である。
'' '
出力:出力、(H_n、C_N)
' ''
の出力、(HN、CN)がRNN(入力、(H0、コ)= )
。1
2
3
4
5
6
7
8
9
10
11
12は
13であり、
14
batch_first:入力寸法BATCH_SIZEかどうかを第1の出力は、デフォルト値はFalseです。トーチので、人々はデータセットトーチ、ニューラルネットワークモデルへのデータローダーの連続入力データ内で使用するために使用され、BATCH_SIZEパラメータが一度入力されたどのように多くのデータを示しているがあります。LSTMはモデルで、入力されたデータは、バルクデータの一括データLSTMを区別するために、データのバッチでなければならないと意味が同じであるデータローダー、LSTMモデルは、このパラメータの設定によって区別されます。意味は同じである場合は、それがTrueに設定されている、別の意味ならば、Falseに設定されています。デフォルトで第二の次元におけるtorch.LSTM BATCH_SIZE寸法、パラメータ設定は、したがってBATCH_SIZE最初の次元を配置することができます。例えば:入力デフォルトは(4,1,5)、BATCH_SIZE 1の中間である、(1,4,5)真= batch_first後に指定されています。あなたの入力データは2次元データであれば、それはTrueにbatch_firstする必要があります。

seq_len:入力= torch.randn(5,3,10) 10 = 5、bitch_size = 3、input_size =
私は理解三つの文章、各文5つのワードがあり、各ワードは10次元のベクトルで表されます。 、解決することができ、短いか長いseq_lenので、文の長さは、同じではありません、これはシーケンスの長さについての特別なLSTMです。のみseq_lenこのパラメータは可変です。
いくつかのパラメータのHNとCN詳細はこれを見て
、テキストの経験一貫性のない長さの場合には、モデル特徴の前に入力されたデータ内のテキストは、同じバッチは、その長さのパディングと整列されます動作します。しかし、問題がある場合、単方向整列データLSTMでも双方向LSTM、LSTMは無意味なパディング文字の多くに対処しますので、モデルは一定のバイアスを持っていますが、この時間は、あなたは機能torch.nn.utils.rnnを使用する必要があります.pack_padded_sequence()とtorch.nn.utils.rnn.pad_packed_sequence()
詳細については、ここでの説明を参照してください

BiLSTM
BILSTM双方向LSTM; LSTMに前後LSTM LSTMの接着。次のように例を表示します。


LSTM構造を推論します:


詳細な式の導出https://blog.csdn.net/songhk0209/article/details/71134698

オンラインマップはビット激しい見GRU式の導出は:(、)独自のデータフロー図に描い


---------------------
著者:晴れの戦い交差
出典:CSDN
オリジナルます。https://blog.csdn.net/yangyang_yangqi/article/details/84585998
著作権表示:この記事では、ブロガーのオリジナルの記事、再現され、ボーエンのリンクを添付してください!

おすすめ

転載: www.cnblogs.com/jfdwd/p/11184846.html