模型中的一些细节问题

  1. embedding层:在导入预训练的词典后,embedding层的参数是怎么来的,以及参数数目是怎么计算的。
  2. 添加dropout层【将dropout层单独加进去】,没有产生额外要训练的参数。
  3. LSTM、GRU等RNN,当return_sequences=False时表示不会将所有的时刻的隐层输出最终输出出来,所以会发生降维;当return_sequences=True时,表示会将所有的时刻输出,不会发生降维。
  4. 4.

猜你喜欢

转载自blog.csdn.net/u010995990/article/details/80176818