李宏毅深度学习

1 Basic Structures for Deep Learning Models

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
y是由 h h' 运算得到的
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
与下一个LSTM单元相连
在这里插入图片描述

3 Computational Graph and Backpropagation

在这里插入图片描述
在这里插入图片描述
计算图的方式:
在这里插入图片描述
在这里插入图片描述
注:代价值 C 是一个常数

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
C y \frac{\partial C}{\partial y} 是一个长条状,一行多列。
softmax 得到的不是 diagonal matrix,因为所有的 z 都会影响每一个 y i y_i
在这里插入图片描述
在这里插入图片描述
注:将 W m n 2 W^2_{mn} 平铺,共有 m*n 个元素
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
左右两边结果一样
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4 Language Model

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/baidu_41867252/article/details/89289212
今日推荐