第六章Deep Feedforward Networks

Deep feedforward networks（feedforward neural networks，multi-layer perceptrons （MLPs））

深度前馈网络结构在没有反馈连接，存在反馈连接的网络叫做recurrent neural networks。

深度前馈网络之所以叫做网络是因为它可以表示很多层的复合函数套用的结果。例如一个三层的神经网络可以表示为： $f^3(f^2(f^1(x)))$ ， $f^1$ 表示第一层， $f^2$ 表示第二层，最后一层叫做输出层。输出层的最终输出由每一个训练数据对应的标签所给定，但是训练数据不能决定每一个中间层的输出应该是多少，所以这些中间层叫做隐藏层，隐藏层的状态由学习算法来决定，学习算法需要利用这些中间层来使网络的最终输出接近标签值。

可以把每一层看做是一个向量到向量的函数，这是可以的。但是我们更喜欢把每一层的每一个神经元看做是一个向量到标量的函数，每一个神经元接受来自上一层所有神经元的激活值，经过计算产生自己的激活值。

6.1用深度前馈网络学习异或（XOR）

使用深度前馈网络解决异或问题，我们只需要使用一个三层（输入层，隐藏层，输出层）的全连接网络就可以。并且隐藏层只需要两个隐藏单元。隐藏层神经单元简单地使用线性函数解决不了异或问题，所以我们选用现代神经网络默认推荐的限流线性单元（ rectified linear unit）ReLU作为激活函数。ReLU的表达式以及函数图像为：