一文掌握深度学习（九）——彻底搞懂神经网络（必看）

这一章是非常重要的一章，因为深度学习就是从动物的神经网络中找到的灵感，网上也有很多神经网络入门的视频和文章，不过大部分都是鱼龙混杂，本文力求用最通俗的语言来帮助大家彻底掌握深度学习的核心——神经网络。

本章要讲解的神经网络为浅层神经网络，深层神经网络咱们后面讲，但是没什么稀奇的，深层神经网络只不过比浅层神经网络多了几层，原理都一样。

回想一下我们之前学习的Logistic回归，它是一个最简单的神经网络，如图：

$x1,x2,x3...,xn$ 为一个样本的特征值， $w1,w2,w3...,wn$ 为每个特征对应的权重， $\Sigma$ 代表的是 $z=w1*x1+w2*x2+...+wn*xn+b$ ， $\sigma$ 代表 $a=\sigma (z)$ ，最后输出a，也就是得到的预测值 $\hat{y}=a$ 。

通过最简单的神经网络图，可以看出之前学习的Logistic回归的前向传播就是按照这个图箭头的方向进行的，反向传播按照箭头的反方向进行就可以啦，非常清晰直观，在这里也相当于复习了一遍之前的内容。

下面正式的讲解浅层神经网络，我们以两层的神经网络为例子来细致的分析：

上图就是一个二层的全连接神经网络，可能有的同学会问：“这个图明明是三层，为什么非得说是两层呢？”，因为在深度学习中，计算神经网络的层数，通常不计算输入层，所以上图的层数为二层，那么什么是全连接神经网络呢？顾名思义，全连接意思就是每一个神经元都与上一层的所有神经元相连，这样组成的神经网络为全连接神经网络。

下面来讲解每一个层：

1、输入层

对于二分类问题来说，输入层就是我们要识别的图片，比如我们想判断一张图片里是否有猫咪，那么我们的输入就是这一张图片，我们需要把图片变成像素特征，因为计算机识别的是像素。假设一张图片的大小为28*28，那么把图片变成像素矩阵，大小也是28*28，由于在深度学习中，输入层为列向量，所以要把像素矩阵变成一个列向量，维度为784*1，和上图中的输入层的维度一样。

输入层中的每一个输入都代表着图片中的一个特征，比如说第一个输入 $x1$ 可能代表猫毛发的纹理，第二个输入 $x2$ 代表猫的瞳孔等等。