全连接神经网络结构

这一系列博客，记录我在deep learning上的理解和认知。

首先介绍神经网络的基本结构。如下图

基本的结构：输入层(样本数据)，隐藏层(隐藏层的层数和每层的神经元数目需要自己给定)，输出层(预测目标)

神经元

神经元的结构如下图所示

神经元是上一层的输入与权重相乘后求和，在经过非线性函数转换。得到下一层的输出。如：之前网络结构图中，从输入层到隐藏层的神经元的数目为4个。

非线性函数(激活函数)

如果把神经元的非线性函数去掉的话，那么这个神经元可以写成：输出=输入*权值+偏置。这个就是线性回归方程，所以如果把神经网络的非线性函数去掉，那么整个网络就是由多个线性回归组成的。线性回归是线性方程，只能解决线性可分的问题。多个线性回归组成的结果无论经过多少的层的神经网络，其本质上也是线性方程。但现实中的很多需要解决的问题都是线性不可分的(异或问题)。所以为了解决这些线性不可分的问题，我们引入了非线性方程g，那么输出就变为了g(w*X+b)。

目前主流的非线性函数主要有：

sigmoid函数：