一个有趣的说法：多层神经网络的致命问题与过拟合 - 代码天地

一个有趣的说法：多层神经网络的致命问题与过拟合

其他 2018-08-18 08:23:52 阅读次数: 0

Bengio在Learning Deep Architectures for AI 一书中举了一个有趣的例子。他说：最近有人表示，他们用传统的深度神经网络把训练error降到了0，也没有用你的那个什么破Pre-Training嘛！

然后Bengio自己试了一下，发现确实可以，但是是建立在把接近输出层的顶隐层神经元个数设的很大的情况下。于是他把顶隐层神经元个数限到了20，然后这个模型立马露出马脚了。无论是训练误差、还是测试误差，都比相同配置下的Pre-Training方法差许多。

也就是说，顶层神经元在对输入数据直接点对点记忆，而不是提取出有效特征后再记忆。这就是神经网络的最后一个致命问题：过拟合，庞大的结构和参数使得，尽管训练error降的很低，但是test error却高的离谱。

过拟合还可以和Gradient Vanish、局部最小值混合三打，具体玩法是这样的：

由于Gradient Vanish，导致深度结构的较低层几乎无法训练，而较高层却非常容易训练。
较低层由于无法训练，很容易把原始输入信息，没有经过任何非线性变换，或者错误变换推到高层去，使得高层解离特征压力太大。
如果特征无法解离，强制性的误差监督训练就会使得模型对输入数据直接做拟合。

其结果就是，A Good Optimation But a Poor Generalization，这也是SVM、决策树等浅层结构的毛病。

Bengio指出，这些利用局部数据做优化的浅层结构基于先验知识（Prior）: Smoothness。即，给定样本(xi,yi)(xi,yi)，尽可能从数值上做优化，使得训练出来的模型，对于近似的x，输出近似的y。

然而一旦输入值做了泛型迁移，比如两种不同的鸟，鸟的颜色有别，且在图像中的比例不一，那么SVM、决策树几乎毫无用处。

因为，对输入数据简单地做数值化学习，而不是解离出特征，对于高维数据（如图像、声音、文本），是毫无意义的。然后就是最后的事了，由于低层学不动，高层在乱学，所以很快就掉进了吸引盆中，完成神经网络三杀。

猜你喜欢

转载自blog.csdn.net/qq_39521554/article/details/81672811

一个有趣的说法：多层神经网络的致命问题与过拟合

多层神经网络的线性与拟合问题

有趣的卷积神经网络

一个有趣的问题

神经网络的过拟合问题

神经网络过拟合问题

神经网络解决过拟合问题

神经网络于过拟合

一个有趣的网络掩码的实验

有趣的神经网络学习教程

一个有趣的抛硬币问题

一个有趣的天平称东西问题

一个关于赋值的有趣问题

一个关于sizeof的有趣的小问题

一个有趣的java问题

有趣的一个循环数组问题

神经网络结构与过拟合问题

神经网络学习笔记——过拟合问题

使用L2正则化防止多层神经网络过拟合（纯numpy实现）

一个有趣的现象

如何使用pytorch定义一个多层感知神经网络模型——拓展到所有模型知识

神经网络防止过拟合的方法

神经网络解决过拟合的方法

神经网络中的过拟合

龙格库塔迭代与基于pytorch的RNN循环神经网络在正弦函数拟合效果上的有趣对比

深度学习笔记 (二) 在TensorFlow上训练一个多层卷积神经网络

如何用Python创建一个多层神经网络

从0到1，实现你的第一个多层神经网络

神经网络欠拟合与过拟合方法

[整理]一个有关 Latch （锁存器）的有趣问题

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)