【笔记】机器学习 - 李宏毅 - 10 - Tips for Training DNN - 代码天地

【笔记】机器学习 - 李宏毅 - 10 - Tips for Training DNN

其他 2019-08-21 10:24:44 阅读次数: 0

神经网络的表现
在Training Set上表现不好 ----> 可能陷入局部最优
在Testing Set上表现不好 -----> Overfitting 过拟合
虽然在机器学习中，很容易通过SVM等方法在Training Set上得出好的结果，但DL不是，所以得先看Training Set上的表现。
要注意方法适用的阶段：
比如：dropout方法只适合于在Training Data上表现好，在Testing Data上表现不好的，如果在Training Data上就表现不好了，那么这个方法不适用。

神经网络的改进
在输入层附近梯度小，在输出层梯度大，当参数还没有更新多少时，在输出层已经收敛了，这是激活函数\(sigmoid\)对值压缩的问题。

修改activation function为ReLU（Rectified Linear Unit），
ReLU input 大于0时，input 等于 output，input小于0时，output等于0。

其中，output为0的neural可以去掉，得到一个thinner linear network。
虽然局部是线性的，但这个network从总体上来说还是非线性的。

input小于0的部分，微分为0，这样就没法更新参数了，所以有以下两种方法改进。

此外，还可以通过Maxout自动学习activation function。

因为不是max的部分可以先去掉，所以可以不用train那些w，先train线性的局部。
当然，因为训练数据很多，最后都会被train到。

猜你喜欢

转载自www.cnblogs.com/yanqiang/p/11387112.html

【笔记】机器学习 - 李宏毅 - 10 - Tips for Training DNN

李宏毅机器学习笔记-9：Tips For Training DNN

李宏毅机器学习课程笔记3：Backpropagation、"Hello world" of Deep Learning、Tips for Training DNN

李宏毅ML+DL学习记录：tips for training DNN

李宏毅深度学习_Tips for Training Deep Neural Network

李宏毅机器学习笔记(10)

DNN训练技巧（Tips for Training DNN）

[李宏毅-机器学习]Tips for deep learning

机器学习10：Tips of DNN——激活函数选择

李宏毅机器学习——学习笔记（10） Why deep？

李宏毅机器学习P10 Classification 笔记

李宏毅2022机器学习HW10解析

9、【李宏毅机器学习（2017）】Tips for Deep Learning（深度学习优化）

李宏毅机器学习作业11——Transfer Learning，Domain Adversarial Training

李宏毅学习笔记35.GAN.06.Tips for Improving GAN

李宏毅机器学习笔记-10 卷积神经网络（Convolutional Neural Network-RNN）

李宏毅机器学习课程笔记10：Ensemble、Deep Reinforcement Learning

李宏毅机器学习笔记-10：卷积神经网络CNN

李宏毅机器学习-学习笔记

【ML】李宏毅机器学习笔记

李宏毅机器学习笔记

李宏毅机器学习笔记（4）

李宏毅机器学习笔记（3）

李宏毅机器学习笔记（1）

李宏毅机器学习笔记（2）

李宏毅机器学习笔记(5)

李宏毅机器学习笔记（6）

李宏毅机器学习笔记(19)

李宏毅机器学习笔记(18)

李宏毅机器学习笔记(17)

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)