【Deep Learning笔记】神经网络的优化解读（看不懂你来打我~！）

其他 2020-04-11 11:50:02 阅读次数: 0

文章目录

1 激活函数

1.1 sigmoid
1.2 tanh
1.3 ReLU函数
1.4 ReLU函数的变种

2 Dropout

2.1 原理
2.2 实验
2.3 作者重点分析的一些特点

1 激活函数

1.1 sigmoid

在这里插入图片描述

1.2 tanh

在这里插入图片描述
优缺点：

引入更简单更高效的函数：

1.3 ReLU函数

在这里插入图片描述
softplus导数正好为sigmoid。

在这里插入图片描述

1.4 ReLU函数的变种

在这里插入图片描述

2 Dropout

2.1 原理

在这里插入图片描述
最后一种方法太耗时。

去掉神经元的同时，输入输出也要去掉。-》得到一个子网络。
训练的时候都会在神经网路中抽样。

在这里插入图片描述
r1,r2,r3 取0 or 1.

Dropout可以与其他方法混合使用。

2.2 实验

在这里插入图片描述

用dorpout之后，units（参数量）明显增大。

+L2正则以此类推。

在这里插入图片描述

CNN草图：真草图！

在CNN和max pooling基础上，在全连接层加入dropout后效果更佳。

在6层神经网路上加入dropout，同理。

2.3 作者重点分析的一些特点

在这里插入图片描述
学习到更通用的特征。

大量的神经元都没有被激活，位于0周围。

左图过拟合。右图控制期望神经元数量（左图控制神经元数量）。

这张图说明dropout的权值缩放效果很好。

发布了936 篇原创文章 · 获赞 256 · 访问量 11万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_43838785/article/details/105440914

【Deep Learning笔记】神经网络的优化解读（看不懂你来打我~！）

【Deep Learning笔记】卷积神经网络必须要掌握的知识（看不懂你来打我）

【Deep Learning笔记】一个很好的神经网络相关定义(看不懂你来打我)

【Deep Learning笔记】循环神经网络

【Deep Learning笔记】神经网络基础

Deep Learning

Deep Learning - 1 神经网络

[Deep Learning] 神经网络基础

【Deep learning】循环神经网络RNN

Deep learning 与传统的神经网络的区别

Deep Learning 循环神经网络

Deep Learning Specialization课程笔记——神经网络编程基础

Deep Learning Specialization课程笔记——深层神经网络

Deep Learning Specialization课程笔记——浅层神经网络

Deep Learning Specialization课程笔记——神经网络基础

【Deep Learning笔记之卷积神经网络的架构】

看不懂你打我的《SpringBoot系列》

【Network Security！】IP地址详解（看不懂你来打我）

【Network Security！】NTFS安全权限(看不懂你来打我)

【网页前端设计Front end】JavaScript教程.上（看不懂你来打我）

【网页前端设计Front end】CSS入门（看不懂你来打我）

【Web安全】关于PHP-文件上传的探索（看不懂你来打我）

Deep Learning 学习笔记

Deep Learning 简略笔记

deep learning实验笔记

Deep Learning-Deep feedforward network

「Deep Learning」Note on Deep Video Portraits

Deep Learning - Machine Learning

一文彻底搞懂卷积神经网络的“感受野”，看不懂你来找我！

Deep Learning 1.1

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)