深度学习阅读笔记

其他 2020-02-27 22:32:16 阅读次数: 0

第7章深度学习中的正则化

正则化目的：用来减少泛化误差

7.1 参数泛化惩罚，如L2参数正则化

7.2 作为约束的范数惩罚，即在原始的目标函数上添加一系列惩罚项

7.3正则化和欠约束问题，大多数形式的正则化能够保证应用于欠约定问题的迭代方法收敛

7.4数据集增强，数据集不够或者鲁棒性不好时，需要构造一些假样本，如加入噪声，图片倾斜等等。

7.5噪声鲁棒性。注入噪声远比简单地收缩参数强大，特别是噪声被添加到隐藏单元时会更加强大。

向输出目标注入噪声：大多数数据集的输出标签都有一定错误的，因此可以使用标签平滑方法，增则化k个输出的softmax函数的模型。

7.6半监督学习。使用主成分分析作为分类前的预处理步骤

7.7多任务学习。参数共享，多个输出标签

7.8提前终止。对于一些会过拟合的大模型时，训练误差会随着时间的推移逐渐降低但验证集的误差会再次上升，这时就需要提前终止。

7.9参数绑定和参数共享。如卷积网络

7.10稀疏表示。惩罚神经网络中的激活单元。

7.11Bagging和其它集成方法

7.12Dropout

7.13对抗训练

7.14切面距离/正切传播和流形正切分类器

第8章深度模型中的优化

1 小批量随机优化，更大的批量需要更多内存，回报可能却小于线性。gpu一般使用2的幂数会获得更少的运行时间

2 除非训练集特别大，通常最好是多次遍历训练集。但欠拟合和计算效率却是问题。否则是过拟合

3 随机梯度下降（SGD）是最受欢迎的方法,但学习过程有时会很慢，动量方法旨在加速学习，特别是处理高曲率/小但一致的梯度，或是带噪声的梯度。

4 一般初始化模型的权重为高斯或均匀分布中随机抽取的值

5 自适应学习率算法。AdaGrad/Adam

confiself

发布了127 篇原创文章 · 获赞 10 · 访问量 24万+

私信关注

猜你喜欢

转载自blog.csdn.net/u012599545/article/details/86560734

深度学习阅读笔记

论文阅读笔记------摄影测量与深度学习

深度学习文献阅读笔记（7）

机器学习经典论文——阅读笔记———深度学习（周志华）

[深度学习]Visualizing and Understanding Convolutional Networks阅读笔记

[深度学习] Going Deeper with Convolutions（GooLeNet）阅读笔记

深度学习笔记个人阅读的Deep Learning方向的paper整理

Neural network and deep learning阅读笔记（6）深度学习

GitChat 武博士深度学习与 NLP（一）阅读笔记

《自然语言理解-从规则到深度学习》阅读笔记

深度学习经典神经网络GoogLeNet阅读笔记

深度学习相关论文阅读

论文基于深度学习的细粒度中文情感分析及规则库学习阅读笔记

薄荷阅读学习笔记

博客阅读学习笔记

【学习之道】阅读笔记

【阅读笔记】新智元：深度学习为什么深？--周志华

tensorflow实战google深度学习框架阅读笔记——神经网络优化算法

tensorflow实战google深度学习框架阅读笔记——激活函数和损失函数篇

tensorflow实战google深度学习框架阅读笔记——保存，读取model（ckpt文件）

[深度学习]Deep Residual Learning for Image Recognition(ResNet,残差网络)阅读笔记

[深度学习] Very Deep Convolutional Networks for Large-Scale Image Recognition（VGGNet）阅读笔记

《基于深度学习的推荐系统研究综述》_黄立威——阅读笔记

AIQ - deeplearning.ai 全套吴恩达老师的深度学习课程笔记及资源在线阅读

基于深度学习的图像去噪暨SRMD论文阅读笔记

基于深度学习的图像去模糊（两篇经典的文献阅读笔记）

论文基于深度学习的自然语言处理综述阅读笔记

最佳实践：深度学习用于自然语言处理 - 阅读笔记

《微博深度学习平台架构和实践》阅读笔记

【花书阅读笔记】第七章：深度学习中的正则化 Part I

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)