【翻译】Sklearn 与 TensorFlow 机器学习实用指南 —— 第11章训练深层神经网络（下） - 代码天地

【翻译】Sklearn 与 TensorFlow 机器学习实用指南 —— 第11章训练深层神经网络（下）

其他 2018-06-30 01:25:58 阅读次数: 0

训练稀疏模型

所有刚刚提出的优化算法都会产生密集的模型，这意味着大多数参数都是非零的。如果你在运行时需要一个非常快速的模型，或者如果你需要它占用较少的内存，你可能更喜欢用一个稀疏模型来代替。

实现这一点的一个微不足道的方法是像平常一样训练模型，然后摆脱微小的权重（将它们设置为 0）。

另一个选择是在训练过程中应用强 l1 正则化，因为它会推动优化器尽可能多地消除权重（如第 4 章关于 Lasso 回归的讨论）。

但是，在某些情况下，这些技术可能仍然不足。最后一个选择是应用双重平均，通常称为遵循正则化领导者（FTRL），一种由尤里·涅斯捷罗夫（Yurii Nesterov）提出的技术。当与 l1 正则化一起使用时，这种技术通常导致非常稀疏的模型。 TensorFlow 在FTRLOptimizer类中实现称为 FTRL-Proximal 的 FTRL 变体。

学习率调整

找到一个好的学习速度可能会非常棘手。如果设置太高，训练实际上可能偏离（如我们在第 4 章）。如果设置得太低，训练最终会收敛到最佳状态，但这需要很长时间。如果将其设置得太高，开始的进度会非常快，但最终会在最优解周围跳动，永远不会安顿下来（除非您使用自适应学习率优化算法，如 AdaGrad，RMSProp 或 Adam，但是即使这样可能需要时间来解决）。如果您的计算预算有限，那么您可能必须在正确收敛之前中断训练，产生次优解决方案（参见图 11-8）。

>>>阅读全文

猜你喜欢

转载自blog.csdn.net/sweetfire/article/details/80828797

【翻译】Sklearn 与 TensorFlow 机器学习实用指南 —— 第11章训练深层神经网络（下）

ApacheCN《Sklearn 与 TensorFlow 机器学习实用指南》第11章项目训练深层神经网络（梯度消失与梯度爆炸，选择初始化，选择激活函数）

《Scikit-Learn与TensorFlow机器学习实用指南》第11章训练深层神经网络

【翻译】Sklearn与TensorFlow机器学习实用指南 —— 第16章强化学习（下）

Sklearn 与 TensorFlow 机器学习实用指南——第十三章总结_卷积神经网络

Sklearn 与 TensorFlow 机器学习实用指南——第十一章总结

《Scikit-Learn与TensorFlow机器学习实用指南》第14章循环神经网络

《Scikit-Learn与TensorFlow机器学习实用指南》第10章人工神经网络介绍

【翻译】Sklearn与TensorFlow机器学习实用指南 ——第12章设备和服务器上的分布式TensorFlow（上）

《Sklearn 与 TensorFlow 机器学习实用指南》第6章决策树

Sklearn 与 TensorFlow 机器学习实用指南——第十五章总结

<<Sklearn 与 TensorFlow 机器学习实用指南>>

Sklearn 与 TensorFlow 机器学习实用指南（补档）

Sklearn 与 TensorFlow 机器学习实用指南——第八章总结

Sklearn 与 TensorFlow 机器学习实用指南——第九章习题答案

Sklearn 与 TensorFlow 机器学习实用指南——第七章总结

Sklearn 与 TensorFlow 机器学习实用指南——第十三章习题答案

Sklearn 与 TensorFlow 机器学习实用指南第二版

《TensorFlow实战Google深度学习框架》——第4章深层神经网络知识总结（思维导图）

TensorFlow（实战深度学习框架）----深层神经网络（第四章）

《Scikit-Learn与TensorFlow机器学习实用指南》第1章机器学习概览

深层神经网络--Tensorflow实战google深度学习框架

TensorFlow学习笔记（二）深层神经网络

Tensorflow 学习笔记（二）: 深层神经网络

TensorFlow学习笔记(2) 深层神经网络

TensorFlow学习笔记——深层神经网络的整理

Tensorflow学习笔记(四)---深层神经网络

《Scikit-Learn与TensorFlow机器学习实用指南》第7章集成学习与随机森林

《Scikit-Learn与TensorFlow机器学习实用指南》第16章强化学习

《Scikit-Learn与TensorFlow机器学习实用指南》第8章降维

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)