TensorFlow深度学习实战---MNIST数字识别问题 - 代码天地

TensorFlow深度学习实战---MNIST数字识别问题

其他 2018-09-05 11:38:29 阅读次数: 0

1.滑动平均模型：

用途：用于控制变量的更新幅度，使得模型在训练初期参数更新较快，在接近最优值处参数更新较慢，幅度较小

方式：主要通过不断更新衰减率来控制变量的更新幅度。

衰减率计算公式：

decay = min{init_decay , (1 + num_update) / (10 + num_update)}

其中 init_decay 为设置的初始衰减率，num_update 为模型参数更新次数，由此可见，随着 num_update 更新次数的增加，(1 + num_update) / (10 + num_update 这一项的计算结果越接近1

参数更新公式：

shadow_variable = decay * shadow_variable + (1 - decay) * variable
其中 shadow_variable 为变量更新前的数值，variable为变量更新后的数值

例如:
x = 0
x = 1
此时 shadow_variable 就是 0 ， variable 就是 1 ，假如此时的衰减率 decay 是 0.5，则更新后的 x 取值为 0.5 * 0 + （1 - 0.5） * 1 = 0.5

通过以上公式可以发现，随着模型迭代次数的增加，(1 + num_update) / (10 + num_update) 这一项的计算结果越接近1,也就是 (1 - decay) * variable 更接近于 0 ，此时模型参数变化幅度减小 , 也就是 shadow_variable == decay * shadow_variable 等式越成立。

2.

使用验证数据集判断模型效果：虽然一个神经网络模型的效果最终是通过测试数据来评判的，但不能直接通过模型在测试数据上的效果来选择参数。

使用测试数据来选择参数可能会导致神经网络模型过度你和测试数据，从而失去对未知数据的预判能力。

因此一般会从训练数据中抽取一部分作为验证是数据。

交叉验证（cross validation）：在海量数据下，花费时间比较长，一般会更多地采用验证数据集的形式来评测模型的效果。

3.在神经网络结构的设计上： 1）使用激活函数 2）多层隐藏层

在神经网络优化上：1）使用指数衰减的学习率 2）加入正则化的损失函数 2）滑动平均模型

4.通过MNIST数据集有效地验证了激活函数、隐藏层可以给模型的效果带来质的飞跃。此外，由于MNIST问题本身相对简单，滑动平均模型、指数衰减的学习率和正则化损失对最终正确率的提升效果不明显。

5.变量管理：

猜你喜欢

转载自www.cnblogs.com/bjut-lqq/p/9591086.html

TensorFlow深度学习实战---MNIST数字识别问题

TensorFlow入门：《TensorFlow：实战Google深度学习框架》——基础版的MNIST数字识别问题

TensorFlow入门：《TensorFlow：实战Google深度学习框架》——升级版的MNIST数字识别问题

Tensorflow实战：MNIST数字识别问题

05.MNIST数字识别问题------《Tensorflow实战Google深度学习框架》笔记

《Tensorflow实战Google深度学习》第5章 MNIST数字识别问题

《TensorFlow实战Google深度学习架构》——MNIST数字识别问题勘误

《tensorflow实战Google深度学习框架》第五章mnist数字识别问题

TensorFlow学习笔记（三）MNIST数字识别问题

TensorFlow学习笔记(3) MNIST数字识别问题

tensorflow学习笔记——4——MNIST数字识别问题

机器学习笔记（十一）： TensorFlow实战三（MNIST数字识别问题）

实战Google深度学习框架-C5-MNIST数字识别问题

[Tensorflow] MNIST数字识别问题

MNIST数字识别问题（Tensorflow）

《TensorFlow：实战Google深度学习框架》--5.2.1 MNIST手写识别问题（程序已改进）

mnist数字识别问题

Tensorflow完整实例——MNIST数字识别问题

【TensorFlow】笔记３：MNIST数字识别问题

【从零开始学习Tensorflow】（三）第5章 MNIST数字识别问题

深度学习之路--Mnist手写数字识别问题分析

深度学习应用实践7MNIST手写数字识别问题的神经元模型实践

使用tensorflow来解决MNIST手写体数字识别问题

TensorFlow的helloworld（MNIST数字识别问题）代码手把手解读

Tensorflow:实战Google深度学习框架　学习笔记（三）：MNIST数字识别

深度学习项目之mnist手写数字识别实战（TensorFlow框架）

深度学习笔记：Tensorflow手写mnist数字识别

MNIST数字识别问题完整版

数字识别问题

深度学习框架tensorflow二实战（分类问题：MNIST）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)