[神经网络] 关于学习率太大导致无法收敛的问题 - 代码天地

[神经网络] 关于学习率太大导致无法收敛的问题

其他 2018-06-24 05:40:40 阅读次数: 3

import tensorflow as tf
import random
#训练函数y=2x-1,a/b分别要训练为2,-1
x=tf.placeholder(tf.float32,[1])
a=tf.Variable(tf.constant([1],dtype=tf.float32))  
#b=tf.Variable(tf.constant([1],dtype=tf.float32))
y=a*x#+b
#
_y=tf.placeholder(tf.float32,[1])
loss=tf.square(y-_y)
train=tf.train.GradientDescentOptimizer(1e-4).minimize(loss) 

sess=tf.Session()
sess.run(tf.global_variables_initializer())  
 
while True:  
  input=[random.randint(0,100)]  #不乘以0.0001，则网络无法收敛
  label=[input[0]*2] 
  print(input)
  print(label)
  _,av,bv,lossv=sess.run([train,a,a,loss],feed_dict={x:input,_y:label}) 
  if (lossv<1e-6):
    break
  print("a=%s b=%s loss=%s" %(av,bv,lossv))

以上网络训练参数a，使其满足y=a*x=2*x。

以下两个条件成立时，网络会无法收敛，且参数迅速扩大直至变成NaN：

input/label值过大：如0~100

学习率较大，如0.1。

分析如下：

loss对a的函数为二次函数，Loss对a的导数为一次函数，导数大小取决输入数据x/y的大小，

当学习率太高/输入数据太大，会导致导数非常大，直接跳到二次函数对称轴另一边，如下图：

如何解决这个问题：

BN应该可以很大程度上解决这个问题；

其他的就是改小学习率。。。凭经验。。

learning rate 减小10倍有时候意味网络训练非常慢。

猜你喜欢

转载自blog.csdn.net/vcvycy/article/details/79520163

[神经网络] 关于学习率太大导致无法收敛的问题

学习神经网络

神经网络----学习

神经网络学习

神经网络的学习

关于搭建神经网络

关于图神经网络

神经网络和深度学习--神经网络基础

神经网络学习之----神经网络概述

神经网络2：卷积神经网络学习 1

神经网络3：神经网络学习 1

神经网络4：卷积神经网络学习 2

神经网络学习：神经网络节点配置

神经网络学习（十一）卷积神经网络初识

神经网络学习——卷积神经网络

神经网络学习——BP神经网络笔记

神经网络学习(三)——BP神经网络算法

神经网络基础学习笔记（二）神经网络

神经网络与深度学习（五）—— 循环神经网络

【神经网络学习笔记】改善神经网络

【神经网络学习笔记】构建多层神经网络

神经网络学习笔记8——卷积神经网络

神经网络VD问题

人工神经网络学习

神经网络与深度学习

《机器学习》神经网络

深度学习（神经网络）

机器学习——神经网络

神经网络+增强学习

【机器学习】神经网络

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)