台大李宏毅 - 代码天地

台大李宏毅

其他 2018-12-12 11:11:05 阅读次数: 0

1：Regression-Case Study

为什么在Loss function中，只考虑对w的正则化，而不考虑对b的正则化？

因为b是一条水平线，b对Loss function是否平滑几乎不产生影响。

1-Regression Demo

Ada-Gradient时会详细讲解这个技巧：小的learning rate导致要很多次迭代才能达到最优解，大的learning rate有可能会有巨幅震荡，也无法达到最优解。有一个调参的技巧，就是对w和b克制化的learning rate。

lr = 1

....................................

lr_b = 0

lr_w = 0

....................................

lr_b = lr_b + b_grad ** 2

lr_w = lr_w + w_grad ** 2

.................................

# update parameters.

b = b - lr/np.sqrt(lr_b)* b_grad

w = w- lr/np.sqrt(lr_w)* w_grad

2：Where does the error come from？

error due to “bias” and error due to “variance”。

简单的model（model set比较小，这个小的model set可能根本不包含真实的target model），bias大，variance小；

复杂的model（model set比较大，这个大的model set可能就包含真实的target model），bias小，variance大。

如果error来自于variance很大，那么就是overfitting；

如果error来自于bias很大，那么就是underfitting；

What to do with large bias?

1、Diagnosis:

(1) If your model cannot even fit the training examples, then you have large bias.----> Underfitting.

(2) If you can fit the training data, but large error on testing data, then you probably have large variance. ----> Overfitting.

2、For bias, redesign your model:

(1) Add more features as input;

(2) A more complex model

What to do with large variance?

1、 More data（very effective, but not always practical）可以自己做训练数据，例如翻转、加噪声等。

2、 Regularization (希望参数变化较小，曲线变平滑)，但是可能会使你的model set 不包含target model，可能会伤害bias。

猜你喜欢

转载自blog.csdn.net/weixin_41078740/article/details/84522502

台大李宏毅

台大李宏毅--CNN

台大李宏毅--keras

台大李宏毅机器学习课程

机器学习-台大李宏毅

【台大李宏毅|ML】Gradient Descent

台大李宏毅教授的神经网络教程

台大李宏毅--深度学习tip（模型优化）

台大李宏毅-- 反向传播算法 Backpropagation

台大李宏毅--初入深度学习

台大李宏毅--梯度下降Gradient Descent

应用深度学习(台大陈蕴侬&李宏毅) Part1

[机器学习入门] 经典台大李宏毅机器学习课程从这里开始

【笔记】元学习专题视频（台大·李宏毅）学习记录

学习台大李宏毅的人工智能课程笔记

机器学习基础：台大李宏毅的线性代数视频公开课

台大李宏毅机器学习公开课2020版登陆B站

台大李宏毅机器学习2020学习笔记（一）：机器学习简介

台大李宏毅机器学习 2020学习笔记（二）：回归与过拟合

回归演示----台大李宏毅机器学习作业2

深度学习的训练技巧总结--台大李宏毅机器学习课程笔记

李宏毅主页

线性回归预测PM2.5----台大李宏毅机器学习作业1(HW1)

GAN李宏毅(1)

李宏毅作业１

李宏毅-逻辑回归

李宏毅深度学习

李宏毅课程笔记

李宏毅GAN教程

李宏毅_回归_2

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)