李宏毅机器学习-task3-误差和梯度下降

企业开发 2022-06-28 03:56:08 阅读次数: 0

1、误差

误差的来源：Average Error 随着模型复杂增加呈指数上升趋势。更复杂的模型并不能给测试集带来更好的效果，而这些 Error 的主要有两个来源，分别是 bias、和 variance 。

Error = Bias（偏差） + Variance（方差）

Bias是 “用所有可能的训练数据集训练出的所有模型的输出的平均值” 与 “真实模型”的输出值之间的差异；

Variance则是“不同的训练数据集训练出的模型”的输出值之间的差异。

1.1 估测

还是以预测宝可梦evolution之后的cp值为例子，我们假设假设真实的模型为 $\hat{f}$ ，如果我们知道 $\hat{f}$ 模型，那是最好不过了，但是 $\hat{f}$ 只有 Niamtic 公司才知道。

因此我们只能自己收集pokemon精灵的数据然后通过task1中讲到的step1~step2 训练得到我们的理想模型 $f^{*}$ , $f^{*}$ 其实是 $\hat{f}$ 的一个预估。

如何解释他们之间的关系呢？这个过程就像打靶， $\hat{f}$ 就是我们的靶心， $f^{*}$ 就是我们投掷的结果。如上图所示， $\hat{f}$ 与 $f^{*}$ 之间蓝色部分的差距就是偏差（bias）和方差（variance）导致的。

1.2 评估x的偏差

假设X的平均值是μ，方差为 $\sigma ^{2}$

评估平均值的步骤：

首先拿到N个样本点： ${x^{1}, x^{2}, x^{3}, x^{4},... , x^{N}}$
计算平均值m，得到 $m = \frac{1}{N} {\textstyle \sum_{n}^{}X^n} \ne \mu$

但是如果计算很多组的 mm ，然后求 mm 的期望：

这个估计呢是无偏估计（unbiased）。

然后 m 分布对于 μ 的离散程度（方差）：

Var[m] = \frac{\sigma ^2}{N}

这个取决于 NN，下图看出 NN 越小越离散：

2、梯度下降

tips1:调整学习速率自适应学习率 Adagrad算法 tips2：随机梯度下降法 tips3：特征缩放梯度下降的理论基础

数学理论

梯度下降的限制

猜你喜欢

转载自juejin.im/post/7110160622142275592

李宏毅机器学习-task3-误差和梯度下降

李宏毅机器学习笔记——误差和梯度下降

《深度学习》李宏毅 -- task3误差和梯度下降

误差与梯度下降（李宏毅《机器学习》）

李宏毅机器学习_梯度下降_3

梯度下降_机器学习-李宏毅

[李宏毅-机器学习]梯度下降Graident Descent

李宏毅机器学习笔记-3 梯度下降（Gradient Descent）

3、【李宏毅机器学习（2017）】Gradient Descent（梯度下降）

李宏毅机器学习：（一）线性回归梯度下降：（goodness of function）

李宏毅机器学习笔记（3）

李宏毅机器学习-task2

李宏毅ML lecture-1,2,3 线性回归及梯度下降

李宏毅机器学习笔记3-机器学习中的错误来源（bias和variance）

台大李宏毅--梯度下降Gradient Descent

李宏毅深度学习笔记（二）随机梯度下降(Stochastic Gradient Descent)

李宏毅机器学习——学习笔记（3）

李宏毅机器学习笔记3：Classification、Logistic Regression

李宏毅机器学习笔记（3）： error

【李宏毅机器学习笔记】3、gradient descent

李宏毅机器学习笔记3：Classification

机器学习_李宏毅笔记简记3

李宏毅2022机器学习HW3解析

李宏毅机器学习_误差从何而来_2_1

李宏毅机器学习-学习笔记

李宏毅机器学习——迁移学习

李宏毅机器学习——集成学习

《深度学习》李宏毅 -- task1机器学习介绍

李宏毅深度学习笔记（四）观测误差的来源——欠拟合和过拟合的解释

台大李宏毅机器学习课程

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)