李宏毅机器学习笔记（2）： Regression - 代码天地

李宏毅机器学习笔记（2）： Regression

其他 2020-01-13 18:19:35 阅读次数: 0

Regression : output a scalar 输出一个标量

1 例子

股票市场预测：通过输入各种股票市场参数：输出数字

无人车驾驶：输入车上传感器参数：输出方向盘角度

商品推荐：使用者特征，商品特征：输出购买可能性

例子详解：预测宝可梦的CP值：妙蛙种子的特性：进化之后的CP

图1-1 样例详解

定义变量：xcp 当前cp值、xs种类、xhp生命值、xw重量、xh高度

y 输出进化之后cp

2 step1：寻找模型

图2-1 第一步模型建立

y=b+w×xcp b、w是模型参数，可以任何值

通过b、w不同，可以组成无限多的函数。

Linear model：y=b+wixi

xi：称作feature 包括：xcp 当前cp值、xs种类、xhp生命值、xw重量、xh高度

wi：weight b：bias

3 Step 2：模型优劣

图3-1 样本点

通过大量的样本，xi，每个样本实际输入，yi样本实际输出

Loss function：输入：函数

输出：该函数对实际情况不适应性

Lf=n=110(yn-f(xcpn))2 =L(w,b)=n=110(yn-(b+w×xcpn))2

图3-2 损失函数

通过不同w，b的值计算loss function 得到相关图像，其中红色越深，损失函数太大，蓝色越深越小。使用穷举的方法耗费资源太多。

4 Step3：best function

寻找某一个函数，使得损失函数最小。

Gradient descent：梯度下降

可以使用梯度下降的方法，去寻找损失函数最小的函数。

图4-1 梯度下降

寻找响应的w参数来使得损失函数最小。

随机选一个初值
计算初值的偏导数若偏导数增加则放弃，偏导数越小越好。，
利用权值计算下一个点进行求偏导
偏导数为0说明达到了局部最低点

两个参数情况下，梯度下降法：

随机选2个参数w，b
计算分别计算两个参数处的偏微分，分别对每个数分别移动
梯度

图4-2 梯度下降结果

最后的目标当求到导数为0时，结果可得到局部最优值。但是当抵达导数为0时（驻点），算法也会停止。

图4-3 拟合出相关函数

5使用其他非线性模型

图5-1 非线性结果

发现使用非线性拟合结果更好，于是选择更高阶模型尝试，在更高阶的模型中，出现了明显的过拟合。在模型越来越复杂时，发现产生过拟合，复杂的模型在测试集上不一定是最好的。

收集更多的数据，通过收集更多的数据可以发现可能存在更多的隐藏因素影响。
使用δ函数可以进行函数的分情况处理。
正则化（regularization）：过拟合情况处理，增加一个正则惩罚项。使L最小同时，使w较小，这样可以使拟合的函数较为平滑。曲线平滑我们认为较为正确。

给偏压值加上正则化，在该项目中影响不大，对函数是否平滑没有影响。

图5-2 正则化之后的结果

我们发现，在λ变化时，寻找最合适的模型，该模型在测试集上正则化损失函数达到最小，我们更倾向于使曲线更平滑，但不是过于平滑。

wasser000

发布了14 篇原创文章 · 获赞 4 · 访问量 2795

私信关注

猜你喜欢

转载自blog.csdn.net/wasser000/article/details/89892321

李宏毅机器学习笔记（2）： Regression

李宏毅机器学习——学习笔记（6） logistics regression

李宏毅机器学习-2017-Regression学习笔记

机器学习-Regression速记(李宏毅)

[李宏毅-机器学习]回归Regression

李宏毅机器学习笔记3：Classification、Logistic Regression

李宏毅机器学习笔记01（regression）

李宏毅机器学习笔记04（Classification: Logistic Regression）

李宏毅机器学习笔记-02 Regression

李宏毅机器学习笔记-1.Regression

【李宏毅机器学习笔记】1、回归问题（Regression）

【李宏毅机器学习笔记】5、Logistic Regression

李宏毅机器学习代码笔记-Regression

【机器学习李宏毅课程笔记】01.Regression

李宏毅机器学习课程笔记2：Classification、Logistic Regression、Brief Introduction of Deep Learning

李宏毅机器学习总结笔记2- regression（回归）和regularization（正则化）

李宏毅机器学习入门P3 Regression-Case Study 笔记（P2无笔记）

【机器学习（李宏毅）】二、Regression: Case Study

机器学习-Logistic Regression速记(来自李宏毅视频)

李宏毅机器学习p4 regression demo

李宏毅机器学习-2017-Logistic Regression

[李宏毅-机器学习]逻辑回归Logistic Regression

李宏毅Machine Learning 学习笔记（1) Regression

李宏毅- Logistic Regression 笔记

李宏毅机器学习课程笔记Lesson1-Regression - Case Study

李宏毅机器学习课程笔记1：Regression、Error、Gradient Descent

李宏毅机器学习入门P3 Regression-Case Study 笔记

李宏毅机器学习P11 Logistic Regression 笔记

李宏毅机器学习笔记——01.回归（Regression）—Demo

李宏毅机器学习笔记-06 逻辑回归（Logistic Regression）

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)