李宏毅机器学习入门P3 Regression-Case Study 笔记（P2无笔记） - 代码天地

李宏毅机器学习入门P3 Regression-Case Study 笔记（P2无笔记）

编程语言 2018-09-18 15:34:02 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/zgcr654321/article/details/82634277

Regression案例：

宝可梦的CP值预测。

Xcp，Xs，Xhp，Xw，Xh为输入，Y为输出。

假设Xcp与Y有很大关系。

下面根据P1笔记中的三个步骤来进行：

先建立一个模型。

使用一组训练数据来训练模型。

用Loss function L来衡量你的function：

f由w,b决定，故我们可以把L里面的参数换成w,b。

上图里面的图表中每一个点都是由w,b决定的一个function。颜色代表了对应的L(f)的值的大小，红色比较大，蓝色比较小。

下面我们要找出最好的function。

最好的function就是L(w,b)值最小时候的function。我们可以使用Gradient Descent方法来寻找L(w,b)min。

是个人为设定的参数，代表了学习的速率，这个值不宜太大也不宜太小。

多次学习之后的结果：

从不同的地方开始，可能会得到局部最优解(local minima)或全局最优解(global minima)。

上面是只有一个参数w的情况，如果有两个参数w和b呢？

每次gradient的结果可以用来表示（其实就是wn，bn）。

我们可以将所有的gradient的结果用类似等高线的图来表示出来：

当然如果有超过两个参数，我们也可以用gradient descent方法。我们用来表示多个参数的集合。

理想状态下我们每次更新，Loss function的值应当越来越小（越来越接近最优解），但实际并不是这样。

在理想状态中，我们找到local minima时，为0，但是在上图中可以看出，其实为0的点不止一个，比如saddle point点。在实际使用gradient descent算法时，我们往往不能恰好找到为0的点，实际操作时往往是找到小于一个设定值（接近0）时的点，这时候w不再更新。如图所示的绿色框指示的点，可以看到该点不一定就是local minima附近的点。

以上面宝可梦的训练数据，先训练模型，找出最合适的b和w：

再用一组测试数据，套用模型，计算其偏差：

可以看到偏差略大于训练数据的偏差，较为符合实际。

我们还可以选择其他model来减小误差：

显然这个模型的误差要更小，更加贴合实际。

需要注意的是，虽然这个model是个二次多项式，但它仍然是linear model。

我们继续尝试三次多项式的model。

尝试四次多项式的model。

我们可以看到test误差反而上升了。。。

尝试五次多项式的model：

显然从图像上就能看出这个model是不合理的。

test误差非常大。

model之间的关系：3次多项式是4次的子集合，4次是5次的子集合。

当model越来越复杂时，在training data上的error越来越低。

但是在testing data中，3次多项式的error最低。

可以看到在training data上表现最好的model在testing data上并不是表现最好的。这种情况称为overfitting（过度拟合）。而我们在实际应用中更关心model在testing data上的表现。

如果我们收集了更多的数据后，会发现显然有更多的隐藏因素影响宝可梦的CP值。

把不同种类的宝可梦用不同颜色区分，可以看到：

重新设计model function：

增加一个变量，宝可梦的种类Xs：

注意：这个model仍然是linear model。

上面这个model可以写成下面的形式，这样看起来是不是容易看出来是linear model了？

表示的值为。

假如输入，则上面的式子实际取值如下图（注意图中的所有w后应该补乘Xcp）。

用training data来训练这个新的model，再用testing data测试该model：

注意图中绿色线和黄色线重合了。

有什么其他的因素可能会影响宝可梦的CP值吗？

我们列出一些可能影响宝可梦CP值的因素。把这些因素全部加入model中。

Xhp表示hp值因素，Xh表示height因素，Xw表示weight因素。

可以发现又出现了overfitting现象。

我们尝试换一个Loss function，对Loss function参数进行改进，后面增加一项：。这样Loss function最小时，不仅是方差和最小，而且Wi的平方和也最小，Wi小意味着我们寻找的model的曲线较为平缓（因为斜率较小）。

这个参数是自己设的，适当大一些，找出的function会smoother。

我们对model的y函数也做一些改进，使曲线smoother。因为多数情况下smoother的function比较有可能是更加正确的function。

注意b这一项是曲线水平的高度，对曲线是否smooth没有影响。这个b（即bias）上不需要加regularization（正则化）。regularization（正则化）实际上说的就是加参数来调整对Loss function的影响程度这件事情。

本节结论：

实际情况是遇到新data时error往往更大。

猜你喜欢

转载自blog.csdn.net/zgcr654321/article/details/82634277

李宏毅机器学习入门P3 Regression-Case Study 笔记（P2无笔记）

李宏毅机器学习入门P3 Regression-Case Study 笔记

李宏毅机器学习课程笔记Lesson1-Regression - Case Study

【机器学习（李宏毅）】二、Regression: Case Study

1、【李宏毅机器学习（2017）】Regression - Case Study（回归-案例分析）

李宏毅机器学习p4 regression demo

李宏毅机器学习笔记3：Classification、Logistic Regression

李宏毅机器学习P11 Logistic Regression 笔记

Regression: Case Study

李宏毅机器学习笔记（2）： Regression

李宏毅机器学习——学习笔记（6） logistics regression

李宏毅机器学习-2017-Regression学习笔记

李宏毅机器学习笔记01（regression）

李宏毅机器学习笔记04（Classification: Logistic Regression）

李宏毅机器学习笔记-02 Regression

李宏毅机器学习笔记-1.Regression

【李宏毅机器学习笔记】5、Logistic Regression

【李宏毅机器学习笔记】1、回归问题（Regression）

李宏毅机器学习代码笔记-Regression

【机器学习李宏毅课程笔记】01.Regression

【李宏毅深度强化学习2018】P3 Q-learning（Basic Idea）

李宏毅机器学习（二）——回归案例分析 Regression Case Study（附上代码Python版本，Scala版本后续加上，见文尾另一博客）

李宏毅机器学习课程笔记2：Classification、Logistic Regression、Brief Introduction of Deep Learning

李宏毅机器学习总结笔记2- regression（回归）和regularization（正则化）

李宏毅机器学习笔记（3）

李宏毅机器学习P10 Classification 笔记

李宏毅机器学习 P14 Backpropagation 笔记

机器学习笔记P1(李宏毅2019)

李宏毅机器学习入门P1 Introduction of Machine Learning 笔记

[Operating System] {ud923} P2L3: Threads Case Study: PThreads

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)