吴恩达机器学习学习笔记第二章：单变量线性回归 - 代码天地

吴恩达机器学习学习笔记第二章：单变量线性回归

其他 2018-08-09 19:56:12 阅读次数: 0

模型描述:

训练集（training set）：是监督学习中独有的概念，由我们人喂给电脑的既有既有特征x又有结果y的数据。下图x是房子面积 ,y是房屋对应的价格

符号记法解释：

（x^(1),y^（1））代表训练集的第一行的数据 x表示输入 y表示输出

监督学习算法的工作流程：

2.假设函数（Hypothesis）:

里面有θ0和θ1两个参数，参数的改变将会导致假设函数的变化

数据会以很多点的形式给我们，我们想要解决回归问题，就需要将这些点拟合成一条直线，找到最优的θ0和θ1来使这条直线更能代表所有数据。

举个例子比如说下图所示一开始我们随意的设θ0=0 θ1=0.5 即y=0.5x 用这条线去拟合我们的数据

发现拟合效果很差点都不在线上显然参数还需要进一步优化那如何优化呢？.

这就需要使用代价函数来求解了

3.代价函数：

代价函数在李航教材也叫损失函数吴恩达进行了一些区别初学阶段不用过度的区分：

平方误差代价函数的主要思想就是将实际数据给出的值与我们通过参数θ0 θ1拟合出的线的对应函数值做差然后再平方再求和并除以2m，这样就能求出我们拟合出的直线与实际的差距了。

那么代价函数中为什么分母会有个2m?首先m是训练集的数量除以m做的其实就是一个取平均，跟期望一个道理，还多了个2是因为后面会对代价函数求导，平方求导会有个2正好与分母抵消方便后续计算。

代价函数用来衡量假设函数的准确性,这个代价函数的值越小就代表模型拟合的越好。

4. 什么叫等高线？

对于一个参数为θ0 θ1的二元函数（下图这是一个任意的假设函数不是代价函数别弄混）

对上面的图像投影后由于不同位置陡峭程度不一样形成一个等高线

可以看成是一座大山，地面测量大山各点的海拔高度，映射到平面上。高度相同的用线连接起来，形成的这个图就是等高线图

它看着像是一圈圈的大树年轮，越靠近中心海拔越高

中间的圆心就是损失函数对应值最低的位置对应3D图的z=j(θ0, θ1)=0

在等高线上每个点的θ0和θ1不同但是损失值j(θ0, θ1)相同

红色下降到0的速度比黄色下降到0要快（红比黄更陡）

如红笔：100→50→0 而黄色就是100→90→80……→0

5. 梯度下降法(Gradient Descent)：

我们需要用一个算法来使我们的损失函数变小，其中一个方法就是梯度下降法

接下来我就叙述一下梯度下降法:

直观上来形容梯度下降法就是完成一个三部曲:

Step1:先随意初始化一组参数的值比如说取十字星上面那个红色山顶的尖上作为起点

Step2: 在这个点附近寻找最陡峭的方向然后朝着这个方向走

Step3:每走一步重复一次step2最直到我们找到全局或者局部最小值

用我们生活中的例子来说就是：把这个算法看成是我们爬山现在在某个点要下山每走一步找出当前最佳的下山位置直到下去(这里简单说一下两个数学概念：

方向导数：函数在某点沿着特点方向上的变化率

梯度：梯度是一个向量它的方向与最大方向导数的方向一致它的模是方向导数的最大值为了加深理解可以看高等数学方向导数与梯度的概念)

不难看出从不同的起点出发会导致不同的局部最优解

我们选一个合适的学习率α然后重复进行这个式子的运算直到这个偏导数为0 或者说θj不变

使用过程中要注意的是：参数（本例中为两个参数θ0，θ1）要同时更新：

而不是先更新一个再更新另外一个：

α称为学习率(learning rate)永远是一个正数,若α太小，那我梯度移动得就很慢，要很多步才能达到局部最优点；

若α很大，那我可能移动一次直接跳过了局部最优点甚至可能发散

注意我通过梯度下降法得到的局部最低点是和初始值的选择有关的

当θ1的初始点就在局部最优点时斜率为0 学习就停止了或者说从另外个初始点开始一直走走到局部最优点那我们的学习也停止了

不管初始点是选在左还是右即：从左到右还是从右到左都是OK的因为对这个函数左到右的斜率是负减负就变成正了故我的θ1越来越往右走右到左斜率为正减正越来越往左走所以不管是哪种这个”爬行的虫子”都会往中间靠

6.梯度下降法应用：

将梯度下降法应用到我们构造的最小化平方差的代价函数当中：

通过计算：不难得出偏导数为：

将偏导数代入式子：（偏导数就是一个函数里有多个变量某个变量里包含另外一个变量偏导就是两个变量之间的变化率关系（本人水平有限说不清楚）知识点请见高等数学多元函数微分学-0-）

（再次强调要同时更新我们的参数）

经过反复更新我们的参数θ0 θ1都达到最佳值时我们的代价函数就有了最小值也即说明我们想用于预测的假设函数最靠谱

我们应用梯度下降的时候如果遇到这种函数就很可能

陷入红圈所示的局部最优

但是通过线性回归得到的代价函数总是一个碗型：

我们称他是一个凸函数（弓形函数或碗型都叫凸函数）

这里他的图形是凹进去的但我们也说他是凸函数

他的极小值就是最小值，他的局部最优解就是全局最优解

凹进去的凸函数：一个函数的图形是凹的的充分条件是函数的二阶导数大于0 凹的定义是对于函数上任意两个点恒有：两点函数值之和的一半小于两个点之和一半的函数值[f(x1)+f(x2)]/2<f(x1/2+x2/2) （更多数学内容请见高等数学一元函数微分学的凹凸性）

后面会学习一个叫正规方程组的方法（干的活儿和梯度下降一样但是需要你的线性代数知识）而梯度下降更适合于数据大的

猜你喜欢

转载自blog.csdn.net/weixin_42415485/article/details/81096553

吴恩达机器学习学习笔记第二章：单变量线性回归

机器学习笔记 -吴恩达（第二章：单变量线性回归）

【吴恩达机器学习笔记】第二章单变量线性回归

第二章单变量线性回归-机器学习老师板书-斯坦福吴恩达教授

机器学习笔记(吴恩达)——单变量线性回归

第二章-单变量线性回归算法深度之眼_吴恩达机器学习作业训练营

吴恩达机器学习（第二章）----线性回归

吴恩达学习笔记—— 二、单变量线性回归

吴恩达机器学习笔记-第二章

吴恩达《机器学习》学习笔记二——单变量线性回归

吴恩达机器学习课程笔记（二）单变量线性回归

吴恩达机器学习课程笔记章节二单变量线性回归

吴恩达机器学习 Coursera 笔记(二) - 单变量线性回归

吴恩达机器学习笔记（二）——单变量线性回归

吴恩达机器学习笔记（二）--单变量线性回归

吴恩达机器学习笔记（二）单变量线性回归

吴恩达机器学习（二）线性回归 1/3 —— 单变量线性回归

吴恩达机器学习 - 单变量线性回归习题

（吴恩达机器学习）单变量线性回归

《吴恩达机器学习》2 单变量线性回归

吴恩达机器学习笔记--多变量线性回归

机器学习笔记(吴恩达)——多变量线性回归

吴恩达机器学习--单变量线性回归【学习笔记】

吴恩达《机器学习》学习笔记四——单变量线性回归（梯度下降法）代码

吴恩达机器学习学习笔记第五章：多变量线性回归

吴恩达机器学习系列理论加实践(二、单变量线性回归及matlab实践)

吴恩达机器学习(二) 单变量线性回归(Linear Regression with one variable)

笔记：《吴恩达机器学习》——网易云课堂课程[绪论+单变量线性回归]

吴恩达机器学习笔记 —— 2 单变量线性回归

吴恩达机器学习笔记4-单变量线性回归

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)