线性回归模型原理及推导 - 代码天地

线性回归模型原理及推导

其他 2019-03-09 17:21:10 阅读次数: 0

https://www.toutiao.com/a6665460843691377160/

今天我们来看一个最常见的机器学习模型——线性回归（linear regression）模型。先举个例子让你明白什么是线性回归。

现在我们有房屋面积和价格的一些数据，如下图：

线性回归模型原理及推导

现在我们想知道的是，如果给一个新的房屋面积130m²，能否根据已知的数据来预测新的面积对应的价格是多少呢？这时，线性回归模型就派上用场了。

我们先画出已知数据的散点图：

线性回归模型原理及推导

那线性回归要做什么呢？它是模拟出一条直线，让已知的数据点尽量落在直线上或直线周围。效果如下图红线所示：

线性回归模型原理及推导

用公式表示的话，这个线性模型就是一条直线：

f(x) = wx + b （1）

其中，w为系数，b为截距。

当我们的模型确定后，如果给定一个新数据x‘，只需把x‘带入（1）式，求得的y就是预测的价格了。

在谈如何确定w和b之前，我们先来思考一个问题：假如房屋价格不仅仅受面积因素影响呢？比如还有厕所数量、房屋高度、房屋楼层数等等因素，这时我们又该如何构建我们的线性模型呢？

其实跟（1）式一样，我们添加系数和输入即可：

线性回归模型原理及推导

假设我们有n个影响房屋价格的因素，对应的就是n个系数w。（2）式就是我们新的线性模型。那模型既然出来了，该怎么求w和b呢？在求解之前，我们应该了解到，模型预测的结果f(x)是和实际的结果y有一定出入的。也就是说，模型在对原始数据进行训练时，数据点并不一定都落在该模型上。这样就会产生误差，不同的w和b对应不同的线性模型，我们要找的就是误差最小的那个模型所对应的w、b的值。

首先第一步，我们要找一个代价函数（cost function），用它来衡量我们预测的误差，一般用平方和函数来表示：

线性回归模型原理及推导

其中，J就是我们的代价函数，f(x)是我们的预测值，y是训练集数据的实际值，m代表数据的个数。代价函数描述的其实是预测值和实际值差的平方和的均值，那我们在前面为什么要加个1/2呢？这纯粹是为了以后求导方便，而且并不影响我们对代价函数的优化。

然后，我们将预测函数f(x)做一个变形，写成向量乘积的形式。

线性回归模型原理及推导

则（2）式可改写为：

线性回归模型原理及推导

不难看出，f(x)可以写作w和x两个向量的乘积：

线性回归模型原理及推导

进一步缩写为：

线性回归模型原理及推导

其中，w和x均为n+1维列向量。再将（4）式代入（3）式，可得：

线性回归模型原理及推导

由f(x)可知，乘积项的求和可以写为两个向量乘积的形式。要想写成向量形式，我们需要将J(w)做一个变形：

线性回归模型原理及推导

展开，得到：

线性回归模型原理及推导

其中，X 为m*(n+1)维矩阵，m是数据的样本个数，n是每一个数据的特征。w为参数向量，y为实际值向量。

OK，现在我们已经把代价函数化简完成了，但别忘了我们的目标是求当J(w)取最小值时，所对应w的值。可以证明J(w)为凸函数（证明过程暂略），所以当我们对J(w)求导时，令导数为0，J(w)即可取最小值，相应可求得w。（注意w为向量）

在求导之前，我们先记住几个结论，一会就直接用了：

线性回归模型原理及推导

随后，我们令k=Xw-y，则J(w)可写为

线性回归模型原理及推导

对其求导，应用结论1，得

线性回归模型原理及推导

我们先求k'，运用结论3，可得

线性回归模型原理及推导

运用结论5，将其改写为

线性回归模型原理及推导

运用结论2，继续求导可得

线性回归模型原理及推导

运用结论4、5，并化简

线性回归模型原理及推导

将k=Xw-y代入并展开，可得

线性回归模型原理及推导

到此为止，我们的求导过程就完成了。接下来，令导数为0，求得w的值即可。令J'(w)=0，可得

线性回归模型原理及推导

一般情况下，矩阵

线性回归模型原理及推导

为可逆矩阵（不可逆的情况我们以后会讨论），即可求得w的解为

线性回归模型原理及推导

Bingo！（5）式就是我们在代价函数取最小值时，求得的参数向量w。在实际应用中，计算机会帮我们对（5）式求解，得到w的值。但当我们的数据量非常大时，可能会拖慢运行速度。这时，另一种对J(w)优化的算法——“梯度下降法”就该上场了，我们下篇再对它进行介绍。

猜你喜欢

转载自blog.csdn.net/weixin_42137700/article/details/88297126

线性回归模型原理及推导

线性回归模型求解推导

线性回归算法原理推导

【ML模型详细推导1】- 线性回归

机器学习多元线性回归模型推导

01-线性回归原理推导

(5) 线性回归算法原理推导

机器学习——线性回归（数学原理推导+Python代码实现+模型评估+实验分析）

线性回归和 logistic回归算法原理推导

线性回归、逻辑回归算法原理推导及python代码实现

线性回归理论推导

线性回归数学推导

线性回归推导

线性回归算法推导

线性回归详细推导

线性回归（含推导）

线性回归的数学推导

机器学习之线性回归模型相关算法推导

机器学习——线性回归原理推导与算法描述

多元线性回归方程原理及其推导

机器学习笔记之四——线性回归原理以及推导

机器学习——线性回归的原理，推导过程，源码，评价

【机器学习】算法原理详细推导与实现(一):线性回归

机器学习多元线性回归的数学原理推导

Python线性回归模型原理及其应用

机器学习--线性回归模型原理

线性模型，线性回归，对数几率回归(Logistic regression)的理解与推导(深度学习前戏( ╯□╰ ))

精细推导机器学习：逻辑斯蒂回归模型原理

Logistic回归推导与原理

逻辑回归原理推导

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)