Linear Regression 线性回归（线性拟合）问题——机器学习 - 代码天地

Linear Regression 线性回归（线性拟合）问题——机器学习

其他 2018-08-06 19:57:56 阅读次数: 0

Linear Regreesion

在现实生活中普遍存在着变量之间的关系，有确定的和非确定的。确定关系指的是变量之间可以使用函数关系式表示，还有一种是属于非确定的（相关），比如人的身高和体重，一样的身高体重是不一样的。

线性回归：

线性回归是一种监督学习，即给定n个特征，每个特征M个样本集，通过训练nM个数据，即将这些训练数据带入到拟合函数h中，使得其与监督数据满足最小二乘，得到n+1个权值。

0、实际实例

某市的房价受部分因素影响的表格如下（采用Andrew Ng cs229中的数据）

Living area（feet^2）	#bedrooms	Price (1000$s)
2104	3	400
1600	3	330
2400	3	369
1416	2	232
3000	4	540

1、拟合模型

我们的目标是，对于以下拟合函数h，

$h(x)=\sum_{i=0}^nw_ix_i=w_0+w_1x_1+w_2x_2+\cdots+w_nx_n$

或可写作

$h(X)=W^TX$

其中W为权值列向量，X为各特征输入数据的列向量，均为(n+1)×1维。

2、训练数据的带入

我们的目标是将训练数据带入我们的拟合函数h中，使其与监督数据最小二乘。

对于第i组数据，设数据集为 $x^{(i)}=\left[x^{(i)}_1,x^{(i)}_2,\cdots,x^{(i)}_n \right]^T$ 。监督数据集为 $y=[y_1,y_2,\cdots,y_M]^T$ 。

那么将数据集带入h中，共M组数据中，第j组数据的拟合结果为

$h(x^{(i)})=w_0+w_1x^{(i)}_1+\cdots+w_nx^{(i)}_n$

那么我们的目标是使 $\sum(h(x^{(i)})-y_i)$ 最小，下节将具体定义损失函数

3、损失函数的定义

定义 $h=\left[h(x^{(1)}),h(x^{(2)}),\cdots,h(x^{(M)})\right ]^T$ ，那么有

$h=XW$

其中

$X=\begin{bmatrix} 1 &x^{(1)}_1 & x^{(1)}_2 &\cdots &x^{(1)}_n \\ 1 &x^{(2)}_1 & x^{(2)}_2 &\cdots &x^{(2)}_n \\ 1 &\vdots &\vdots & &\vdots \\ 1 &x^{(M)}_1 &x^{(M)}_2 &\cdots &x^{(M)}_n \end{bmatrix}$ $W=\begin{bmatrix} w_0\\ w_1\\ \vdots\\ w_n \end{bmatrix}$

那么根据最小二乘准则，定义损失函数J(W)，如下

$J(W)=\frac1{2M}\sum_{i=0}^M(h(x^{(i)})-y_i)^2$

显然有

$J(W)=\frac1{2M}(XW-y)^T(XW-y)$

4、求解方法

J(W)是关于W的函数，即确定W使得minJ(W)，分以下两种情况：

(a).X满秩时（X可逆），直接算求导等于0

J(W)可写作：

$\begin{align*} J(W)=&\frac12(XW-y)^T(XW-y)^T\\ &=\frac12\left[W^TX^TXW-W^TX^Ty-y^TXW+y^Ty\right] \end{align}$

那么对求导J(W)=0得

$\begin{align*} &\frac{\partial J(W) }{\partial W}=\frac12\left[2X^TXW-2X^Ty \right]=0\\ &X^TXW=X^Ty\\ &W=(X^TX)^{-1}X^Ty \end{align}$

即得到了最优解。

注意有：

$\begin{align*} &\frac{\partial (W^TX^TXW) }{\partial W}=(X^TX+(X^TX)^T)W=2X^TXW \end{align}$

(b).X不满秩（X不可逆），使用数值方法，梯度下降法

梯度下降算法是一种求局部最优解的方法，对于F(x)，在a点的梯度是F(x)增长最快的方向，那么它的相反方向则是该点下降最快的方向，具体参考wikipedia。

原理：将函数比作一座山，我们站在某个山坡上，往四周看，从哪个方向向下走一小步，能够下降的最快；

注意：当变量之间大小相差很大时，应该先将他们做处理，使得他们的值在同一个范围，这样比较准确。

1）首先对θ赋值，这个值可以是随机的，也可以让θ是一个全零的向量。

2）改变θ的值，使得J(θ)按梯度下降的方向进行减少。

描述一下梯度减少的过程，对于我们的函数J(θ)求偏导J：

Repeat until convergence：{

下面是更新的过程，也就是θi会向着梯度最小的方向进行减少。θi表示更新之前的值，-后面的部分表示按梯度方向减少的量，α表示步长，也就是每次按照梯度减少的方向变化多少。

}

对损失函数求偏导如下：

使用矩阵表示（方便计算）

从概率层面解释-回归模型的目标函数：

基本上每个模型都会有一个对应的目标函数，可以通过不同的最优化求解方法（梯度下降，牛顿法等等）对这些对应的目标函数进行求解。线性回归模型，我们知道实际上是通过多个自变量对自变量进行曲线拟合。我们希望找到一条可以较好拟合的曲线，

那我们如何判断一条曲线的拟合程度的好坏。上面讲到，我们采用的是最小二乘法（预测值和真实值得误差的平方和），那为什么要用这个作为目标函数呢？

可以从中心极限定理、高斯分布来分析：

1.中心极限定理：

设有n个随机变量，X1,X2,X3,Xn,他们之间相互独立，并且有相同的数学期望和均值。E(X)=u;D(x)=δ2.令Yn为这n个随机变量之和。

Zn为X这几个变量的规范和。

2.高斯分布

假的给定一个输入样本x，我们得到预测值和真实值间的存在的误差e，那么他们的关系如下：

而这里，我们就可以假设e服从标准的高斯分布。

为什么呢？回归模型的最终目标是建立自变量x和y之间的关系，我们希望通过x可以较为准确的表示结果y。而在实际应用场景中，很难甚至不可能把导致y结果的所有变量（特征）都找到，放到回归模型里面。

我们只存放那些认为比较重要的特征。根据中心极限定理，把那些对结果影响比较小的(假设独立分布)之和认为是符合正态分布是合理的。

那么x和y的条件概率：

那么知道一条样本的概率，我们就可以通过极大估计求似然函数，优化的目标函数如下：

　通过取对数我们可以发现极大似然估计的目标函数和最小平方误差是一样。

在概率模型中，目标函数的极大和极小与极大似然估计是等价的。

假设随机变量为Y，和普通变量x存在相关关系，由于Y是随机变量，对于x的各个确定值，Y有它的分布（高斯）。

假设为:

使用极大似然估计可求解。

我们知道对于下面公式：

y为随机变量，在c=E(y)时达到最小，这表明以E(y)作为y的近似是最好的。

猜你喜欢

转载自blog.csdn.net/a493823882/article/details/81299009

Linear Regression 线性回归（线性拟合）问题——机器学习

线性回归（Linear Regression）

线性回归（linear regression)

线性回归linear regression

机器学习：线性回归法（Linear Regression）

机器学习线性回归模型（linear regression）

Python机器学习 — 线性回归（Linear Regression）

机器学习-----线性回归浅谈（Linear Regression）

机器学习之线性回归（Linear Regression）

机器学习1——线性回归Linear Regression

机器学习笔记——线性回归（Linear Regression）

机器学习一：线性回归 (Linear Regression)

机器学习-线性回归(Linear Regression)

机器学习之linear regression（线性回归）

再读线性回归 Linear Regression (过拟合问题)

线性回归 Linear Regression (1)

再读线性回归 Linear Regression

线性回归模型（Linear regression）

机器学习-TensorFlow建模过程 Linear Regression线性拟合应用

应用：线性回归问题（Linear Regression）

python机器学习之我见：线性回归（Linear Regression）

机器学习之线性回归算法(Linear Regression)

机器学习入门 03 线性回归法（Linear Regression）

机器学习 -- 线性回归（Linear Regression）原理及算法实现

机器学习系列-tensorflow-03-线性回归Linear Regression

机器学习实战（七）线性回归（Linear Regression）

机器学习sklearn之线性回归（linear regression）LR

机器学习 | 算法笔记- 线性回归（Linear Regression）

机器学习算法之线性回归算法（Linear Regression）

【吴恩达机器学习】线性回归 Linear Regression

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)