机器学习-线性回归的推导过程 - 代码天地

机器学习-线性回归的推导过程

其他 2020-04-18 11:15:38 阅读次数: 0

表面理解的线性

对于给定的一组输入值x和输出值y，我们假定其关系为线性的，就会得出：
y = kx+b，即我们在大学前接触到的最基本的线性方程，只要我们求出k和b来，就可以求出整条直线上的点，这就是很多人认为的线性：
在这里插入图片描述
简单来说很多人认为：
线性回归模型假设输入数据和预测结果遵循一条直线的关系

但是，这种理解是一叶障目。

线性的含义

线性回归模型是：利用线性函数对一个或多个自变量（x 或 (x1,x2,…xk)）和因变量（y）之间的关系进行拟合的模型。

也就是说，线性回归模型构建成功后，这个模型表现为线性函数的形式。

线性函数的定义是：一阶（或更低阶）多项式，或零多项式。

当线性函数只有一个自变量时，y = f(x)。
f(x) 的函数形式是：

f(x) = a + bx （a、b 为常数，且 b≠0）—— 一阶多项式
或者 f(x) = c (c 为常数，且 c≠0) —— 零阶多项式
或者 f(x) = 0 —— 零多项式

但如果有多个独立自变量，y=f(x1,x2,…,xk) 的函数形式则是：

f(x1,x2,…,xk)=a+b1x1+b2x2+…+bkxk
也就是说，只有当训练数据集的特征是一维的时候，线性回归模型可以在直角坐标系中展示，其形式是一条直线。

换言之，直角坐标系中，除了平行于 y 轴的那些直线之外，所有的直线都可以对应一个一维特征（自变量）的线性回归模型(一元多项式函数)。

但如果样本特征本身是多维的，则最终的线性模型函数是一个多维空间内的[一阶|零阶|零]多项式。

总结一下：特征是一维的，线性模型在二维空间构成一条直线；特征是二维的，线性模型在三维空间中构成一个平面；若特征是三维的，则最终模型在四维空间中构成一个体，以此类推。

在这里插入图片描述

线性回归的推倒

拟合

举个例子，我们的一个系统里边有两个特征值（x1和x2），这两个特征值共同决定了一个标签（y），而我们需要采用线性回归的方法去推倒x1和x2对于y的影响程度（参数）。
此时假设θ1是x1的参数，θ2是x2的参数，则有：

这个式子是代表了一个点，如果将所有的点都带入其中，就会在一个三维空间中描出所有的店，进而绘制出一个拟合平面，如下图：

将上述的式子整合为简短的表达方法为：

其中n为特征值的个数

误差

众所周知，当我们吧数据进行拟合后，不可能所有的数据均落在拟合线或者拟合平面内，因此拟合值跟实际值之间肯定会产生一个误差（我们用ε来表示误差），因此对于每个样本点来说：

一般来说误差具有独立同分布的特点，并且符合正态分布，其均值为0，方差为θ的平方：

由于误差服从正态分布：

我们将误差函数与正态分布的公式组合（其中μ为0 ）：

将误差公式代入上述式子中：

在这里我们引入似然函数，似然函数在统计学中扮演着重要的角色，我们可以简单理解为什么样的参数跟我们的数据组合后恰好是真实值：

因为这个函数是一个累乘的式子，为了方便计算，我们将其取对数，将乘法变成加法，即为对数似然：

将式子展开化简：

根据概率和统计中所学的知识，我们知道，对同一个似然函数，如果存在一个参数值，使得它的函数值达到最大的话，那么这个值就是最为“合理”的参数值。化简后减数和被减数均为正数，要使函数获得最大值，那么我们就要使减数越小越好：

此时我们要求的就是J(θ)的极小值：

因为这个函数本质上来说是一个面，因此它的极值一般会出现在偏导为0的地方，于是我们对J(θ)分别对x和y求偏导：

如果偏导为0，则：

评估方法

我们最常用的评估方法为：

其取值越接近于1，我们认为模型的拟合程度越好。

Frank-Han

发布了64 篇原创文章 · 获赞 46 · 访问量 3万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_42737442/article/details/99674262

机器学习-线性回归的推导过程

机器学习——线性回归的原理，推导过程，源码，评价

机器学习之线性回归（包含推导过程）

机器学习之----线性回归推导

【机器学习】线性回归数学推导

机器学习多元线性回归模型推导

【机器学习】逻辑回归过程推导

机器学习笔记:线性回归、逻辑斯蒂回归推导

机器学习之线性回归模型相关算法推导

(吴恩达机器学习)线性回归代价函数推导

机器学习——线性回归原理推导与算法描述

机器学习之线性回归公式推导

机器学习入门之线性回归算法推导

机器学习笔记之四——线性回归原理以及推导

【机器学习】算法原理详细推导与实现(一):线性回归

Python 机器学习算法一之线性回归的推导及实战

机器学习多元线性回归的数学原理推导

机器学习基础——推导线性回归公式

机器学习推导+python实现（一）：线性回归

机器学习白板推导系列三线性回归

机器学习4-线性回归算法推导

线性回归，加权回归，推导过程

【机器学习算法推导】简单线性回归与多元线性回归

机器学习--Logistic回归计算过程的推导

【机器学习算法】Logistic回归计算过程的推导

机器学习-线性回归理论推导-最小二乘法理论推导

（转）线性回归数学推导（详细过程）

logistics回归学习过程推导

机器学习——从线性回归到逻辑回归【附详细推导和代码】

机器学习-线性回归

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)