线性回归损失函数的推导 - 代码天地

线性回归损失函数的推导

其他 2018-10-13 19:48:02 阅读次数: 0

线性回归模型可以表示为：
$h_θ(x) =\sum_{i=1}^n{θ_iX_i} = θ^TX$

其中 $X$ 是我们的数据集， $h_θ(x)$ 是估计值， $θ$ 是我们要求的参数。
假定 $y^{(i)}$ 是数据集中样本 $x^{(i)}$ 的标签，则 $y^{(i)}$ 与 $h_θ(x^{(i)})$ 之间有一个误差，我们记作ϵ，即
$ϵ = y^{(i)} - h_θ(x^{(i)})$

对于线性回归模型，我们的一个基本假设是，对于各个样本点来说，ϵ是独立同分布的，这样，根据独立同分布的中心极限定理，当样本点很多时，ϵ应该服从均值为0，方差为 $σ^2$ 的高斯分布。注意！这是我们进行以下推导的前提，如果在实际项目中该假设不成立，则我们的结论也不成立，整个线性回归问题的算法将会被推翻。

这样，我们有：
$p(ϵ^{(i)}) = \frac{1}{\sqrt{2π}σ}exp\bigg(-\frac{\big(ϵ^{(i)}\big)^2}{2σ^2}\bigg)$

也就是：
$p(y^{(i)}|y^{(i)};θ) = \frac{1}{\sqrt{2π}σ}exp\bigg(-\frac{\big(y^{(i)}-θ^Tx^{(i)}\big)^2}{2σ^2}\bigg)$

由于各个样本是独立的，则它们的联合概率密度就是各自的概率密度的乘积。则似然函数
$L(θ) = \prod_{i=1}^mp(y^{(i)}|y^{(i)};θ) \newline = \prod_{i=1}^m\frac{1}{\sqrt{2π}σ}exp\bigg(-\frac{\big(y^{(i)}-θ^Tx^{(i)}\big)^2}{2σ^2}\bigg)$
取对数，得到
$logL(θ) = log\prod_{i=1}^m\frac{1}{\sqrt{2π}σ}exp\bigg(-\frac{\big(y^{(i)}-θ^Tx^{(i)}\big)^2}{2σ^2}\bigg) \newline =\sum_{i=1}^mlog\frac{1}{\sqrt{2π}σ}exp\bigg(-\frac{\big(y^{(i)}-θ^Tx^{(i)}\big)^2}{2σ^2}\bigg) \newline = m log\frac{1}{\sqrt{2π}σ} - \frac{1}{σ^2}\frac{1}{2}\sum_{i=1}^m(y^{(i)}-θ^Tx^{(i)})^2$
要使得上述函数取最大值，则需要
$\frac{1}{2}\sum_{i=1}^m(y^{(i)}-θ^Tx^{(i)})^2$
最小。这样，我们就得到了线性回归的损失函数：
$J(θ) = \frac{1}{2}\sum_{i=1}^m(y^{(i)}-θ^Tx^{(i)})^2$
通常我们将损失函数写成
$J(θ) = \frac{1}{2m}\sum_{i=1}^m(y^{(i)}-θ^Tx^{(i)})^2$
其中m是样本的数量，这样可以消除样本数量不同对于J(θ)的影响。

猜你喜欢

转载自blog.csdn.net/ajaccio8899/article/details/82924425

线性回归损失函数的推导

线性回归和逻辑回归损失函数推导

线性回归损失函数推导-最大似然

逻辑回归损失函数推导

线性回归损失函数求解

LR回归原理和损失函数的推导

逻辑回归损失函数推导及求导

再谈线性回归与逻辑回归-损失函数

线性回归、逻辑回归、损失函数

机器学习线性回归（四）：线性回归的损失函数

使用线性回归推导函数实现线性回归

logstic回归损失函数及梯度下降公式推导

sklearn中逻辑回归（logistic regression）的损失函数推导

LR损失函数推导

损失函数的总结与推导

分类损失函数的推导

线性回归理论推导

线性回归数学推导

线性回归推导

线性回归算法推导

线性回归详细推导

线性回归（含推导）

线性回归的数学推导

线性回归损失函数为什么要用平方形式

【机器学习算法】基于最小二乘损失(MSE)的多元线性回归解析解推导

(吴恩达机器学习)线性回归代价函数推导

局部加权线性回归函数公式推导(转载)

逻辑回归损失函数

回归损失函数

softmax 损失函数与梯度推导

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)