经典机器学习算法的数学推导 - 代码天地

经典机器学习算法的数学推导

其他 2021-11-25 22:49:42 阅读次数: 0

线性回归

为什么叫h(x)

为什么用θ表示参数

θ是向量还是矩阵？

为什么用x表示特征

为什么X是一个 $R^{d}$ 来表示的向量

为什么在表格添加一列1 ?便于矩阵计算

为什么用 $\varepsilon$ 表示误差？

K-means

基础概念：

1.要得到簇的个数，需要指定K值

2.质心：均值，即向量各维取平均即可

3.距离的度量：常用欧几里得距离和余弦相似度（先标准化）

4.优化目标：就是每个簇内每个样本点到簇中心的距离之和最小

必须掌握的技巧

1.提出常数和取对数

2.只关注含变量的部分

3.用向量表示数组

4.转置符号的处理

5.与对称阵求偏导的相关公式

$XX^{T}$ 是对称矩阵

对于式子 $\theta XX^{T}\theta ^{T}$ 对θ求偏导结果是两倍的对称阵乘变量（2 $XX^{T}$ $\theta$ ）

6.矩阵求导公式

都是对θ求导：我转你不转，你转我不转

$\partial \theta ^{T}X^{T}y = X^{T}y$

$\partial \theta X^{T}y = ( X^{T}y)^{T}$

7.如何消去一个矩阵

$X^{T}\theta$ -> θ 需要左乘 $(X^{T})^{-1}$

8.如何理解梯度下降是沿梯度的反方向

因为梯度一般是上升的为了下山，应该往梯度的反方向走

9.如何理解分别对每个参数分别优化

因为所有的前提是独特征立的，既然特征是独立的，那么特征的系数（参数）也可以认为是独立的

10.只关注需要求偏导的变量的部分

对 $\theta _{j}$ 求偏导，那么其他 $\theta x$ 的结构都是常数项，只有 $x_{j}$ 和 $\theta _{j}$ 有关

必须记住的表示方法

1.用求和形式表示多项式，偏置项合并到关于θ的向量里

2.让损失函数越小越好

3. $\varepsilon$ 是独立并且具有相同的分布服从均值为0，方差为θ^2的高斯分布

$\varepsilon$ 为什么是独立的？误差是由样本产生的，而样本之间是独立的

$\varepsilon$ 为什么是同分布的？因为默认样本是同批产生的

$\varepsilon$ 为什么服从的是高斯分布？

θ是矩阵还是数值？

高斯分布和正态分布的关系？

为什么用高斯分布来表征？因为偏离均值特别多的值很少出现

4.高斯分布与多元高斯分布的数学表现形式

高斯分布

$p(\varepsilon )=\frac{1}{\sqrt[2]{2\pi }\varepsilon }exp(-(\varepsilon -0)^{2}/2\sigma^{^{^{2}}}))$

$\varepsilon$ 是均值

$\sigma$ 是方差

5.多元高斯分布

线性回归误差的高斯分布

得到线性回归误差的高斯分布是

p(y|x;θ)越大越好

6.似然函数

似然函数有什么用？就是描述什么样的参数和特征值组合后是真实值，所以似然函数都是越大越好

为什么似然函数是连乘的形式？因为默认误差是独立同分布的，所以联合概率分布是可以拆成各自概率分布连乘

猜你喜欢

转载自blog.csdn.net/weixin_45955767/article/details/121169223

经典机器学习算法的数学推导

机器学习反向传播算法的数学推导

数学推导+纯Python实现机器学习算法：逻辑回归

机器学习——梯度下降算法数学推导

机器学习算法原理系列篇8：线性回归算法的数学推导

【机器学习】线性回归数学推导

经典机器学习算法

【机器学习基础】数学推导+纯Python实现机器学习算法4：决策树之ID3算法

【机器学习】梯度上升算法核心思想剖析和数学公式推导

机器学习决策树算法之——理论推导与数学原理

深度学习与机器学习算法推导汇总

【机器学习算法推导】支持向量机

【机器学习算法推导】逻辑回归

机器学习算法原理及推导——目录

机器学习--BP算法推导理解

机器学习分享——反向传播算法推导

常用机器学习算法原理及推导

机器学习——SMO算法推导与实践

梯度算法推导 (机器学习必读02)

【机器学习】机器学习的经典算法

机器学习的经典算法与应用

机器学习经典算法总结

【机器学习】【高等数学】傅里叶变换的解释与推导

机器学习 (三): 反向传播数学推导 & 神经网络

机器学习多元线性回归的数学原理推导

【机器学习】【数学推导】最小二乘法（线性）

【机器学习】【数学推导】支持向量机SVM（hard margin硬间隔详细推导过程）

【机器学习】【数学推导】神经网络(NN)及误差逆传播(BP详细推导过程)

【机器学习算法推导】高斯混合模型GMM与EM算法

机器学习之数学系列（二）逻辑回归反向传播数学推导

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)