机器学习：正规方程(Normal Equation)的推导 - 代码天地

机器学习：正规方程(Normal Equation)的推导

其他 2018-11-11 21:32:14 阅读次数: 0

在coursera上看了Andrew Ng的《Machine Learning》课程，里面讲到了正规方程(Normal Equation)，现在在此记录一下推导过程。
假设函数(Hypothesis Function)为：

h_{θ} (x) = θ_{0} + θ_{1} x_{1} + θ_{2} x_{2} + \dots + θ_{n} x_{n}

$h_\theta(x)=\theta_0+\theta_1x_1+\theta_2x_2+\cdots+\theta_nx_n$
此处我们可以令 $x_0=1$ .
代价函数(Cost Function):

J (θ) = J (θ_{0}, \dots, θ_{n}) = \frac{1}{2 m} \sum_{i = 1}^{m} (h_{θ} (x^{(i)}) - y^{(i)})^{2}

$J(\theta)=J(\theta_0,\ldots,\theta_n)=\frac {1} {2m} \sum_{i=1}^{m} {(h_\theta(x^{(i)})-y^{(i)})^2}$
我们想要代价函数的最小解，对代价函数进行求导。因为对于向量我们有

z^{T} z = \sum_{i} z_{i}^{2}

$z^Tz=\sum_{i} z_i^2$ ,所以：

J (θ) = \frac{1}{2 m} (X θ - y)^{T} (X θ - y)

$J(\theta)=\frac {1}{2m}(X\theta-y)^T(X\theta-y)$
因为 $\frac {1} {2m}$ 部分对最终的解没影响，为了便于书写和计算，我们可以先将这部分舍去。对方程的转置进行化简：

J (θ) = (θ^{T} X^{T} - y^{T}) (X θ - y)

$J(\theta)=(\theta^TX^T-y^T)(X\theta-y)$

J (θ) = θ^{T} X^{T} X θ - (X θ)^{T} y - y^{T} X θ + y^{T} y

$J(\theta)=\theta^TX^TX\theta-(X\theta)^Ty-y^TX\theta+y^Ty$
因为 $x\theta和y$ 都是矢量，所以这两者相乘先后顺序没有关系，所以可以化简成：

J (θ) = θ^{T} X^{T} X θ - 2 (X θ)^{T} y + y^{T} y

$J(\theta)=\theta^TX^TX\theta-2(X\theta)^Ty+y^Ty$
接着方程

J (θ) 对 θ

$J(\theta)对\theta$ 进行求导:

\frac{\partial}{\partial θ} J (θ) = 2 X^{T} X θ - 2 X^{T} y = 0

$\frac {\partial}{\partial\theta}J(\theta)=2X^TX\theta-2X^Ty=0$ 1
$\frac {\partial}{\partial\theta}J(\theta)=0时，得到最合适\theta$

X^{T} X θ = X^{T} y

$X^TX\theta=X^Ty$
两边同时乘以 $X^TX$ 的逆矩阵，得：

θ = (X^{T} X)^{- 1} X^{T} y

$\theta=(X^TX)^{-1}X^Ty$
此即为正规方程。当

θ = (X^{T} X)^{- 1} X^{T} y

$\theta=(X^TX)^{-1}X^Ty$ 时，代价方程有最优解。

关于矩阵、向量、标量的一些求导https://blog.csdn.net/xidianliutingting/article/details/51673207 ↩

猜你喜欢

转载自blog.csdn.net/Mao_Jonah/article/details/82119408

机器学习：正规方程(Normal Equation)的推导

正规方程推导（Normal equation）

normal equation（正规方程）

机器学习：Normal equation公式推导

Normal Equation推导

标准方程法(normal equation)公式推导

Machine Learning-Normal Equation Noninvertibility （正规方程）公式推导及矩阵的求导法则:

机器学习之正规方程法推导

机器学习：正规方程参数θ的推导过程

机器学习_正规方程（最小二乘法）的推导

机器学习入门 Linear Regression与Normal Equation

正规方程法(Normal Equation)原理以及与梯度下降法的区别

04_TrainingModels_Normal Equation(正态方程,正规方程) Derivation_Gradient Descent_Polynomial Regression

正规方程（含推导过程） from 吴恩达的机器学习

正规方程推导详解

Normal Equation

【吴恩达机器学习】学习笔记1.3（Normal Equation& 与梯度下降比较）

之前和看的正规方程的推导

【机器学习】线性回归之Normal Equation（矩阵求导与线性代数视角）

机器学习7（正规方程）

Five Ways to Derive the Normal Equation

机器学习2-正规方程的学习

机器学习算法 ---- 正规方程组

机器学习之——正规方程法

吴恩达机器学习——正规方程

机器学习之正规方程法

吴恩达机器学习-正规方程

机器学习入门~复习正规方程

贝尔曼方程（Bellman Equation）

正规方程求解特征参数的推导过程

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)