矩阵求导 - 代码天地

矩阵求导

其他 2018-07-13 01:30:28 阅读次数: 0

维基百科上： http://en.wikipedia.org/wiki/Matrix_calculus ，根据Y与X的不同类型（实值，向量，矩阵），给出了具体的求导公式，以及一堆相关的公式。

[转载]机器学习中常用的矩阵求导公式

其实在实际的机器学习工作中，最常用到的就是实值函数y对向量X的求导，定义如下（其实就是y对向量X的每一个元素求导）：

[转载]机器学习中常用的矩阵求导公式

实值函数对矩阵X求导也类似：

[转载]机器学习中常用的矩阵求导公式

因为机器学习（这里指的是有监督的机器学习）的一般套路是给定输入X，选择一个模型f作为决策函数，由f(X)预测出Y'。而得到f的参数θ（往往是向量），需要定义一个loss函数（一般都是实值函数），描述当前f预测值Y'与实际的Y值的接近程度。模型学习的过程就是求使得 loss函数 L(f(X),Y)最小的参数θ。这是一个最优化问题，实际应用中都是用和梯度相关的最优化方法，如梯度下降，共轭梯度，拟牛顿法等等。

其实只要掌握上面这个公式，就能搞定很多问题了。

为了方便推导，下面列出一些机器学习中常用的求导公式，其中andrew ng那一套用矩阵迹的方法还是挺不错的，矩阵的迹也是实值的，而一个实数的迹等于其本身，实际工作中可以将loss函数转化成迹，然后在求导，可能会简化推导的步骤。

矩阵的迹求导法则

矩阵的迹求导法则

猜你喜欢

转载自blog.csdn.net/u013185349/article/details/78265163

矩阵知识--相似矩阵，矩阵的迹，矩阵求导

【机器学习】梯度下降中矩阵的迹的求导证明

机器学习中对矩阵的迹（trace）求导的一些操作

矩阵的迹

矩阵的秩

什么是矩阵的迹

矩阵的迹（Tr）

矩阵的秩的求法

矩阵的秩和秩的性质

matlab 计算矩阵的迹

矩阵求导，向量求导

矩阵的求导

矩阵求导

矩阵的秩、满秩矩阵

矩阵求导（下）——矩阵对矩阵的求导

【Matlab】矩阵对矩阵求导

矩阵对矩阵求导

【线性代数】矩阵的迹运算

线性代数（六）-矩阵的秩

矩阵的秩为1 的解题思路

求Matlab中矩阵的秩和迹

矩阵的迹trace相关问题的证明

线代：1.5矩阵的秩(zhi)

MATLAB与线性代数--矩阵的秩

线性代数[矩阵的秩]

向量组的秩、矩阵的秩

矩阵式管理

矩阵求导（上）——标量对矩阵的求导

向量、矩阵求导（二）

向量矩阵求导

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)