MatMul矩阵乘法优化基础 - 代码天地

MatMul矩阵乘法优化基础

企业开发 2023-07-18 19:57:35 阅读次数: 0

矩阵乘法定义

其他性质

矩阵分块

计算特点：

A的大小是M*K，B的大小是K*N，结果矩阵C的大小是M*N。

标准做法是C的每个元素为A的一行与B一列的内积，C参考程序：

for (int i = 0; i < M; ++i) {
    for (int j = 0; j < N; ++j) {
        double dot = 0.0;
        for (int z = 0; z < K; ++z) {
            dot += A(i, z) * B(z, j);
        }
        C(i, j) = dot;
    }
}

1. A的每行计算是独立的，可以单独取出A的第n行，与B运算后得到C的第n行。

2. B的每列计算是独立的，可以单独取出B的第m列，与A计算后可以得到C的第m列。

3. B的第k行元素只与A的第k列的元素进行交互。可以认为取出B的第k行与A的第k列元素，以此计算出C的一层，总共K层“千层饼”叠加得到C（OpenBLAS gemm从零入门 - 知乎）。（上面cij的累加项只考虑第k项便是第k层）。这里其实也可以看成是把A和B分别划分为宽度和高度分别为1的分块矩阵然后做矩阵乘法。当前也可以划分为其他高度。

这三个理解可以参考变换下面程序的3个loop不同顺序（假设C已经初始化为0），例如把K循环放到最外层，或者N循环放最外层。

for (int i = 0; i < M; ++i) {
    for (int j = 0; j < N; ++j) {
        for (int z = 0; z < K; ++z) {
            C(i, j) += A(i, z) * B(z, j);
        }
    }
}

ref

https://en.wikipedia.org/wiki/Matrix_multiplication

OpenBLAS gemm从零入门 - 知乎

高等代数理论基础30：矩阵的分块 - 简书

猜你喜欢

转载自blog.csdn.net/u013701860/article/details/123156587

MatMul矩阵乘法优化基础

RTKLIB——matmul(矩阵乘法函数）

numpy 三种矩阵乘法multiply, matmul和 dot

numpy矩阵乘法中的multiply，matmul和dot

n维矩阵乘法，tf.matmul的transpose_a参数

Python numpy 矩阵乘法multiply()、dot()、 matmul()、‘ * ‘、‘@‘辨析

矩阵乘法优化dp

OpenACC 优化矩阵乘法

DP优化：矩阵乘法

矩阵乘法的优化

基础练习矩阵乘法

java 矩阵乘法基础

基础练习-矩阵乘法

基础练习：矩阵乘法

tf.matmul（）矩阵乘法和 tf.multiply（）点乘

矩阵乘法优化线性递推

cuda Sgemm矩阵乘法优化

矩阵乘法优化之分块矩阵

MapReduce 基础算法【矩阵乘法】

基础训练矩阵乘法

1571:基础练习矩阵乘法

基础训练：矩阵乘法

试题基础练习矩阵乘法

基础训练-矩阵乘法

[详解][学习笔记] 矩阵/矩阵乘法/矩阵快速幂优化递推理解矩阵乘法

形态形成场（矩阵乘法优化dp）

【Matrix multiplication 】矩阵乘法之bitset优化

矩阵乘法 | 多线程优化加速

Explosion 【HDU - 5036】【bitset优化矩阵乘法】

Java实现矩阵乘法及优化方法

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)