如何降低Transformer的计算复杂度

编程语言 2023-07-11 18:13:51 阅读次数: 0

如何降低Transformer的计算复杂度

Efficient Transformers.

本文目录：

Transformer的计算复杂度
改进自注意力机制

1. Transformer的计算复杂度

(1) Transformer的典型结构

典型的Transformer结构如上图所示，其整体计算量来源于模型中的自注意力层和全连接层两部分，本文主要讨论自注意力层的改进。

(2) 自注意力机制的运算

由于计算机中乘法的计算速度比加法慢，因此在衡量计算复杂度时主要考虑乘法。对于矩阵乘法$(a, b)\times(b,c)$，计算复杂度为$O(abc)$。

① 计算查询矩阵Q,键矩阵K,值矩阵V

对于经过词嵌入并加入位置编码的输入序列$$X=[x_1,...,x_N] \in \Bbb{R}^{D_x×N}$$，将其通过仿射变换映射为查询矩阵$Q$,键矩阵$K$,值矩阵$V$：

$$ Q = W^qX

猜你喜欢

转载自blog.csdn.net/universsky2015/article/details/131672259

如何降低Transformer的计算复杂度

Transformer的计算复杂度

如何降低函数的圈复杂度

如何降低求素数的复杂度

时间复杂度与空间复杂度如何计算

降低圈复杂度

如何无痛降低 if else 面条代码复杂度

如何计算时间复杂度

如何计算程序的时间复杂度

计算复杂度

联表查询降低复杂度

降低输入流复杂度

【算法】降低时间复杂度的方法

程序优化--降低复杂度

03如何计算算法的复杂度算法的时间复杂度和空间复杂度详解

Swin Transformer 时间复杂度的分析

时间复杂度和空间复杂度如何计算？

【第1076期】如何无痛降低 if else 面条代码复杂度

开发者说：如何使用插件降低上传文件部署服务的复杂度

时间复杂度的计算

计算时间复杂度

圈复杂度计算

SQL 的复杂度计算

时间复杂度计算

复杂度计算规则

算法复杂度的计算

如何计算时间复杂度--及其分析

算法基础如何计算时间复杂度

「算法分析」如何计算时间复杂度?

Transformer和自注意力机制Self-Attention详解和时间复杂度计算+Image Transformer简介

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)