VIT attention实现（paddle2.2） - 代码天地

VIT attention实现（paddle2.2）

企业开发 2023-06-04 19:12:27 阅读次数: 0

# ViT Online Class
# Author: Dr. Zhu
# Project: PaddleViT (https://github.com/BR-IDL/PaddleViT)
# 2021.11
import paddle
import paddle.nn as nn

paddle.set_device('cpu')

class Attention(nn.Layer):
    # TODO: 补全时，删除pass
    def __init__(self, embed_dim, num_heads, qkv_bias=False, qk_scale=None, dropout=0., attention_dropout=0.):
        super().__init__()
        self.num_heads = num_heads 
        self.attn_head_size = int(embed_dim / self.num_heads)
        self.all_head_size = self.attn_head_size * self.num_heads
        self.qkv = nn.Linear(embed_dim, self.all_head_size*3)
        if qk_scale == None:
            self.scales = self.attn_head_size ** -0.5
        else:
            self.scales = qk_scale
        self.proj = nn.Linear(self.all_head_size, embed_dim)
        self.attn_dropout = nn.Dropout(attention_dropout)
        self.proj_dropout = nn.Dropout(dropout)
        self.softmax = nn.Softmax(axis=-1)

    def transpose_multihead(self, x):
        new_shape = x.shape[:-1] + [self.num_heads, self.attn_head_size]
        x = x.reshape(new_shape)
        x = x.transpose([0, 2, 1, 3])
        return x
    
    def forward(self, x):
        qkv = self.qkv(x).chunk(3, axis=-1)
        q, k, v = map(self.transpose_multihead, qkv)
        attn = paddle.matmul(q, k, transpose_y=True)
        attn = attn * self.scales
        attn = self.softmax(attn)
        attn_weights = attn
        attn = self.attn_dropout(attn)
        z = paddle.matmul(attn, v)
        z = z.transpose([0, 2, 1, 3])
        new_shape = z.shape[:-2] + [self.all_head_size]
        z = z.reshape(new_shape)
        z = self.proj(z)
        z = self.proj_dropout(z)
        return z, attn_weights

def main():
    t = paddle.randn([4, 16, 96])
    print('input shape = ', t.shape)

    model = Attention(embed_dim=96, num_heads=8, 
                      qkv_bias=False, qk_scale=None, dropout=0., attention_dropout=0.)
    print(model)

    out, attn_weights = model(t)
    print(out.shape)
    print(attn_weights.shape)


if __name__ == "__main__":
    main()

猜你喜欢

转载自blog.csdn.net/lanmengyiyu/article/details/121640829

VIT attention实现（paddle2.2）

VIT中PatchEmbedding和Mlp的实现（paddle2.2版本）

resnet18 paddle2.2实现

ViT模型——pytorch实现

ViT

Visiom Transformer 代码实现--ViT

ViT/vit/VIT详解

极智AI | 详解 ViT 算法实现

ViT笔记以及其Pytroch实现

Visual Transformer (ViT)模型与代码实现（PyTorch）

Visual Transformer开端——ViT及其代码实现

4.一脚踹进ViT——ViT再审视与DeiT的实现

2.一脚踹进ViT——Attention机制原理及实现

视觉Transformer经典论文——ViT、DeiT的与原理解读与实现

ViT~6

Transformer【ViT】

Self-Attention 、 Multi-Head Attention 、VIT 学习记录及源码分享

【论文笔记】 VIT论文笔记，重构Patch Embedding和Attention部分

U-ViT：A ViT Backbone for Diffusion Models

从Transformer到ViT：多模态编码器算法原理解析与实现

CVPR 2023 | EfficientViT：让ViT在多个部署场景实现实时推理

CVPR 2023｜EfficientViT：让ViT更高效部署实现实时推理（附源码）

EfficientViT：让ViT更高效部署实现实时推理（附源码）

Visual Transformer (ViT) 代码实现 PyTorch版本-是一个详细的说明

深度学习论文: RepViT: Revisiting Mobile CNN From ViT Perspective及其PyTorch实现

VisionTransformer[VIT]，DETR

Vision Transformer（ViT）

【实验】vit代码

深度学习之ViT

FQ-ViT

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)