【SwinTransformer】大杀四方的 Swin Transformer 详解及改进

企业开发 2022-07-09 14:15:48 阅读次数: 0

文章目录

Swin Transformer

Swin Transformer

Shifted Window 窗口自注意力到全局自注意力，窗口建模到全局建模。

BackBone

在这里插入图片描述
上图为 Swin-Tiny的网络架构图。

Swin-T: C = 96, layer numbers = {2, 2, 6, 2}
Swin-S: C = 96, layer numbers ={2, 2, 18, 2}
Swin-B: C = 128, layer numbers ={2, 2, 18, 2}
Swin-L: C = 192, layer numbers ={2, 2, 18, 2}

Stage 0

Images：224 * 224 * 3 （H * W * 3）
Patch Partition： 56 * 56 * 48 （H/4 * W/4 * 48）

Stage 1

Linear Embedding：56 * 56 * 96 （H/4 * W/4 * C）。类似于卷积操作。

Swin Transformer Block * 2：3136 * 96。

Stage 2

Patch Merging：28 * 28 * 192 （H/8 * W/8 * 2C）。
Swin Transformer Block * 2：784 * 192。

Stage 3

Patch Merging：14 * 14 * 384 （H/16 * W/16 * 4C）。
Swin Transformer Block * 6：196 * 384 。

Stage 4

Patch Merging：7 * 7 * 768 （H/32 * W/32 * 8C）。
Swin Transformer Block * 2：49 * 768。

Patch Merging 操作

Swin Transformer Blocks 计算单元

进入LayerNorm(层归一化)，然后进行多头自注意力(W-MSA)，进行LayerNorm(层归一化)，进行MLP操作
进入LayerNorm(层归一化)，然后进行移动多头自注意力(SW-MSA)，进行LayerNorm(层归一化)，进行MLP操作

基于窗口自注意力计算复杂度推导

Multi-head Self-Attention模块（MSA）
Window Multi-head Self-Attention模块（W-MSA）

https://blog.csdn.net/qq_45588019/article/details/122599502
在这里插入图片描述

掩码操作

后续……

改进

后续……

猜你喜欢

转载自blog.csdn.net/qq_44824148/article/details/123965142

【SwinTransformer】大杀四方的 Swin Transformer 详解及改进

swin transformer详解

Swin-transformer详解

Swin-Transformer 详解

swin_transformer源码详解

swin-transformer代码详解

Swin Transformer

Swin-Transformer网络结构详解

Transformer变种—Swin Transformer

Swin Transformer详解: Hierarchical Vision Transformer using Shifted Windows

改进YOLO：YOLOv5结合swin transformer

2021-Swin Transformer

Swin Transformer介绍

Swin-Transformer理解

swin transformer代码讲解

Swin Transformer解读

【读论文】Swin Transformer

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 论文翻译 + 网络详解

timm使用swin-transformer

windows cpu训练swin transformer

Swin_Transformer源码解读

【论文精读 02】Swin Transformer

Swin-Transformer算法解析

Swin Transformer模型——pytorch实现

【Paper Note】Video Swin Transformer

Swin Transformer测试过程

YOLOv5+Swin Transformer

小白学习Swin-Transformer

检测分割算法改进(篇五) 引入Swin Transformer做检测网络Backbone

【Swin-T onnx】swin transformer 转 onnx Error解决

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)