从vision transformer的cls_token说开去（包含DPT） - 代码天地

从vision transformer的cls_token说开去（包含DPT）

其他 2021-11-28 23:23:57 阅读次数: 0

在这里插入图片描述

https://www.bilibili.com/video/BV18Q4y1o7NY
只有c0被保留下来并做最后的softmax分类
这个公式表示的很清楚了

在这里插入图片描述
从 transformer cls_token说开去：
transformer的encoder和conv encoder提取出的编码格式就不同。
transformer的编码格式：num_patches(+1,由于有特殊token在前，例如ViT中的分类token，DPT中的read token),embedding_dim

怎么从transformer的编码返回到原图？
其实是一件非常自然的事
在这里插入图片描述

作者提出了三种read策略：
1.直接把read token忽略 2.resnet的做法——把read token加到其他token上3.dense net的做法：把read token和其他token concat，然后对每个token仿射变换到embedding_dim

猜你喜欢

转载自blog.csdn.net/qq_44065334/article/details/120608707

从vision transformer的cls_token说开去（包含DPT）

ViT: Vision transformer的cls token作用？

Vision Transformer

Vision Transformer详解

Vision Transformer（ViT）

Vision Transformer 模型详解

Vision Transformer with Deformable Attention

SuperViT：Super Vision Transformer

Vision Transformer学习笔记

Vision Transformer原理分析

轻量级 Vision Transformer - MobileViT

ViT（Vision Transformer）算法入门

【第30篇】Vision Transformer

Vision Transformer（VIT）学习笔记

Transformer 综述 & Transformers in Vision: A Survey

DAT：Vision Transformer with Deformable Attention

Vision Transformer 论文 + 详解（ ViT ）

Vision Transformer(ViT)及后续工作

Vision Transformer (ViT)及各种变体

Vision Transformer综述 part II

Vision Transformer综述总篇

Vision Transformer(VIT 网络架构)

vision transformer的位置编码总结

Video Transformer | ViViT: A Video Vision Transformer

双视觉Transformer（Dual Vision Transformer）

DL-Paper精读：Vision Transformer

推荐必读 Vision Transformer 论文集

关于Vision Transformer的复现&其环境配置

【18】Vision Transformer：笔记总结与pytorch实现

Vision Transformer的Pytorch源码各模块实现

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)