papéis para ler
Se a seguinte marca é lida ou não lida
-
UMA IMAGEM VALE 16X16 PALAVRAS: TRANSFORMADORES PARA RECONHECIMENTO DE IMAGENS EM ESCALA
[Concluído] Notas: 2022.11.18 -
CrossViT: Transformador de visão multiescala de atenção cruzada para classificação de imagem
[concluído] Notas: 2022.11.19 -
Swin Transformer: Hierarchical Vision Transformer usando Shifted Windows
-
ECA-Net: canal de atenção eficiente para redes neurais convolucionais profundas
-
Pyramid Vision Transformer: um backbone versátil para previsão densa sem convoluções
-
Tokens-to-Token ViT: treinando transformadores de visão desde o início no ImageNet
-
Repensando as dimensões espaciais dos transformadores de visão
-
Codificações posicionais condicionais para transformadores de visão