SuperViT: Supertransformador de visión - Code World

SuperViT: Supertransformador de visión

Enterprise 2023-05-08 09:47:01 views: null

inserte la descripción de la imagen aquí Este artículo está dirigido principalmente aReducir el consumo computacional de Vision Transformer, se propone un nuevo método. En ViT, sabemos que la cantidad de tokens de Transformador es inversamente proporcional al tamaño del parche, lo que significa que cuanto menor sea el tamaño del parche, mayor será el costo computacional del modelo, y cuanto mayor sea el parche, mayor será la pérdida del modelo. efecto. Esto es contrario a nuestro propósito. El autor de SuperViT mejora el rendimiento desde dos aspectos: 多尺度的patch分割y 多种保留率. Minimice la cantidad de cálculo para acelerar el cálculo y mantener un mejor rendimiento del modelo. Básicamente, no hay ningún problema con este método en la clasificación de imágenes, pero en el campo de la superresolución, el descarte de píxeles seguirá afectando seriamente el rendimiento del modelo.

Enlace original: Super Vision Transformer

Transformador de súper visión

Abstracto
1. Introducción
2 Método
2.1 División de parches de varios tamaños
2.2 Tasa de mantenimiento de tokens múltiples
3 Conclusión

Supongo que te gusta

Origin blog.csdn.net/qq_45122568/article/details/125480313

SuperViT: Supertransformador de visión

software de visión

Visión artificial (4) -Aplicación de visión artificial

Visión binocular en algoritmos de visión por computadora

visión general de auditoría de SAP

Fuente de luz de visión artificial

Objetivo de reconocimiento de visión artificial

Visión artificial: referencia de selección de fuente de luz de visión artificial

visión general CIELab modelo de color

9.1 Visión general de -1 índice

aplicaciones de visión artificial basado Zynq

1 Visión general de Redes Neuronales

Experimento de visión artificial 3

Unity: simula la visión de IA

Ejercicios diarios de visión artificial.

Visión de Python usando visión artificial en el póquer

Visión general de los diversos algoritmos de ordenación

Conversión de sistemas de coordenadas en visión artificial

Evaluación de cámaras industriales de visión artificial

Modelo de visión artificial - Modelo de distorsión

Aprendizaje de tecnología de visión artificial (actualización continua)

Detección de objetos de visión monocular

《Transformadores de visión con diversificación de parches》

La corrección de la visión binocular estereoscópica

Resumen de atención en visión artificial

Aplicación de visión por computadora basada en matlab

Mecanismo de Atención en Visión por Computador

Visión artificial: calibración de la cámara

Métodos de triangulación en fotogrametría (visión artificial)

Descripción general de la visión artificial

Recomendado

Clasificación

Diario

Más

2024-04-27(28)

2024-04-26(22)

2024-04-25(34)

2024-04-24(31)

2024-04-23(29)

2024-04-22(5)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)