Directorio de artículos
Tiempo de actualización-2019.12 primer borrador
0. Introducción
El primer paso para aprender la investigación previa a la tesis de VQA . Investigue la publicación de documentos en las principales conferencias de los últimos años para comprender el progreso en esta dirección, incluidos CVPR, ICCV, ECCV, ACM MM y AAAI . Después de eso, estoy listo para resumir los conjuntos de datos comúnmente utilizados y los métodos clásicos.
1. ACM MM
ACM MM es una importante conferencia internacional en el campo de la informática y la tecnología multimedia, que se centra en la integración y el procesamiento de la información de múltiples ángulos generada por diferentes medios digitales. El VQA es parte de sus multimedia de la comprensión del contenido de la materia allí (la comprensión del contenido multimedia ) La Visión y Lenguaje rama.
1.1 ACM MM 2019
- Hay 5 estadísticas incompletas (incluyendo Video / Visual Pregunta Respuesta)
Título de tesis | Autor |
---|---|
Red de interacción múltiple con relación de objeto para VideoQA | Universidad de Zhejiang |
Red de agregación aprendible con pérdida divergente para VideoQA | Universidad de Ciencia y Tecnología Electrónica |
Red de conmutación de tubos con preguntas para VideoQA | Universidad de Ciencia y Tecnología de China |
CRA-Net: red de atención de relaciones compuestas para control de calidad visual | Universidad de Ciencia y Tecnología Electrónica |
Atención de aprendizaje basada en borrado para control de calidad visual | Instituto de Automatización, Academia China de Ciencias |
1.2 ACM MM 2018
- Hay 4 estadísticas incompletas (incluyendo Video / Visual Pregunta Respuesta)
Título de tesis | Unidad de autor |
---|---|
Explore el razonamiento de varios pasos en el video de preguntas y respuestas | Universidad de Tianjin |
Adaptación rápida de parámetros para subtítulos de pocas imágenes y respuestas visuales a preguntas | Universidad del Sur de Ciencia y Tecnología |
Atención de diferencia de objeto: una atención relacional simple para la respuesta visual de preguntas | Universidad de Correos y Telecomunicaciones de Beijing |
Mejora de la respuesta visual a preguntas mediante el abandono | Instituto de Automatización, Academia China de Ciencias |
1.3 ACM MM 2017
- Hay 4 estadísticas incompletas (incluyendo Video / Visual Pregunta Respuesta)
Título de tesis | Unidad de autor |
---|---|
VideoQA a través del aprendizaje jerárquico en red de atención de doble nivel | Universidad de Zhejiang |
VideoQA a través de la atención gradualmente refinada sobre la apariencia y el movimiento | Universidad de Zhejiang |
2. CVPR
CVPR significa Conferencia sobre visión artificial y reconocimiento de patrones, y el nombre chino es Conferencia internacional sobre visión artificial y reconocimiento de patrones, que generalmente se celebra alrededor de junio de cada año.
2.1 CVPR 2019
- Hay 12 estadísticas incompletas (incluyendo Video / Visual Question Answer), pero las basadas en video parecen ser una.
2.2 CVPR 2018
- 不完全统计有 15 篇(包括Video / Visual Question Answer),但是基于视频的好像就一篇
2.3 CVPR 2017
- 不完全统计有 9 篇(包括Video / Visual Question Answer),没有基于视频的
3.3 CVPR 2016
- 不完全统计有 8 篇(包括Video / Visual Question Answer),没有基于视频的,而且看起来是刚起步
3. ICCV
ICCV 全称 International Conference on Computer Vision, 中文名为国际计算机视觉大会,每两年在全世界范围内召开一次,录用率比较低,所以在业内评价较高,是三大CV顶会中公认级别最高的。
3.1 ICCV 2019
- 不完全统计有 5 篇(包括Video / Visual Question Answer)
3.2 ICCV 2017
- 不完全统计有 6 篇(包括Video / Visual Question Answer)
3.3 ICCV 2015
- 听名字感觉像是第一篇
论文题目 | 作者单位 |
---|---|
VQA: Visual Question Answering |