TransRAC: Codificación de correlación temporal multiescala con transformadores para el conteo de acciones repetitivas, CVPR 2022 Oral

论文: https://arxiv.org/abs/2204.01018 [2204.01018] TransRAC: codificación de correlación temporal multiescala con transformadores para el conteo de acciones repetitivas (arxiv.org)

Código: https://github.com/SvipRepetitionCounting/TransRAC GitHub - SvipRepetitionCounting/TransRAC: (CVPR 2022 Oral) Implementación oficial: TransRAC Conjunto de datos: https://svip-lab.github.io/dataset/RepCount_dataset.html

Laboratorio de visión y percepción inteligente de Shanghaitech (SVIP) (svip-lab.github.io)

Segmentación de piezas de aprendizaje a través de la adaptación de dominio no supervisada de vehículos sintéticos, CVPR 2022 Oral

Papel: https://arxiv.org/abs/2103.14098

Código: GitHub - qliu24/render-3d-segmentation

数据：UDA-Part: un conjunto de datos de segmentación de piezas basado en modelos gráficos 3D por computadora | Parte UDA

Segmentación generalizada de dominio consciente de la semántica, CVPR 2022 Oral

Documento: [2204.00822] Segmentación generalizada de dominio con conciencia semántica (arxiv.org)
Código:

GitHub - leolyj/SAN-SAW: este es el código relacionado con "Segmentación generalizada de dominio con conciencia semántica" (CVPR 2022)

MAXIM: MLP multieje para procesamiento de imágenes, CVPR 2022 Oral

Documento: [2201.02973] MAXIM: Multi-Axis MLP for Image Processing (arxiv.org)
Código: https://github.com/google-research/maxim

Verificación de correlación para recuperación de imágenes, CVPR 2022 Oral

论文：[2204.01458] Verificación de correlación para recuperación de imágenes (arxiv.org)
代码：GitHub - sungonce/CVNet: Implementación oficial de PyTorch de verificación de correlación para recuperación de imágenes, CVPR 2022 (presentación oral)

Repensar la segmentación semántica: una vista de prototipo, CVPR 2022 Oral

论文：[2203.15102] Repensar la segmentación semántica: una vista de prototipo (arxiv.org)
代码：GitHub - tfzhou/ProtoSeg: CVPR2022 (Oral) - Repensar la segmentación semántica: una vista de prototipo

Dual-AI: Aprendizaje de interacción de acción de doble ruta para el reconocimiento de actividades grupales, CVPR 2022 Oral

论文：[2204.02148] IA dual: Aprendizaje de interacción de actores de doble ruta para el reconocimiento de actividades grupales (arxiv.org)
代码：IA dual: Aprendizaje de interacción de actores de doble ruta para el reconocimiento de actividades grupales (mingfei.info)

Alineación visual densa supervisada por GAN, CVPR 2022 Oral

Documento: [2112.05143] Alineación visual densa supervisada por GAN (arxiv.org)
Código: https://github.com/wpeebles/gangealing
Proyecto: Alineación visual densa supervisada por GAN (wpeebles.com)

Estimación de profundidad de vista múltiple mediante la fusión de probabilidad de profundidad de vista única con geometría de vista múltiple, CVPR 2022 Oral

论文：[2112.08177] Estimación de profundidad de múltiples vistas fusionando la probabilidad de profundidad de una sola vista con geometría de múltiples vistas (arxiv.org)
代码：GitHub - baegwangbin/MaGNet: (CVPR 2022 - oral) Estimación de profundidad de múltiples vistas fusionando una Ver probabilidad de profundidad con geometría multivista

SeqFormer: Transformador secuencial para segmentación de instancias de video, ECCV 2022 Oral

SeqFormer: https://arxiv.org/abs/2112.08275

ÍDOLO: https://arxiv.org/abs/2207.10661

Dirección del código oficial: https://github.com/wjf5203/VNex

ECCV 2022 Oral | ¡Papel de partitura completa! Segmentación de instancias de video nuevo SOTA: SeqFormer e IDOL - zhihu.com

En Defensa de los Modelos Online para la Segmentación de Instancias de Video, ECCV 2022 Oral

En defensa de los modelos en línea para la segmentación de instancias de video - 知乎 (zhihu.com)

https://arxiv.org/abs/2207.10661

Segmentación semántica no supervisada a gran escala，TPAMI2022

Descarga del conjunto de datos: github.com/LUSSeg/ImageNet-S

Código de método convencional: github.com/LUSSeg/ImageNetSegModel

El método propuesto en el documento: github.com/LUSSeg/PASS

Dirección en papel: arxiv.org/pdf/2106.03149.pdf

TPAMI2022: Segmentación semántica no supervisada (LUSS) a gran escala y su conjunto de datos Image-S

Descubrimiento de máscaras de objetos con transformadores para segmentación semántica no supervisada

Dirección en papel: https://arxiv.org/pdf/2206.06363.pdf

Código fuente abierto: https://github.com/wvangansbeke/MaskDistill

Segmentación semántica no supervisada-MaskDistill: use Transformer para extraer datos anteriores, sin necesidad de que los datos etiquetados lleguen a SOTA

StructToken: repensando la segmentación semántica con Structural Prior

https://arxiv.org/pdf/2203.12612.pdf

Un nuevo paradigma para la segmentación semántica: Shanghai AI Lab, Beiyou y SenseTime propusieron conjuntamente StructToken

TokenMix: repensar la mezcla de imágenes para el aumento de datos en los transformadores de visión, ECCV 2022

Dirección en papel: https://arxiv.org/abs/2207.08409 [1]

Dirección del código: https://github.com/Sense-X/TokenMix [2]

ECCV 2022 cuelga MixUp y CutMix! ¡MMLab y SenseTime propusieron una súper estrategia de mejora de datos "TokenMix"! -Zhihu (zhihu.com)

Autoatención desviada a través de la agregación de tokens de múltiples escalas

Dirección en papel: https://arxiv.org/pdf/2111.15193.pdf

Dirección del código: https://github.com/OliverRensu/Shunted-Transformer

CVPR2022 Oral - Transformador derivado: Nueva red troncal de transformador visual multiescala

Pérdida de energía del árbol: hacia una segmentación semántica escasamente anotada

Dirección en papel: https://arxiv.org/pdf/2203.10739.pdf

Dirección del código: https://github.com/megvii-research/TreeEnergyLoss

CVPR2022-Tree Energy Loss: un nuevo método capaz de extender etiquetas de verdad de campo dispersas en segmentación semántica débilmente supervisada

Lectura intensiva de Tree Energy Loss: Hacia una segmentación semántica escasamente anotada_Griffin Valve Worker's Blog-CSDN Blog

Segmentación semántica débilmente supervisada por contraste de píxel a prototipo

Dirección en papel: https://arxiv.org/pdf/2110.07110.pdf

Dirección de código: no de código abierto

CVPR2022-Contraste de píxel a prototipo: aplicación del aprendizaje contrastivo a la segmentación semántica débilmente supervisada

Mapas de reactivación de clase para segmentación semántica débilmente supervisada, CVPR2022

Dirección en papel: https://arxiv.org/pdf/2203.00962.pdf

Dirección del código: https://github.com/zhaozhengChen/ReCAM

CVPR2022-Mapas de reactivación de clases: mapas de reactivación de clases para segmentación semántica débilmente supervisada

Aprendizaje colaborativo de conjuntos de datos cruzados para la segmentación semántica, AAAI 2022

Dirección en papel: https://arxiv.org/pdf/2103.11351.pdf

Dirección del código: https://github.com/wanglixilinx/CDCL

AAAI2022-Aprendizaje colaborativo de conjuntos de datos cruzados: Aprendizaje colaborativo de conjuntos de datos cruzados en segmentación semántica

Aprendizaje colaborativo de conjuntos de datos cruzados para la segmentación semántica - 知乎

Pyraformer: atención piramidal de baja complejidad para modelado y pronóstico de series temporales de largo alcance, ICLR 2022 oral

Dirección en papel: https://openreview.net/pdf?id=0EXmFzUn5I
Dirección de github: https://github.com/alipay/Pyraf

ICLR 2022 Oral | Introducción a Pyraformer, un algoritmo de código abierto utilizado por Ant Group para el modelado de tiempo de largo alcance

Descubriendo y explicando el cuello de botella de representación de las DNN , ICLR 2022 oral

Los cinco artículos con mayor puntuación en los artículos orales de ICLR 2022 "descubre y prueba el cuello de botella de la representación de redes neuronales" (puntuación 10,8,8,8) bazyd

Reconocimiento de conjunto abierto: ¿todo lo que necesita es un buen clasificador de conjunto cerrado? ，ICLR 2022 oral

Enlace en papel: https://arxiv.org/abs/2110.06207
Enlace del proyecto: https://github.com/sgvaze/osr_closed_set_all_you_need

¡Se complementan mutuamente! Mejorar la precisión de la clasificación de conjuntos cerrados del modelo puede mejorar la precisión de la detección de conjuntos abiertos (ICLR 2022 oral)

PICO: DESAMBIGUACIÓN DE ETIQUETAS CONTRASTIVAS PARA EL APRENDIZAJE PARCIAL DE ETIQUETAS, mejor artículo de ICLR 2022

Enlace de descarga: https://openreview.net/pdf?id=EhYjZy6e1gJ

Este artículo|Industry_ICLR 2022 Mejor interpretación de artículo

Aprendizaje no transferible: un nuevo enfoque para la verificación de la propiedad del modelo y la autorización de aplicabilidad, ICLR 2022 oral

Aprendizaje no transferible: un nuevo enfoque para la verificación de la propiedad del modelo y la autorización de aplicabilidad

Aprendizaje no transferible: un nuevo enfoque para la verificación de la propiedad del modelo y la autorización de aplicabilidad | AbrirRevisión

ICLR 2022 Oral: Aprendizaje no transferible (aprendizaje antitransferencia) bzdww

ICLR2022 sitio oral: zhuanlan.zhihu.com

La Universidad de Tsinghua y la Universidad Renmin de China ganaron premios, la Universidad de Zhejiang fue nominada y se entregó el premio ICLR 2022 Outstanding Paper Award- 知乎

blog de referencia

Lea los últimos 20 artículos orales de CVPR 2022 en un artículo_Blog de la comunidad de aprendizaje automático-CSDN Blog_cvpr oral