Comprensión de tareas de visión por computadora: reconocimiento de imágenes, detección de objetivos, segmentación semántica, segmentación de instancias, segmentación panorámica y las tres principales conferencias

  • Reconocimiento de imágenes: principalmente un problema de clasificación común. Ingrese la imagen en la red neuronal y la salida es la probabilidad de que la muestra actual pertenezca a cada categoría. Por lo general, se selecciona el que tiene la probabilidad más alta como resultado de la predicción de la muestra.
  • Detección de destino: la ubicación aproximada de los objetos comunes en la imagen se detecta mediante un algoritmo, generalmente representado por un cuadro delimitador, y se clasifica la información de categoría del objeto en el cuadro delimitador. Los métodos habituales son de una etapa y de dos etapas ... La principal diferencia radica en si se divide en dos etapas (si generar primero un buzón de sugerencias regional y luego realizar clasificación y regresión).
  • Segmentación semántica: clasificación a nivel de píxel, analizando la clasificación de cada píxel, pero sin distinguir diferentes objetos de la misma categoría.
  • Segmentación de instancias: la combinación de detección de objetivos y segmentación semántica. En comparación con la detección de objetivos, la segmentación de instancias consiste en clasificar cada píxel. Las soluciones de segmentación de instancias se pueden clasificar en dos tipos, ascendentes y descendentes. (Primero la segmentación semántica, luego la detección de objetivos ... Primero la detección de objetivos y luego la segmentación semántica)
  • Segmentación panorámica: una combinación de segmentación semántica y segmentación de instancias. En comparación con la segmentación de instancias, la segmentación panorámica agrega la segmentación de fondo y así sucesivamente.

 

En visión por computadora, las tres conferencias principales generalmente se consideran : CVPR, ICCV y ECCV.

1. ICCV (IEEE International Conference on Computer Vision), cuanto más simple es el nombre, más fuerte suele ser. Suele celebrarse cada dos años. El más reciente se llevó a cabo en Seúl, Corea del Sur en 2019, en China y en Beijing en 2005. Los artículos de la conferencia serán indexados por la IE.

2. La CVPR (Conferencia IEEE sobre Visión por Computadora y Reconocimiento de Patrones) generalmente se lleva a cabo una vez al año, pero el lugar siempre ha sido Estados Unidos, aproximadamente cada junio. La CVPR tiene estándares de contratación más estrictos: la tasa de aceptación de la conferencia en su conjunto no suele ser superior al 30% y la proporción de trabajos para informes orales no supera el 5%.

3. ECCV (European Conference on Computer Vision), que suele celebrarse cada dos años. Se aceptan alrededor de 300 artículos en todo el mundo para cada conferencia. Los principales artículos aceptados son de los mejores laboratorios e institutos de investigación en los Estados Unidos y Europa. El número de artículos en China continental es generalmente entre 10-20. La tasa de aceptación de los trabajos ECCV2010 es del 27%.

Por lo general, debe echar un vistazo al oral de cada reunión.

El sitio web del ICCV es el siguiente:

http://www.informatik.uni-trier.de/~ley/db/conf/iccv/index.html

El sitio web de ECCV es el siguiente:

http://www.informatik.uni-trier.de/~ley/db/conf/eccv/index.html

El sitio web de CVPR es el siguiente:

http://dblp.uni-trier.de/db/conf/cvpr/index.html


 

Supongo que te gusta

Origin blog.csdn.net/JACKSONMHLK/article/details/106157767
Recomendado
Clasificación