Seis tecnologías de visión artificial: clasificación de imágenes, detección de objetivos, seguimiento de objetivos, segmentación semántica, segmentación de instancias, reconstrucción de imágenes.

La visión por computadora es una simulación de la visión biológica utilizando computadoras y equipos relacionados. Su tarea principal es obtener información 3D de la escena correspondiente procesando las imágenes o videos recopilados, tal como lo hacen los humanos y muchas otras criaturas todos los días.

La visión por computadora es un área de investigación desafiante e importante tanto en ingeniería como en ciencia. La visión por computadora es un tema integral, que ha atraído a investigadores de diversas disciplinas a participar en su investigación. Estos incluyen informática e ingeniería, procesamiento de señales, física, matemática aplicada y estadística, neurofisiología y ciencia cognitiva, entre otros.


Entonces, antes que nada, ¿por qué aprender visión artificial?

¡Desde su aplicación, puedes ver claramente su importancia!

Ejemplos de aplicaciones de visión artificial incluyen sistemas para:

(1) Controlar un proceso, por ejemplo, un robot industrial;

(2) Navegación, por ejemplo, por vehículos autónomos o robots móviles;

(3) Eventos detectados, como videovigilancia y conteo de personas;

(4) organizar información, por ejemplo, bases de datos indexadas para imágenes y secuencias de imágenes;

(5) Modelado de objetos o entornos, como sistemas de análisis de imágenes médicas o modelos de terreno;

(6) Interacción, por ejemplo, cuando se ingresa a un dispositivo, para la interacción computadora-humano;

(7) Detección automática, por ejemplo, en aplicaciones de fabricación.

(8) Conducción autónoma de vehículos 

(9) reconocimiento facial 

1. Clasificación de imágenes

definición

La clasificación de imágenes es un método de procesamiento de imágenes que distingue diferentes tipos de objetos según las diferentes características reflejadas en la información de la imagen. Utiliza una computadora para llevar a cabo un análisis cuantitativo de las imágenes y clasifica cada píxel o área de la imagen o imagen en una de varias categorías para reemplazar la interpretación visual humana.

 Clasificación

1. Tecnología de indexación basada en características de color

2. Tecnología de clasificación de imágenes basada en texturas

3. Tecnología de clasificación de imágenes basada en formas

4. Tecnología de clasificación de imágenes basada en la relación espacial

2. Detección de objetivos

La detección de objetos, también llamada extracción de objetos, es una segmentación de imágenes basada en las características geométricas y estadísticas del objeto. Combina la segmentación y el reconocimiento de objetivos en uno, y su precisión y rendimiento en tiempo real son una capacidad importante de todo el sistema.

 

 Como rama importante de la visión por computadora, la tarea de detección de objetivos es encontrar la categoría y la ubicación del objetivo en una imagen o video. A diferencia de la clasificación de imágenes, la detección de objetos se centra en la búsqueda de objetos, y el objeto detectado debe tener una forma y un contorno fijos, mientras que la clasificación de imágenes puede ser cualquier objeto, incluidos objetos, atributos y escenas. La detección de objetivos ha logrado resultados muy notables en los campos del reconocimiento facial y la conducción automática.Los modelos clásicos de detección incluyen YOLOV3, SSD y Faster RCNN.

Combina la segmentación y el reconocimiento de objetivos en uno, y su precisión y rendimiento en tiempo real son una capacidad importante de todo el sistema. Especialmente en escenas complejas, cuando es necesario procesar múltiples objetivos en tiempo real, la extracción y el reconocimiento automáticos de objetivos son particularmente importantes.

Con el desarrollo de la tecnología informática y la amplia aplicación de los principios de visión por computadora, el uso de la tecnología de procesamiento de imágenes por computadora para rastrear objetivos en tiempo real se está volviendo cada vez más popular.El seguimiento dinámico en tiempo real y el posicionamiento de objetivos son importantes en los sistemas de transporte inteligentes. , sistemas de monitoreo inteligente y detección de objetivos militares Tiene una amplia gama de valor de aplicación en el posicionamiento de instrumentos quirúrgicos en cirugía de navegación médica.

3. Seguimiento de objetivos

El seguimiento de objetos tiene como objetivo seguir el movimiento de los objetos en un video.

Por lo general, la posición del objeto en el primer cuadro del video se da en forma de cuadro delimitador, y necesitamos predecir el cuadro delimitador del objeto en otros cuadros. El seguimiento de objetivos es similar a la detección de objetivos, pero la dificultad del seguimiento de objetivos es que no sabe de antemano cuál es el objetivo a rastrear, por lo que no puede recopilar suficientes datos de entrenamiento por adelantado para entrenar un detector especial.

El método discriminativo es más poderoso y preciso. Se puede utilizar para distinguir la diferencia entre el sujeto y el fondo y se ha convertido en el método de seguimiento preferido. También se conoce como seguimiento por detección y cae en la misma categoría que el aprendizaje profundo.

 4. Segmentación semántica

La segmentación semántica consiste en clasificar cada píxel de una imagen, y actualmente es muy utilizada en imágenes médicas y vehículos sin conductor . A juzgar por los artículos de los últimos años, este campo se divide principalmente en segmentación semántica supervisada , segmentación semántica no supervisada y segmentación semántica de video .

 La segmentación es una parte importante de la visión artificial, que divide la imagen completa en grupos de píxeles que se pueden etiquetar y clasificar. Más específicamente, la segmentación semántica intenta comprender el papel de cada píxel en una imagen determinada. Por ejemplo, no basta con detectar a una persona o un coche. También debe poder saber dónde están todos los límites. Para hacer una representación de este tipo, necesitamos predicciones densas en píxeles del modelo.

5. Segmentación de instancias

La segmentación de instancias es una tarea de nivel superior que combina la detección de objetos y la segmentación semántica

La segmentación de instancias clasifica todas las diferentes clases de instancias, por ejemplo, etiqueta diez autos con diez colores diferentes. En cuanto a la clasificación, suele haber una imagen principal y el objetivo es determinar cuál es realmente la imagen. Sin embargo, para segmentar todas las instancias, se requiere un proceso más complejo. Si tenemos una escena compleja con muchos objetos superpuestos y varios fondos, tenemos que clasificar todos los objetos y determinar sus diferencias, límites y relaciones entre ellos.

6. Reconstrucción de imágenes 

 En términos sencillos, tiene una foto antigua y desea reconstruir la imagen dañada en ella, que es la reconstrucción de la imagen. En 2013, Jay Chou incluso gastó 100 millones de dólares taiwaneses, utilizando la última "imagen virtual" de alta tecnología del especial de Hollywood. equipo de efectos "Reconstruction Technology" invitó a Teresa Teng a cantar con él, cumpliendo su deseo de cantar con la difunta "Reina de las Canciones" Teresa Teng.

 La visión artificial es una de las investigaciones más populares en la actualidad, es una investigación multidisciplinar que abarca informática (gráficos, algoritmos, investigación teórica, etc.), matemáticas (recuperación de información, aprendizaje automático), ingeniería (robots, NLP, etc.) , biología (neurociencia) y psicología (ciencia cognitiva). Debido a que la visión por computadora representa una comprensión relativa del entorno y el contexto visual, muchos científicos creen que la investigación en este campo sentará las bases para el desarrollo de la industria de la inteligencia artificial.


 Organización de una red neuronal de aprendizaje profundo + aprendizaje de visión por computadora CV (dos marcos principales pytorch/tensorflow + notas de material didáctico de código fuente) + NLP y otros materiales, con base python, procesamiento de imágenes opencv\procesamiento de lenguaje natural, aprendizaje automático, base matemática y otros recursos bibliotecas, si desea aprender inteligencia artificial o cambiar a una industria que paga mucho, los estudiantes universitarios son muy prácticos. No hay una rutina que proporcionar, +vx recursos internos gratuitos, banco de preguntas de inteligencia artificial, entrevista de Dachang, esquema de estudio de preguntas auto- esquema del curso de estudio y datos 200GAI grandes El paquete de regalo es gratis ~
Si tiene alguna pregunta, puede preguntarme

Bienvenido a escanear el código  para obtener datos de video sin IA

 ❶ Los cursos y proyectos de inteligencia artificial (incluido el código fuente de los cursos) se pueden escribir en el currículum de la práctica del proyecto a nivel empresarial.

❷ Libros de lectura obligada de alta calidad sobre inteligencia artificial (libros de flores "Biblia", etc.) + colección de artículos sobre inteligencia artificial

❸ Tutoriales y materiales zi de apoyo de maestros nacionales y extranjeros conocidos (Diosa Li Feifei, Wu Enda, Li Mu)

❹ Explicación súper detallada de la ruta de aprendizaje de inteligencia artificial + materiales zi de aprendizaje del sistema

❺ Disposición del sitio web de recursos de inteligencia artificial de alta calidad, informe de la industria de inteligencia artificial

Supongo que te gusta

Origin blog.csdn.net/Java_college/article/details/127623837
Recomendado
Clasificación