Ruta de aprendizaje de ingeniería en visión por computadora

1. Aprenda lenguajes de programación y bibliotecas básicas

  • Aprenda el lenguaje Python y domine la sintaxis básica, funciones, programación orientada a objetos y otros conceptos.
  • Conozca la biblioteca Numpy para computación científica y matrices multidimensionales
  • Conozca la biblioteca OpenCV, que contiene muchos algoritmos de procesamiento de imágenes y visión por computadora.
  • Aprenda TensorFlow/PyTorch, el principal marco de aprendizaje profundo

2. Aprenda algoritmos de procesamiento de imágenes digitales

  • Representación de imágenes (píxeles, escala de grises, binarización, etc.)
  • Conversión del espacio de color (RGB, HSV, etc.)
  • Operaciones de filtrado (filtrado medio, filtrado gaussiano, filtrado mediano, etc.)
  • Operaciones morfológicas (erosión, expansión, operaciones de apertura, operaciones de cierre, etc.)
  • Mejora de la imagen (ecualización de histograma, ecualización adaptativa, etc.)
  • Algoritmos de detección de bordes (Sobel, Canny, etc.)
  • Algoritmos de segmentación de imágenes (región en crecimiento, cuenca hidrográfica, etc.)

3. Aprenda los algoritmos clásicos de extracción de funciones y aprendizaje automático.

  • Algoritmos de detección y descripción de características como SIFT, SURF, ORB
  • HOG, LBP y otras funciones utilizadas para la representación de imágenes
  • SVM, KNN, árbol de decisión y otros algoritmos de aprendizaje automático

4. Aprendizaje profundo de redes neuronales convolucionales.

  • Estructuras básicas de CNN, como la capa de convolución y la capa de agrupación.
  • LeNet, AlexNet, VGGNet, ResNet y otros modelos de CNN
  • Aplicaciones típicas como clasificación de imágenes y detección de objetivos.
  • Implementar el modelo CNN usando TensorFlow/PyTorch

5. Práctica práctica de proyectos.

  • Implementar un clasificador de objetos simple.
  • Búsqueda de imágenes basada en la coincidencia de características
  • Reconocimiento de dígitos escritos a mano mediante CNN
  • Detección de objetivos basada en aprendizaje profundo

6. Continúe aprendiendo algoritmos avanzados.

  • Redes neuronales más profundas (DenseNet, MobileNet, etc.)
  • Red Adversaria Generativa (GAN)
  • Algoritmo de segmentación de instancias (Máscara R-CNN, etc.)
  • Aplicación del aprendizaje por refuerzo en visión por computadora.

7. Conozca las tendencias de la industria y participe en proyectos de código abierto.

  • Siga los últimos avances de la investigación en las principales conferencias (CVPR, ICCV, etc.)
  • Participe en proyectos de código abierto relacionados con la visión por computadora en Github
  • Publicar artículos y enviarlos a las principales conferencias académicas.

Supongo que te gusta

Origin blog.csdn.net/qq_37992974/article/details/132568344
Recomendado
Clasificación