Estimación de pose humana utilizando el punto clave RCNN en PyTorch, con código fuente

La estimación de la pose humana es un área de investigación importante en la visión artificial. Implica estimar puntos únicos en el cuerpo humano, también conocidos como puntos clave . En esta publicación de blog, discutiremos un algoritmo para encontrar puntos clave en imágenes que contienen humanos, llamado Keypoint-RCNN . El código fue escrito usando la librería Torchvision usando Pytorch .

Supongamos que desea crear un entrenador físico personal que pueda guiarlo en la postura corporal correcta mediante el análisis de la postura de las articulaciones de su cuerpo. Aquí es donde entra en juego la estimación de la pose.

La idea de la detección de puntos clave es detectar puntos de interés o ubicaciones clave en una imagen. Estos pueden ser: 

  • Puntos de referencia faciales (por ejemplo, punta de la nariz, comisuras de los ojos, bordes faciales, etc.)
  • o articulaciones del cuerpo humano (hombros, muñecas, tobillos)
  • o esquinas y manchas en la imagen

De RCNN a Máscara-RCNN

  • Todo comenzó con RCNN (Red neuronal convolucional basada en la región) que evolucionó a Fast-RCNN, luego a Faster-RC

Supongo que te gusta

Origin blog.csdn.net/tianqiquan/article/details/132360685
Recomendado
Clasificación