Estimación de la postura humana Breve descripción

0. Resumen

En la solución real, la estimación de la postura del cuerpo humano a menudo se transforma en el problema de predicción de puntos clave del cuerpo humano, es decir, primero predecir las coordenadas de posición de cada punto clave del cuerpo humano y luego determinar la relación de posición espacial entre los puntos clave basados ​​en conocimientos previos
Los problemas de estimación de pose se pueden dividir en dos categorías principales: estimación de pose 2D y estimación de pose 3D. Como sugiere el nombre, el primero predice una coordenada bidimensional (x, y) para cada punto clave; el segundo predice una coordenada tridimensional (x, y, z) para cada punto clave, agregando información de profundidad unidimensional.

1. Estimación de pose 2D

Para la estimación de pose 2D, la mayor parte de la investigación actual es la estimación de pose de varias personas, es decir, cada imagen puede contener varias personas. Generalmente hay dos formas de resolver este tipo de problemas: de arriba hacia abajo y de abajo hacia arriba:

La idea de arriba hacia abajo es realizar primero la detección de objetivos en la imagen y encontrar a todas las personas; luego recortar a las personas de la imagen original, cambiar su tamaño e ingresarlas en la red para estimar la pose. En otras palabras, de arriba hacia abajo transforma el problema de la estimación de poses de varias personas en el problema de la estimación de poses de múltiples personas de una sola persona .
La idea de abajo hacia arriba es encontrar primero todos los puntos clave en la imagen y luego agrupar los puntos clave para obtener un individuo.

1.1De arriba hacia abajo

La entrada de la red es el cuadro delimitador que contiene una persona, y
la salida de la red son las coordenadas de k puntos clave de la persona. Debido a que hay ejes horizontales y verticales, es necesario devolver un total de 2k números. Hay dos ideas de predicción:
1. Regresión directa de las coordenadas: la salida de la red son 2k números emitidos a través de la capa fc 2.
mapa de calor: predice el valor de calor de cada punto del mapa de características para obtener el mapa de calor y el máximo El valor en el mapa de calor es Coordenadas de puntos clave.

Referencia:
https://zhuanlan.zhihu.com/p/104917833

Supongo que te gusta

Origin blog.csdn.net/qq_41950533/article/details/124266129
Recomendado
Clasificación