Estimativa de pose humana usando o ponto-chave RCNN no PyTorch - com código-fonte

A estimativa de pose humana é uma importante área de pesquisa em visão computacional. Envolve a estimativa de pontos únicos no corpo humano, também conhecidos como pontos-chave . Nesta postagem do blog, discutiremos um algoritmo para encontrar pontos-chave em imagens contendo seres humanos, chamado Keypoint-RCNN . O código foi escrito usando a biblioteca Torchvision usando Pytorch .

Digamos que você queira criar um personal trainer que possa orientá-lo na postura corporal correta, analisando a postura das articulações do seu corpo. É aqui que a estimativa de pose entra em jogo.

A ideia da detecção de pontos-chave é detectar pontos de interesse ou locais-chave em uma imagem. Estes podem ser: 

  • Marcos faciais (por exemplo, ponta do nariz, cantos dos olhos, bordas faciais, etc.)
  • ou articulações do corpo humano (ombros, pulsos, tornozelos)
  • ou cantos e bolhas na imagem

De RCNN para Máscara-RCNN

  • Tudo começou com a RCNN (Region-Based Convolutional Neural Network) evoluindo para Fast-RCNN, depois Faster-RC

Acho que você gosta

Origin blog.csdn.net/tianqiquan/article/details/132360685
Recomendado
Clasificación