[Notas da segunda fase do acampamento prático OpenMMLab AI] Estimativa de pose do corpo humano e MMPose no segundo dia

1. Visão geral da estimativa da pose humana

O conceito de estimativa de pose humana

Identifique pontos-chave, como rostos, mãos e corpos de uma determinada imagem.
Entrada: imagem.
Saída: coordenadas de pixel de todos os pontos-chave.
Insira a descrição da imagem aqui

Tarefas posteriores:

Reconhecimento de comportamento:
PoseC3D: Reconhecimento de ação comportamental baseado na postura humana
CG, animação:
Insira a descrição da imagem aqui
Interação humano-computador:
Insira a descrição da imagem aqui
Análise do comportamento animal:
Insira a descrição da imagem aqui

Estimativa de pose 2.2D

Descrição da tarefa de estimativa de pose humana 2D: localize as coordenadas dos pontos-chave do corpo humano na imagem

2.1 Duas ideias básicas para implementação:

(1) Baseado em Regressão - Modele o problema de detecção de pontos-chave como um problema de regressão, permitindo que o modelo preveja diretamente as coordenadas dos pontos-chave através da última camada de regressão linear.
Desvantagens: É difícil retornar coordenadas diretamente e a precisão não é ideal. (Experiência histórica)
(2) Baseado em mapa de calor - previsão da probabilidade de pontos-chave em cada local.Vantagens
: A previsão do modelo de mapas de calor é relativamente mais fácil do que coordenadas de regressão direta, e a precisão do modelo é relativamente maior (mais alinhada com a estrutura de a rede neural));
Desvantagens: O custo computacional da previsão de mapas de calor é maior do que o da regressão direta (informações maiores precisam ser mantidas, mas existem estudos para melhorar esse problema)

O processo específico do método baseado em mapa de calor:
(1) Gere um mapa de calor a partir da anotação de dados, e cada ponto-chave deve passar pelo processo mostrado na figura abaixo.
Adicione a descrição da imagem
(2) Use o mapa de calor para treinar o modelo
Insira a descrição da imagem aqui
(3) Restaure os pontos-chave do mapa de calor.
Método para restaurar a posição coordenada do ponto-chave do mapa de calor de um determinado ponto:
Método ingênuo: Encontre a posição do máximo valor do mapa de calor
Regressão Integral da Pose Humana: O mapa de calor normalizado forma a probabilidade de que os pontos estejam localizados em locais diferentes e, em seguida, calcula a expectativa do local.
Insira a descrição da imagem aqui

Vantagens: diferenciável; contínuo, sem erro de quantização

2.2 Método de implementação

Método de cima para baixo (TopDown)

Etapas:
Etapa 1. Use o algoritmo de detecção de alvo para detectar cada corpo humano.
Etapa 2. Estime a postura de cada pessoa com base na imagem de uma única pessoa.
Insira a descrição da imagem aqui
Desvantagens:
(1) A precisão geral é limitada pela precisão do detector
(2) ) A velocidade e a quantidade de cálculo serão proporcionais. Em termos de número de pessoas,
desenvolvimento:
(1) Alguns trabalhos novos (como SPM) consideram agregar duas etapas em uma etapa

Método de baixo para cima (BottomUp)

Etapas:
Etapa 1. Use o modelo de ponto-chave para detectar todos os pontos-chave do corpo humano.
Etapa 2. Combine os pontos-chave em diferentes pessoas com base em relações posicionais ou outras informações auxiliares.
Insira a descrição da imagem aqui
Vantagens:
(1) A velocidade de inferência não tem nada a ver com o número de pessoas.

abordagem de estágio único

Insira a descrição da imagem aqui

Método baseado em transformador

2.3 Documentos sobre implementação específica

Abordagem de cima para baixo baseada em regressão

  1. DeepPose (2014)
    Insira a descrição da imagem aqui
    melhora a precisão por meio de cascatas.
    Insira a descrição da imagem aqui
    Vantagens:
    (1) O modelo de regressão pode, teoricamente, atingir precisão infinita. A precisão do método do mapa de calor é limitada pela resolução espacial do mapa de recursos. (2)
    O modelo de regressão não precisa para manter mapas de recursos de alta resolução. , o nível de cálculo é mais eficiente. Em contraste, o método do mapa de calor precisa calcular e armazenar mapas de calor e mapas de recursos de alta resolução, e o custo de cálculo é maior.
    Desvantagens:
    (1) O mapeamento das imagens para as coordenadas dos pontos-chave é altamente não linear, tornando as coordenadas de regressão mais difíceis do que os mapas de calor de regressão, e a precisão dos métodos de regressão também é mais fraca do que os métodos de mapa de calor.

  2. Estimativa de log de verossimilhança residual (RLE) (2021)
    Insira a descrição da imagem aqui
    Insira a descrição da imagem aquiProjeto re-parametrizado
    Insira a descrição da imagem aqui
    Função de verossimilhança residual
    Insira a descrição da imagem aqui
    Modelo RLE completo
    Insira a descrição da imagem aqui

Conhecimento prévio complementar:
1. A conexão entre regressão e estimativa de máxima verossimilhança.
Insira a descrição da imagem aqui
Portanto, a regressão de duas normas implica a suposição de que a posição do ponto-chave está em conformidade com uma distribuição gaussiana isotrópica com variância fixa.
2. Normalização do Fluxo Normalização do Fluxo
Insira a descrição da imagem aqui

Método top-down baseado em mapa de calor

1. Hourglass (2016) - propôs atingir o SOTA, que foi gradativamente superado
Insira a descrição da imagem aqui
Insira a descrição da imagem aqui
Insira a descrição da imagem aqui
2. Simple Baseline (2018) - segue uma estrutura simples
Insira a descrição da imagem aqui
3. HRNet (2020)
Insira a descrição da imagem aqui

abordagem de baixo para cima

1.Part Affinity Fields e OpenPose (2016)
Insira a descrição da imagem aqui
Conhecimento complementar:
correspondência de gráfico da parte K (a ser complementado)

abordagem de estágio único

1.SPM (2019)
Insira a descrição da imagem aqui
Design de Rede
Insira a descrição da imagem aqui

Método baseado em transformador

1.PRTR 2021
Insira a descrição da imagem aqui
Algoritmo PRTR de dois estágios
Insira a descrição da imagem aqui
Algoritmo PRTR de estágio único
Insira a descrição da imagem aqui
2.TokenPose (2021)
Insira a descrição da imagem aqui
Insira a descrição da imagem aqui

Resumo da estimativa de pose 2D

Insira a descrição da imagem aqui

Estimativa de pose humana 3.3D

3.1 Conceito de estimativa de pose 3D

Ao prever as coordenadas dos pontos-chave do corpo humano no espaço tridimensional a partir de uma determinada imagem, a postura do corpo humano pode ser restaurada no espaço tridimensional.Entrada: Saída da imagem: As coordenadas espaciais
de
todos os pontos-chave de todas as pessoas
Dificuldade : Restaurar informações 3D de imagens (ou vídeos) 2D
Insira a descrição da imagem aqui

3.2 Ideias de implementação

previsão diretaInsira a descrição da imagem aqui

Use informações de vídeo

Insira a descrição da imagem aqui

Aproveite imagens de visualização múltiplaInsira a descrição da imagem aqui

Conhecimento adicional:
Insira a descrição da imagem aqui

3.3 Documentos sobre implementação específica

1.Predição volumétrica grossa a fina 2017
Insira a descrição da imagem aqui
2.Simple Baseline 3D (2017)
Insira a descrição da imagem aqui
3.VideoPose3D (2018)
Insira a descrição da imagem aqui
4.VoxelPose (2020)
Insira a descrição da imagem aqui

4. Indicadores de avaliação para estimativa da pose humana

(1) Porcentagem de peças corretas (PCP)
Insira a descrição da imagem aqui
(2) Porcentagem de juntas detectadas (PDJ)
Insira a descrição da imagem aqui
(3) Porcentagem de pontos-chave corretos (PCK)
Insira a descrição da imagem aqui
(4) Similaridade de pontos-chave de objeto (OKS) com base em mAP
Insira a descrição da imagem aqui

5.Pose densa

Parametrização da superfície do corpo humano

Insira a descrição da imagem aqui

Método de rotulagem

Insira a descrição da imagem aqui

Estrutura de rede

Insira a descrição da imagem aqui

Design aprimorado

Insira a descrição da imagem aqui

Malha Corporal

Insira a descrição da imagem aqui

Mistura de esfola

Insira a descrição da imagem aqui
Linear Blend Skinning LBS (Linear Blend Skinning)
Insira a descrição da imagem aqui

6. Modelo paramétrico do corpo humano

Modelo paramétrico do corpo humano SMPL

Recuperando modelos humanos 3D em movimento a partir de imagens ou vídeos
Insira a descrição da imagem aqui

Lógica básica de design do SMPL

Insira a descrição da imagem aqui

Representação do modelo humano SMPL

Insira a descrição da imagem aqui

projeto de treinamento

Insira a descrição da imagem aqui

Aplicação do modelo SMPL

Insira a descrição da imagem aqui

Modelo paramétrico do corpo humano

SMPL
SMPLificar
HMR

Acho que você gosta

Origin blog.csdn.net/qq_41776136/article/details/131003733
Recomendado
Clasificación