AI Challenger 其中的人体骨骼关键点检测主要依赖的技术背景为Human pose estimation。该领域分为单人和多人两类,根据竞赛数据集来看,该任务为mult-person pose estimation。以下先介绍该竞赛的相技术背景
-- Background
专业术语:multi-person pose estimation
文章列表
1. open-Pose:<Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields >(CVPR 2017 Oral, CMU)
性能:COCO: 61% MPII:75%
2. G-RMI <Towards accurate multi-person pose estimation in the wild> (CVPR 2017 Google)
性能:COCO: 67%
3. Associative Embedding <Associative Embedding:End-to-End Learning for Joint Detection and Grouping> (rejected by ICCV2017 , UMICH Jia Deng)
性能: COCO :66% MPII: 77%
4. <Joint Multi-Person Pose Estimation and Semantic Part Segmentation> ( ICCV 2017, UCLA)
性能:PASCAL-Person-Part: 62.8%
5. <MASK RCNN> (ICCV 2017, Facebook,Kaiming He)
性能:COCO: 63%
6. <RMPE: Regional Multi-Person Pose Estimation> (ICCV 2017 , SJTU ,Tencent Youtu)
性能:COCO : 61.8% MPII: 76%
分类
1. Bottom-up approach:先检测joints 和 limbs,然后将他们group成一个人。 代表文章<1> <4> 。
优点:整个图像只需要处理一遍,速度不随人数增加而变化
2. Top-Down approach:先检测单个人,再针对单个人做single-person pose estimation。 代表文章 <2> <3> <5>
优点:思路直观,自然,被绝大部分人所青睐,且单人估计精度非常高
相关数据集/ 竞赛
1. MSCOCO Keypoint
2. MPII
http://human-pose.mpi-inf.mpg.de/#results
3. Posetrack
- Baseline 尝试
1. 选定openpose作为baseline方法,先不训练,直接套用MPI的模型。由于MPI的关键点数量和AI Challenger完全一致,所以模型可以直接套用。第一个双周提交至竞赛网站,结果仅为26%。Baseline性能比较令人意外,毕竟这个模型在MPI这个最老牌的竞赛集上可是有75%的性能。