论文阅读:《Towards accurate multi-person pose estimation in the wild》CVPR 2017 - 代码天地

论文阅读:《Towards accurate multi-person pose estimation in the wild》CVPR 2017

其他 2019-03-26 15:50:35 阅读次数: 0

转载来源：https://blog.csdn.net/qq_36165459/article/details/78322449

参考这两篇：
https://blog.csdn.net/joshua_1988/article/details/54618232
https://www.cnblogs.com/bobxxxl/archive/2018/07/17/9326304.html

网络框架

论文采用top-down的结构，分为两个阶段:
第一阶段使用faster rcnn做detection，检测出图片中的多个人，并对bounding box进行image crop；
第二阶段采用fully convolutional resnet对每一个bonding box中的人物预测dense heatmap和offset;
最后通过heatmap和offset的融合得到关键点的精确定位。
这里写图片描述

具体细节

Person Box Detection

人物bbox检测的faster rcnn的backbone是inception-Resnet，先在COCO的80个类别数据集上进行训练，再在只有person的bounding box上进行fine tune。

Person Pose Estimation

采用分类和回归的方法，得到关节点的heatmap和坐标offset。

Heatmap for classification：对于每一个空间点，先判断它是否在关节点的附近，生成K通道的heatmap，K是关节点的个数。
Offset for regression：对每一个空间点再预测一个2D的坐标来表示关节点的位置。将heatmap和offset做一个融合得到精确关节点位置。

Image cropping

对于每一个bounding box做裁剪的时候保持人体的纵横比，最终得到的crop image是353*257pixel，纵横比保持1.37，对于宽和高不是该比例的，扩大较短边。

Heatmap & offset fusion

输入是heatmap（K channel，每一个关键点一个channel）和offset（2*K channel，每一个关键点两个channel，分别是x和y坐标），输出是3*K个channel。

关于融合，对于每一个关节点和每一个空间位置，计算该位置是关节点的概率，这样生成K个关键点，之后将这个问题转换为一个二分类问题。另一方面，预测每一个位置与标准位置的距离，将其转换为一个2D回归问题。这样就将融合分成了二分类和2D回归两个问题。

效果

论文中声称其准确度要高于Mask RCNN，增加数据集会获得更好效果，mAP达到64.9%。

猜你喜欢

转载自blog.csdn.net/humanpose/article/details/88722616

论文阅读:《Towards accurate multi-person pose estimation in the wild》CVPR 2017

Towards Accurate Multi-person Pose Estimation in the Wild 论文阅读

【论文阅读笔记】Towards Accurate Multi-person Pose Estimation in the Wild

【Heatmap+offset】《Towards Accurate Multi-person Pose Estimation in the Wild》

论文阅读笔记: 2017 cvpr Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

《Cascaded Pyramid Network for Multi-Person Pose Estimation》--旷世2017COCO keypoints冠军论文解读

【论文阅读】RMPE:Regional Multi-Person Pose Estimation

RMPE: Regional Multi-Person Pose Estimation （AlphaPose）阅读笔记

【转】《Cascaded Pyramid Network for Multi-Person Pose Estimation》--旷世2017COCO keypoints冠军论文解读

RMPE：Regional Multi-Person Pose Estimation

《Cascaded Pyramid Network for Multi-Person Pose Estimation》论文阅读及复现笔记

【论文阅读笔记】Cascaded Pyramid Network for Multi-Person Pose Estimation

Multi-Person Pose Estimation with Enhanced Channel-wise and Spatial Information 阅读笔记

AlphaPose: Whole-Body Regional Multi-Person Pose Estimation and Tracking in Real-Time 阅读笔记

openpose论文总结：Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

AlphaPose论文笔记《RMPE: Regional Multi-person Pose Estimation》

论文笔记（CPN）：Cascaded Pyramid Network for Multi-Person Pose Estimation

Realtime Multi-Person 2D Pose Estimation Using Part Affinity Fields 论文解读

AlphaPose —— RMPE：Regional Multi-Person Pose Estimation 论文翻译+源码运行+知识点

Real-time 2D Multi-Person Pose Estimation on CPU:Lightweight OpenPose 论文精读

OpenPose: Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields 论文精读

论文复现--AlphaPose: Whole-Body Regional Multi-Person Pose Estimation and Tracking in Real-Time

论文复现--OpenPose: Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

人体姿态估计--RMPE: Regional Multi-Person Pose Estimation

Cascaded Pyramid Network for Multi-Person Pose Estimation

PoseTrack: Joint Multi-Person Pose Estimation and Tracking

Multi-Person Pose Estimation for PoseTrack with Enhanced Part Affinity Fields

Realtime Multi-Person Pose Estimation (OpenPose) 训练步骤

文献阅读(CV) Monocular 3D multi-person pose estimation via predicting factorized correction factors

OpenPose论文笔记《Realtime Multi-Person 2D Human Pose Estimation using Part Affinity Fields》

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)