Stacked Hourglass Networks论文阅读笔记 - 代码天地

Stacked Hourglass Networks论文阅读笔记

其他 2020-03-23 18:33:02 阅读次数: 0

1、介绍

在图像和视频中理解人物的关键步骤是准确的姿态估计。stacked hourglass网络捕获和整合图像的所有尺度上的信息。

二、相关的工作

1、stacked hourglass在没有使用图形模型或任何明确的人体模型的情况下，可以获得更好的性能。

三、网络架构

3.1 hourglass design

hourglass的设计动力是在每个尺度上捕获信息的需要。以下图是原论文中介绍单个”hourglass“模型的示例图，有降采样和上采样过程

单个“hourglass"模型

每个残差模型如下图，贯穿整个网络：

中间监督过程如下图，这个网络分割并产生一组热图（蓝色线框）。1*1的卷积使得热图匹配中间特征的通道数，并与前面沙漏的特征一起添加。

3.2 层的实现

在保持整体沙漏形状的同时，层的具体实现仍有一定的灵活性。不同的选择会对网络的最终表现和训练产生一些小影响。

3.3 Stacked Hourglass with Intermediate Supervision

最后的网络架构是端到端地堆叠多个hourglass。通过每个hourglass都会产生预测，使得网络有机会产生局部和全局内容的特征。局部和全局的线索在每个hourglass上整合。八个hourglasses用在最终的网络设计上。权重在这些模型上是不共享的，一个loss被应用于所有hourglasses的预测，并使用相同的ground truth。

3.4 训练

平方根误差损失函数(MSE)用于比较预测的热图与标签的热图

四、结果

使用正确关键点比值（PCK）来做评估。

五、进一步分析

5.1 多人存在于图片时

图中有多个人的时候，相干的问题是很重要的。网络需要决定哪个人做注释。解决方法是将目标任务中心化和规定好比例。

发布了19 篇原创文章 · 获赞 13 · 访问量 3万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_39958313/article/details/83508123

Stacked Hourglass Networks论文阅读笔记

Stacked Hourglass Networks

【论文阅读笔记】Stacked HOurglass Networks for Human Pose Estimation

Stacked Hourglass Networks for Human Pose Estimation - HourGlass

【语义分割】Stacked Hourglass Networks

论文笔记 Stacked Hourglass Networks for Human Pose Estimation

论文笔记：Stacked Hourglass Networks for Human Pose Estimation

Stacked Hourglass Networks人体姿势估计-论文笔记

Stacked Hourglass Networks for Human Pose Estimation

论文解析与翻译：《Stacked Hourglass Networks for Human Pose Estimation》

论文翻译：Stacked Hourglass Networks for Human Pose Estimation

【ECCV 2016】人体姿态估计论文笔记 Stacked Hourglass Networks for Human Pose Estimation

人体姿态估计--Stacked Hourglass Networks for Human Pose Estimation

关键点检测---Stacked Hourglass Networks for Human Pose Estimation

姿态估计 - Stacked Hourglass Networks for Human Pose Estimation

2D关键点检测之hourglass：Stacked Hourglass Networks for Human Pose Estimation

Stacked Hourglass Networks for Human Pose Estimation (人体姿态识别之堆叠沙漏网络)

【人体姿态】Stacked Hourglass算法详解

The Hourglass

hourglass

【模型论文阅读——Transformer】15.Hourglass

论文解读：Stacked Attention Networks for Image Question Answering

《Stacked Attention Networks for Image Question Answering》论文解读与实验

论文笔记《STAR-GCN: Stacked and Reconstructed Graph Convolutional Networks for Recommender Systems》

《Sentiment Analysis of Chinese Microblog Based on Stacked Bidirectional LSTM》论文阅读笔记

文献阅读笔记——Action Recognition with Stacked Fisher Vectors

StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks 阅读及实现

Stacked DeBERT

论文笔记001-Stacked Convolutional Auto-Encoders for Hierarchical Feature Extraction

pytorch hourglass遇到的问题

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)