Spatial Transformer Network (STN)原文解读 - 代码天地

Spatial Transformer Network (STN)原文解读

其他 2020-03-08 20:32:47 阅读次数: 0

最近在研究attention机制，这篇是发表于16年的一篇涉及Attention机制的paper。

提出的原因：

（1）现有的CNN结构对空间不变形的处理能力较弱

（2）希望根据文理和形状就可以区分object的方位和部分变形

（3）max-pooling具有一定的空间不变形能力，但是局部的，而且只限制在高层次的cnn和max-pooling层，中间层无法获取空间转换能力。（某种程度来说，现有的CNN的空间转换不变性是受限的、预定义的）

优点：

（1）end-to-end的train

（2）stn的trainformer模块是可微的，不需要使用有监督训练或者修改现有优化机制，根据自己的特征图就可以主动学习特征图的转换能力

（3）spatial transformer能解决的图片转换种类：平移（translation）、缩放（scale）、旋转（rotate）和扭曲（warp）

（4）STN直接对数据处理，而不是对特征提取器处理！

原理：

spatial transformer的模块组成：定位网络、产生网格、抽样映射。

（1）localisation network

转换的theta多种多样，实现形式也是多种多样，只需要最后一层可以输出回归值就行。

（2）grid generator

$\left(\begin{array}{c}{x_{i}^{s}} \\ {y_{i}^{s}}\end{array}\right)=\mathcal{T}_{\theta}\left(G_{i}\right)=\mathrm{A}_{\theta}\left(\begin{array}{c}{x_{i}^{t}} \\ {y_{i}^{t}} \\ {1}\end{array}\right)=\left[\begin{array}{ccc}{\theta_{11}} & {\theta_{12}} & {\theta_{13}} \\ {\theta_{21}} & {\theta_{22}} & {\theta_{23}}\end{array}\right]\left(\begin{array}{c}{x_{i}^{t}} \\ {y_{i}^{t}} \\ {1}\end{array}\right)$

映射方向是：输出target=》输入source

（3）sampler

对输入特征图的像素抽样，计算经过何种方式可以获取到输出像素值。

需要保证输入和输出的channel数目一致。

源码实现注意点：

（1）spatial transformer的数目（一般来说6个参数作为整体）和输入图片数目保持一致。

-- 未完待续 --

qm006

发布了64 篇原创文章 · 获赞 24 · 访问量 4万+

私信关注

猜你喜欢

转载自blog.csdn.net/qm5132/article/details/95110958

Spatial Transformer Network (STN)原文解读

STN：空间变换网络(Spatial Transformer Network)

理解Spatial Transformer Network

Spatial Transformer Network

STN(Spatial Transformer Networks)

【PyTorch】教程：Spatial transformer network

详细解读Spatial Transformer Networks（STN）-一篇文章让你完全理解STN了

理解Spatial Transformer Network(空间变换网络)

pytorch实现 spatial transformer network with mnist

空间变换网络Spatial Transformer Networks(STN)

STN -Spatial Transformer Networks 空间转换网络

STN：Spatial Transformer Networks 空间变换网络

STN-Spatial Transformer Networks-论文笔记

论文笔记（2）：Spatial Transformer Networks（STN）

注意力机制——Spatial Transformer Networks（STN）

关于Spatial Transformer Networks(STN)如何学习参数

Spatial Transformer Networks

【Paper】MVSTT: A Multiview Spatial-Temporal Transformer Network for Traffic-Flow Forecasting

【Deep Learning】Spatial Transformer Networks

论文阅读: Spatial transformer networks

论文解读：ChangeFormer | A TRANSFORMER-BASED SIAMESE NETWORK FOR CHANGE DETECTION

论文解读：Foreground-Aware Relation Network for Geospatial Object Segmentation in High Spatial Resolution

【论文笔记】Spatial Transformer Networks

[论文理解] Spatial Transformer Networks

对 Spatial Transformer Networks(空间变换网络) 的思考

Spatial Transformer Networks 空间变换网络详解

空间变换网络--spatial transform network笔记

空间变换网络--spatial transform network

Learning to Segment Instances in Videos with Spatial Propagation Network

【SSN】：Spatial Shortcut Network for Human Pose Estimation

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)