relation networks for object detection问答

文章链接:https://arxiv.org/pdf/1711.11575.pdf

1.使用什么间的关系来做物体检测?

  使用外观 特征,和几何信息, 即:卷积网络特征和box

2.文章说自己才是end to end object detetion,为啥?

  nms也用网络实现

3.网络是否需要其他监督信号?

不需要,如同deformable network类似,不需要额外信息

4.此文以前有哪些使用物体间关系来做后处理的办法?

 在深度学习以前,dpm使用物体同时出现的约束提高物体识别准确度,也有使用位置和大小提高精度的办法,

  深度学习时代,lstm和空间记忆网络,被提出,但是没有能提高stateofart 模型,而且训练复杂

 基于人的任务,但是需要标注人的动作,本方法不需要

5.文章提出的空间权重,变换后,是否会变化?

  变换不变的

6.对比注意力基本形式公式1,那么公式4,谁是key,谁是value?

基本形式:v^{out}=softmax(\frac{qK^t}{d_k})V, 公式4:\omega^{mn}_A=\frac{dot(W^m_A f^m_A, W^n_A f^n_A)}{d_k},可见n是一个box 的feature,m是遍历所有box的feature,所以n的feature是query, m的feature是key

7.如果只想得到两个box之间的关系大小用哪个公式?

  论文里公式3

发布了159 篇原创文章 · 获赞 55 · 访问量 36万+

猜你喜欢

转载自blog.csdn.net/northeastsqure/article/details/103936318