CVPR 2017、2018 - 目标检测文章

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_35451572/article/details/80758263

国际计算机视觉与模式识别会议(CVPR)是IEEE一年一度的学术性会议,会议的主要内容是计算机视觉与模式识别技术。CVPR是世界顶级的计算机视觉会议(三大顶会之一,另外两个是ICCV和ECCV),近年来每年有约1500名参加者,收录的论文数量一般300篇左右。本会议每年都会有固定的研讨主题,而每一年都会有公司赞助该会议并获得在会场展示的机会。

CVPR 2018

Cascade R-CNN: Delving into High Quality Object Detection

arxiv: https://arxiv.org/abs/1712.00726
github(Caffe, official): https://github.com/zhaoweicai/cascade-rcnn
  在目标检测中,在判定正负样本的时候交并比阈值是必需的。较低的对象探测器,训练有素的借据 0.5阈值,例如,通常会产生噪声检测。 然而,检测 性能会降低,增加了借据阈值。 两个主要 原因:1)过度拟合训练期间,由于 迅速消失的正样品,2)inference-time不匹配 借据的检测器之间的最优和输入 假设。 多级对象检测体系结构、级联R-CNN 提出了解决这些问题。 它由一个序列的探测器 顺序与借据阈值增加,训练更多的选择性 接近的假阳性。 探测器是逐步训练, 利用观察到探测器的输出是一个很好的分布 培训下一个更高质量的探测器。 逐步的重采样 改进的假设保证所有探测器都积极的 同尺寸的例子,减少过度拟合的问题。 相同的级联 程序应用于推理,使之间的紧密匹配 假设和探测器每个阶段的质量。 一个简单的实现 显示了级联R-CNN超越所有单模对象探测器 具有挑战性的可可数据集。 实验还表明,级联R-CNN 广泛适用于探测器的架构,实现一致的收益 独立于基线检测器的力量。

Domain Adaptive Faster R-CNN for Object Detection in the Wild

arxiv: https://arxiv.org/abs/1803.03243
  对象检测通常假定训练和测试数据是来自 然而,一个相同的分布,在实践中并不总是持有。 这种分布不匹配会导致显著的性能下降。 在 这项工作,我们的目标是提高目标检测的跨域的鲁棒性。 我们在两个层次上解决域转变:1)映像级别转变,如 形象风格、照明等,2)实例级的转变,如对象 外观,尺寸等。根据最近我们构建我们的方法 先进的快R-CNN模型和设计两个领域适应气候变化 组件、图像水平和实例级减少域 差异。 这两个领域适应基于H-divergence组件 理论,通过学习实现域分类器在敌对的 培训的方式。 进一步域分类器在不同的水平 加强与一致性正则化学习一个域不变 建议网络(RPN)快R-CNN模型。 我们评估我们的新 建议的方法使用多个数据集包括了城市,KITTI,SIM10K, 等。结果显示我们提出的方法的有效性的对象检测场景在不同的领域转变。

Multi-scale Location-aware Kernel Representation for Object Detection

arxiv: https://arxiv.org/abs/1804.00428
github: https://github.com/Hwang64/MLKP
  虽然快R-CNN及其变体已经显示出不错的表现 对象检测,他们只利用简单的一阶表示对象 建议最终的分类和回归。 最近的分类 方法表明,高阶统计信息的集成到深 卷积神经网络可以达到令人印象深刻的进步,但是他们的 模型的目标是整个图像通过丢弃位置信息 不能直接采用对象检测。 在这篇文章中,我们让一个 试图利用高阶统计信息在目标检测中,针对 为建议提高生成更有识别力的表示 探测器的性能。 为此,我们提出一种新的多尺度 位置感知内核表示(MLKP)来捕获高阶统计 深特性的建议。 我们MLKP改性可以有效地计算 多尺度特征映射使用一个低维多项式内核 近似。 此外,不同于现有的无条理的全球 基于高阶统计数据表示,我们提议MLKP位置 保留和敏感,以便它可以灵活地采用对象检测。 通过融入快R-CNN模式,提出MLKP达到非常 竞争性能最先进的方法,提高了速度 R-CNN 4.9%(mAP),4.7%(mAP)和5.0%(美联社借据=[0.5:0.05:0.95])在帕斯卡 2007年VOC,VOC 2012和COCO数据集。

Object Detection using Domain Randomization and Generative Adversarial Refinement of Synthetic Images

arxiv: https://arxiv.org/abs/1805.11778

在这项工作中,我们目前的应用程序域随机化和 生成对抗网络(GAN)训练接近实时对象探测器,完全在一个模拟的环境。 大规模的 可用性为真实世界的数据通常是罕见的,很难 获得在许多工业环境。 因此,只有几百 未标记的真实图像用于训练Cyclic-GAN网络相结合 各种程度的域随机化程序。 我们证明 这使强大的翻译合成图像真实世界的领域。 我们表明,原始的组合合成(模拟)和翻译图片,当用于训练Mask-RCNN对象检测网络 达到大于0.95意味着平均精度检测和分类 工业电气部分的集合。 我们评估性能 不同组合的训练数据。

Relation Networks for Object Detection

intro: CVPR 2018
arxiv: https://arxiv.org/abs/1711.11575
虽然好多年相信建模之间的关系 对象将帮助对象识别,没有证据表明 想法是在深工作学习的时代。 所有先进的目标检测 系统仍然依靠单独识别对象实例,没有 学习期间利用他们的关系。这项工作提出了一个对象关系模块。 It过程的一组对象 同时通过外表之间的交互功能 几何形状,从而允许他们关系的建模。 它是轻量级的, 就地。 它不需要额外的监督很容易嵌入 现有的网络。 它是有效提高目标识别和显示 重复删除步骤在现代对象检测管道。 它验证 建模基于对象关系在CNN的功效检测。 它会引起 第一个完整的端到端对象探测器。

Beyond Trade-off: Accelerate FCN-based Face Detector with Higher Accuracy

arxiv: https://arxiv.org/abs/1804.05197

完全卷积神经网络(FCN)主导的游戏的脸 检测任务几年的先天能力 与共享内核sliding-window-searching,归结所有 冗余计算,最新最先进的方法等 SSD,Faster-RCNN YOLO和红外系统使用意思FCN作为他们的支柱。 这是一个 问题:我们能找到一个普遍的策略,进一步加快FCN 精度高,所以可能会加速所有最近FCN-based方法? 来 分析这个问题,我们将面对搜索空间分解成两个正交的 方向,“规模”和“空间”。 只有少数的坐标空间扩大 由两个基本向量表示前景。 如果FCN可以忽略的 其他点,搜索空间和假警报应该显著 归结。 基于这种哲学,一个名为规模估计的新方法 和空间注意的建议(S2AP提出了关注一些 具体的尺度和有效的位置在图像金字塔。 此外,我们采用 masked-convolution操作基于加速FCN关注结果 计算。 实验表明,FCN-based方法可以加速项 关于4×的帮助下S2APmasked-FCN和在同一时间 也可以实现先进的FDDB,AFW MALF人脸检测吗 基准。

Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks

arxiv: https://arxiv.org/abs/1804.06039
github: https://github.com/Jack-CV/PCN
用任意旋转不变人脸检测,即检测的脸 rotation-in-plane(RIP)角度,广泛需要于不受限制 应用程序但仍然作为一个具有挑战性的任务,由于大 变化的表象。 大多数现有的方法与速度或妥协 精度处理大变化。 为解决这一问题 效率,我们建议进步校准网络(PCN)来执行 而且方式旋转不变人脸检测。 PCN由 三个阶段,每个不仅区分非人脸的脸, 但也校准每个候选人脸的RIP取向直立 逐步。 除以校准过程分为几个进步 步骤和只在早期阶段,预测粗取向PCN可以实现 精确和快速校准。 通过执行二进制分类面临vs。 区别人脸与逐渐减少撷取范围,PCN可以准确检测的面孔 与全360∘把角度。 这种设计导致实时 旋转不变的脸探测器。 笔迹FDDB和实验 具有挑战性的子集包含旋转面临的更广泛的脸在野外显示 我们PCN达到相当有前途的性能。

Seeing Small Faces from Robust Anchor’s Perspective

arxiv: https://arxiv.org/abs/1802.09058
介绍了一种新型锚设计支持anchor-based脸 检测尺度不变的优越性能,尤其是在小脸上。 为了达到这个目标,我们明确地解决这一问题,anchor-based探测器 用小尺寸,性能大幅下降的脸如小于16 x16 像素。 在本文中,我们调查为什么会出现这种情况。 我们发现 当前锚设计不能保证高小小的脸和之间的重叠 锚箱,增加培训的难度。 预计新马克斯 重叠(情绪)得分提出可以从理论上解释了低 重叠的问题,激发新的锚设计的一些有效的策略 导致更高的脸重叠,包括减少新锚一步 网络架构、额外移锚和随机面临转变。 全面的实验表明,我们提出的方法明显 优于基线anchor-based检测器,而实现 最先进的具有挑战性的人脸检测结果数据集 竞争运行时的速度。

Direction-aware Spatial Context Features for Shadow Detection

阴影检测是一个基本且富有挑战性的任务,因为它需要一个 全球形象的理解语义和有各种各样的背景 周围的阴影。 介绍了一种新颖的网络阴影的检测 分析图像上下文direction-aware的方式。 为了达到这个目标,我们首先 制定direction-aware注意力机制在一个空间复发性神经 网络(RNN)通过引入关注权重时聚合空间上下文 RNN的特性。 通过学习这些重量训练,我们可以恢复 direction-aware空间上下文(DSC)检测阴影。 这个设计是 发展成为CNN的DSC模块和嵌入式学习DSC特性 不同的级别。 此外,加权交叉熵损失设计 培训更有效。 我们雇佣两个常见的阴影检测基准 数据集和执行各种实验来评估我们的网络。 实验 结果表明,我们的网络优于最先进的方法和实现 97%的准确率和平衡出错率降低38%。
arxiv: https://arxiv.org/abs/1712.04142

CVPR 2017

A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection

arxiv: https://arxiv.org/abs/1704.03414
paper: http://abhinavsh.info/papers/pdfs/adversarial_object_detection.pdf
github(Caffe): https://github.com/xiaolonw/adversarial-frcnn

Speed/accuracy trade-offs for modern convolutional object detectors

arxiv: https://arxiv.org/abs/1611.10012

Discriminative Bimodal Networks for Visual Localization and Detection with Natural Language Queries

arxiv: https://arxiv.org/abs/1704.03944

Accurate Single Stage Detector Using Recurrent Rolling Convolution

keywords: Recurrent Rolling Convolution (RRC)
arxiv: https://arxiv.org/abs/1704.05776
github: https://github.com/xiaohaoChen/rrc_detection

RON: Reverse Connection with Objectness Prior Networks for Object Detection

arxiv: https://arxiv.org/abs/1707.01691
github: https://github.com/taokong/RON

Mimicking Very Efficient Network for Object Detection

intro: CVPR 2017. SenseTime & Beihang University
paper: http://openaccess.thecvf.com/content_cvpr_2017/papers/Li_Mimicking_Very_Efficient_CVPR_2017_paper.pdf

Learning non-maximum suppression

project page: https://www.mpi-inf.mpg.de/departments/computer-vision-and-multimodal-computing/research/object-recognition-and-scene-understanding/learning-nms/
arxiv: https://arxiv.org/abs/1705.02950
github: https://github.com/hosang/gossipnet

Deep Variation-structured Reinforcement Learning for Visual Relationship and Attribute Detection

intro: CVPR 2017 spotlight paper
arxiv: https://arxiv.org/abs/1703.03054

Detecting Visual Relationships with Deep Relational Networks

intro: CVPR 2017 oral. The Chinese University of Hong Kong
arxiv: https://arxiv.org/abs/1704.03114

Multi-Path Region-Based Convolutional Neural Network for Accurate Detection of Unconstrained “Hard Faces”

intro: CVPR 2017. MP-RCNN, MP-RPN
arxiv: https://arxiv.org/abs/1703.09145

Scale-Aware Face Detection

intro: CVPR 2017. SenseTime & Tsinghua University
arxiv: https://arxiv.org/abs/1706.09876

Detecting Faces Using Inside Cascaded Contextual CNN

intro: CVPR 2017. Tencent AI Lab & SenseTime
paper: http://ai.tencent.com/ailab/media/publications/Detecting_Faces_Using_Inside_Cascaded_Contextual_CNN.pdf

Finding Tiny Faces

intro: CVPR 2017. CMU
project page: http://www.cs.cmu.edu/~peiyunh/tiny/index.html
arxiv: https://arxiv.org/abs/1612.04402
github(official, Matlab): https://github.com/peiyunh/tiny
github(inference-only): https://github.com/chinakook/hr101_mxnet
github: https://github.com/cydonia999/Tiny_Faces_in_Tensorflow

Expecting the Unexpected: Training Detectors for Unusual Pedestrians with Adversarial Imposters

intro: CVPR 2017
project page: http://ml.cs.tsinghua.edu.cn:5000/publications/synunity/
arxiv: https://arxiv.org/abs/1703.06283
github(Tensorflow): https://github.com/huangshiyu13/RPNplus

What Can Help Pedestrian Detection?

intro: CVPR 2017. Tsinghua University & Peking University & Megvii Inc.
keywords: Faster R-CNN, HyperLearner
arxiv: https://arxiv.org/abs/1705.02757
paper: http://openaccess.thecvf.com/content_cvpr_2017/papers/Mao_What_Can_Help_CVPR_2017_paper.pdf

Evaluating State-of-the-art Object Detector on Challenging Traffic Light Data

intro: CVPR 2017 workshop
paper: http://openaccess.thecvf.com/content_cvpr_2017_workshops/w9/papers/Jensen_Evaluating_State-Of-The-Art_Object_CVPR_2017_paper.pdf

SRN: Side-output Residual Network for Object Symmetry Detection in the Wild

intro: CVPR 2017
arxiv: https://arxiv.org/abs/1703.02243
github: https://github.com/KevinKecc/SRN

Learning Detection with Diverse Proposals

keywords: differentiable Determinantal Point Process (DPP) layer, Learning Detection with Diverse Proposals (LDDP)
arxiv: https://arxiv.org/abs/1704.03533

参考

Object Detection

猜你喜欢

转载自blog.csdn.net/qq_35451572/article/details/80758263