【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(5月26日论文合集)

一、检测相关(9篇)

1.1 Energy-based Detection of Adverse Weather Effects in LiDAR Data

基于能量的激光雷达数据中不利天气影响的检测

论文地址:

https://arxiv.org/abs/2305.16129

在这里插入图片描述

自动驾驶车辆依赖于LiDAR传感器对环境进行感知。然而,雨、雪、雾等恶劣天气条件会对这些传感器造成负面影响,导致测量数据中引入不必要的噪声,降低了其可靠性。在本研究中,我们通过提出一种新的方法来检测LiDAR数据中的恶劣天气效应来解决这个问题。

我们将这个问题重新定义为异常检测任务,并利用能量框架来检测点云中的异常值。具体而言,我们的方法通过学习将能量评分与内点点云关联起来,将高能量评分与异常值关联起来,从而实现对恶劣天气效应的鲁棒检测。通过广泛的实验,我们证明了我们的方法在恶劣天气检测方面表现更好,并且对未见过的天气效应具有更高的鲁棒性,超过了先前最先进的方法。此外,我们还展示了如何利用我们的方法进行同时的异常检测和语义分割。最后,为了推动在恶劣天气条件下的LiDAR感知研究领域的发展,我们发布了SemanticSpray数据集,其中包含在类似高速公路场景中标记的车辆喷雾数据。

1.2 Anomaly Detection with Conditioned Denoising Diffusion Models

基于条件去噪扩散模型的异常检测

论文地址:

https://arxiv.org/abs/2305.15956

在这里插入图片描述
基于重建的方法在异常检测方面一直难以取得竞争性的性能。本文引入了一种称为Denoising Diffusion Anomaly Detection(DDAD)的方法。我们提出了一种新颖的去噪过程,用于基于目标图像的图像重建。这样可以得到一个与目标图像密切相似的连贯恢复图像。随后,我们的异常检测框架利用这种条件化,在去噪过程中将目标图像设定为输入图像,以引导去噪过程,从而实现无缺陷的重建,并保持正常模式。我们通过对输入图像和重建图像进行像素级和特征级的比较来定位异常。最后,为了增强特征比较的有效性,我们引入了一种域自适应方法,利用我们的条件化去噪过程生成的示例来微调特征提取器。该方法在各种数据集上进行了验证,包括MVTec和VisA基准数据集,分别实现了99.5%和99.3%的图像级AUROC的最先进结果。

1.3 Mask Attack Detection Using Vascular-weighted Motion-robust rPPG Signals

基于血管加权运动稳健rPPG信号的伪装攻击检测

论文地址:

https://arxiv.org/abs/2305.15940

在这里插入图片描述

1.4 Improved Multi-Scale Grid Rendering of Point Clouds for Radar Object Detection Networks

一种改进的雷达目标检测网络点云多尺度网格绘制方法

论文地址:

https://arxiv.org/abs/2305.15836

在这里插入图片描述
对于基于雷达的物体检测任务,将点云首先转换为网格表示,然后应用卷积神经网络的架构能够取得良好的性能。然而,从不规则的点云数据到密集的网格结构的转换通常会导致信息的丢失,这是由于点的离散化和聚合造成的。在本文中,我们提出了一种新颖的架构,即多尺度KPPillarsBEV,旨在减轻网格渲染的负面影响。具体而言,我们提出了一种新颖的网格渲染方法,即KPBEV,它利用核心点卷积的描述能力,在网格渲染过程中改进了局部点云上下文的编码。此外,我们提出了一种通用的多尺度网格渲染形式,将多尺度特征图与任意网格渲染方法结合到检测网络的卷积主干中。我们在nuScenes数据集上进行了大量实验证明了这些方法在检测性能和计算复杂度方面的优势。所提出的多尺度KPPillarsBEV架构在nuScenes验证集的Car AP4.0(匹配阈值为4米的平均精度)上相对于基线提高了5.37%,相对于先前的最先进方法提高了2.88%。此外,所提出的单尺度KPBEV网格渲染相对于基线提高了2.90%的Car AP4.0,并且保持了相同的推理速度。

1.5 Language-Guided 3D Object Detection in Point Cloud for Autonomous Driving

基于语言制导的点云自动驾驶三维目标检测

论文地址:

https://arxiv.org/abs/2305.15765

在这里插入图片描述

1.6 Learning Occupancy for Monocular 3D Object Detection

单目三维目标检测中的学习占有率

论文地址:

https://arxiv.org/abs/2305.15694

在这里插入图片描述

由于缺乏准确的3D信息,单目3D检测是一项具有挑战性的任务。现有的方法通常依赖于几何约束和密集的深度估计,以促进学习,但往往不能充分利用的好处,在锥台和3D空间的三维特征提取。在本文中,我们提出了\textbf{OccupancyM 3D},一种学习单目3D检测占用的方法。它直接学习平截头体和3D空间中的占用,从而产生更具鉴别力和信息量的3D特征和表示。具体来说,通过使用同步的原始稀疏激光雷达点云,我们定义的空间状态,并生成基于体素的占用标签。我们制定一个简单的分类问题和设计相关的占用率损失的占用率预测。所得占用估计被用来增强原始截头体/3D特征。因此,在KITTI和Waymo开放数据集上的实验表明,该方法达到了新的技术水平,并以显着的优势超越了其他方法。代码和预训练模型将在\url{https://github.com/SPengLiang/OccupancyM3D}上提供。

1.7 Towards Total Online Unsupervised Anomaly Detection and Localization in Industrial Vision

面向工业视觉的全在线无监督异常检测与定位

论文地址:

https://arxiv.org/abs/2305.15652

在这里插入图片描述

虽然现有的图像异常检测方法产生了令人印象深刻的结果,但它们大多是离线学习范式,需要过多的数据预收集,限制了它们在具有在线流数据的工业场景中的适应性。基于在线学习的图像异常检测方法与工业在线流数据更兼容,但很少受到关注。本文首次提出了一种完全在线学习的图像异常检测方法,即LeMO,用于在线图像异常检测的学习记忆方法。LeMO利用正交随机噪声初始化的可学习内存,消除了内存初始化中对过多数据的需求,并避免了离线数据收集的低效。此外,一个基于对比学习的异常检测损失函数的设计,使内存和图像目标为导向的功能在线联合优化。该方法简单、高效。大量的实验证明了LeMO在在线环境中的优越性能。此外,在离线设置中,LeMO也与当前最先进的方法竞争,并在Few-Shot场景中实现出色的性能。

1.8 Leveraging object detection for the identification of lung cancer

利用目标检测识别肺癌

论文地址:

https://arxiv.org/abs/2305.15813

在这里插入图片描述

肺癌构成了一个重大的全球公共卫生挑战,强调了早期检测对改善患者预后的重要性。深度学习算法的最新进展在医学图像分析中显示出有希望的结果。本研究的目的是探讨目标检测,特别是YOLOv5,一个先进的目标识别系统,在医学成像肺癌识别的应用。为了训练和评估算法,从Kaggle获得包括胸部X射线和对应注释的数据集。YOLOv5模型用于训练能够检测癌性肺病变的算法。训练过程涉及优化超参数和利用增强技术来增强模型的性能。经过训练的YOLOv5模型在识别肺癌病变方面表现出出色的能力,显示出高准确率和召回率。它成功地确定了胸部X光片中的恶性区域,并通过一个单独的测试集进行了验证,该测试集优于以前的技术。此外,YOLOv5模型证明了计算效率,实现了实时检测,并使其适合集成到临床程序中。这种方法有望帮助放射科医生早期发现和诊断肺癌,最终导致及时治疗和改善患者预后。

1.9 Entropy-Aware Similarity for Balanced Clustering: A Case Study with Melanoma Detection

用于平衡聚类的熵感知相似性:黑色素瘤检测的案例研究

论文地址:

https://arxiv.org/abs/2305.15417

在这里插入图片描述

聚类数据是一种无监督学习方法,旨在将一组数据点划分为多个组。它是机器学习和数据挖掘中一个关键而又苛刻的主题。它的成功应用跨越了各个领域。然而,传统的聚类技术需要考虑在特定的应用中的平衡意义。因此,本文解决了不平衡聚类问题的挑战,并提出了一种新的方法,平衡聚类,利用熵感知的相似性,这可以被定义为程度的平衡。我们创造了一个术语,熵感知的相似性平衡聚类(EASB),它最大限度地平衡在聚类过程中的互补聚类不平衡的数据,并将熵在一个新的相似性公式,占角度差异和距离。该方法的有效性在实际的黑色素瘤医学数据上进行了评估,特别是国际皮肤成像合作组织(ISIC)2019年和2020年的挑战数据集,以证明它如何在保持平衡的同时成功地对数据进行聚类。最后,我们可以确认,所提出的方法在检测黑色素瘤表现出出色的性能,与经典的方法相比。

猜你喜欢

转载自blog.csdn.net/wzk4869/article/details/130893904