Debug图像分类模型:为什么模型会在生产环境中失效?

014578e7f780a980fe252d473b77fd5b.png

来源:AI公园
本文约1000字,建议阅读5分钟
本文讨论模型在生产中失效的一些常见模式。

计算机视觉模型在训练、验证和测试集中可以正常工作,但在生产场景中失效。

错误模式1:变体分类器(观察到了错误的地方)

模型预测了环境等虚假特征,而不是感兴趣的对象。例如,让我们看下面的示例,用预训练模型VGG16对图像的预测。这些图像是美洲狮和一些飞行昆虫的图像。虽然VGG16能够准确地预测美洲狮,但它在预测飞行昆虫身上失效了。从热图中可以看出,VGG16很好地聚焦了不变特征,即动物的身体。但是它没有聚焦在昆虫的身体上,而是分散在整个图像中。VGG16 是根据感兴趣的对象背景和环境等虚假特征预测的。因此,对于飞行昆虫物种,VGG16 是一个变体分类器。

d759eed7f293c068736640c8a8138448.png


错误模式2:生产中的观测到噪声(线索被隐藏了)

下面的图像是我从iNaturalist数据集中获取的。这些图像都被认为是有噪声的,因为主要特征模式并不明显。主要噪声模式包括照明、运动模糊、遮挡、小感兴趣区域和透视。

f5dfd6d62e0673b18172352aa9f075f3.png


错误模式3:看到不存在的东西(pareidolia)

VGG16将飞行的昆虫预测为蜘蛛。

e82003831782b21a9d00661110f5f0e5.png

可以看出,VGG16看到了不存在的蜘蛛图案,这几乎接近人类对幻视症的认知现象。实际上,在计算机视觉模型中,pareidolia这种现象的发生是已知的。

错误模式4:错误的不变性特征(异常图像)

与pareidolia不同,感兴趣的对象可能具有来自两个或多个不同动物/对象的真实图案。接受过猫和狗训练的分类器会预测这是一只猫。除非它也接受过“未知”类别的第三类训练。

65676eb6172c64181c5594ac1a75a358.jpeg


错误模式5:非常小的区别

在这种错误中,你可以看到非洲水牛和水牛之间的区别。该模型预测一个是另一个,但差异实际上非常小!

9832ab61c00b583b043c4e36393bcb01.png


错误模式6:过拟合(只关注一个地方)

该模型对这只狗的品种几乎 100% 肯定,这是对的,但从热图来看,它似乎过拟合了狗的鼻子!

19bb107dace4ea0e4b27a78cfbe0444b.png

错误模式7:欠拟合(没有观察到所有的重要的区域)

39d33b33d2ae046b3b23d318097fe6bc.png


英文原文:

https://medium.com/@emad-ezzeldin4/debugging-computer-vision-image-classification-why-is-your-model-failing-in-production-11976e5311f2

编辑:王菁

校对:林亦霖

b9ee19896d60bba829baaf3775a4466c.png

猜你喜欢

转载自blog.csdn.net/tMb8Z9Vdm66wH68VX1/article/details/130097322