在CVPR2019的论文《Learning a Deep ConvNet for Multi-label Classification with Partial Labels》中看到label noisy这个概念,突然就想起自己处理NUS-WIDE数据库一开始就发现的问题。
刚开始处理NUS-WIDE的时候,就发现NUS-WIDE的标签不对。例如下面几张图:
这张图的标签只给了grass,没有标people
这张图的标签只给了people,没有给标grass
起初以为自己的标签打错了,后来验证了几遍发现没错,确认是原始数据库的问题。
这种情况就是label noisy,在人工标定的multi-label classification问题上很明显。
cvpr这篇论文提供了自己的处理方法,也介绍了另一篇论文《Toward Robustness against Label Noise in Training Deep Discriminative Neural Networks》。