阿里开源最大商品图库,为业界提供图像分类测评基准

记者今日获悉,今年的计算机视觉领域顶会CVPR 2020将开办一项全新赛事Retail Vision,该赛事由阿里巴巴主办,主打商品图像分类任务。阿里达摩院今天宣布,将于3月底向全世界开源业界最大商品数据集,提供商品图像分类测评基准。

△竞赛链接:https://tianchi.aliyun.com/competition/entrance/231780/information

CVPR是计算机视觉领域三大权威顶会之一,每年举办的赛事吸引全世界最顶尖的科研团队参与。CVPR挑战赛的发起方和主办方,需要具备业界一流的技术实力和公认的影响力。

达摩院视觉团队曾屡次在CVPR挑战赛中创造佳绩。去年,他们在图像识别竞赛WebVision和视觉对话竞赛Visual Dialogue Challenge上两度夺冠。今年,他们从参赛者变为了竞赛主办方,联合计算机视觉解决方案公司Trax发起图像分类挑战赛Retail Vision,推动计算机视觉技术在商品分类领域的应用。

CVPR图像分类挑战赛设置两个赛道:大规模商品图像分类任务、密集商品图像检测任务,前一任务将基于达摩院的商品数据集AliProducts进行。

△业界主流数据集对比

AliProducts是SKU级别的商品图像分类数据集,包含5万类别、300万张商品图像,商品图像的类别和总量均为业界之最。整个数据集分为训练集、验证集和测试集,完整训练集和验证集将于3月31日发布,测试集将于5月31日发布。

AliProducts的图片源自公开数据,主打细粒度、大规模分类、数据不平衡、带噪训练等技术难点,比如,SKU级别最细粒度的商品识别,需要机器精确区分商品的品牌、功能、口味、容量、含量、质量甚至批次;大规模分类方面,超5万种商品的大规模图像分类,需要克服传统机器训练方法的技术难点,迭代算法模型。

△SKU粒度的商品图像识别,需要识别商品的品牌、口味、甚至批次

如何让机器准确识别大规模、细粒度的商品图像一直是业界难题。在商品图像、视觉分析等方面的领先研究,使得达摩院团队能够发现并提出亟待解决的难点和痛点技术,并通过开源数据集和图像分类挑战赛,推动工业界与学术界紧密合作,寻找创新方法。

扫描二维码关注公众号,回复: 10332552 查看本文章
△ 如何让机器准确识别大规模、细粒度的商品图像,一直是业界难题

今年,阿里巴巴共有16篇论文入选CVPR 2020,涵盖3D视觉、目标检测以及频域图像处理等领域研究成果。
 

发布了1370 篇原创文章 · 获赞 1万+ · 访问量 665万+

猜你喜欢

转载自blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/105178012
今日推荐