FashionAI天池比赛总结 Rank7

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/hzh_0000/article/details/81149268

比赛:
FashionAI全球挑战赛——服饰属性标签识别 排名:7/2950
FashionAI全球挑战赛——服饰关键点定位 排名:59/2322

FashionAI全球挑战赛——服饰属性标签识别

项目地址:team79/Tianchi_FashionAI_ClothingLabelRecognition
这个比赛当时和杭电的陶星一起组队的,然后也加了一些其他人。一段很棒的经历,水平提升不少。
尝试的方法有:
1.增强上:使用了基于人体检测的裁剪,看到很多方案都是基于热力图的裁剪,而在我们这个数据集上使用人体检测来的更为方便,再实际裁剪过程中,还需要根据分类的属性进行不同的裁剪,在length这类上能有两个百分点的提升(用的yolo和fasterrcnn)。考虑到淘宝图片亮度差异较大,也增加了亮度上的增强。 亮度 对比度 颜色 增强


# image enhancement classes
#
# For a background, see "Image Processing By Interpolation and
# Extrapolation", Paul Haeberli and Douglas Voorhies.  Available
# at http://www.graficaobscura.com/interp/index.html

2.loss上:length这类数据在复赛加入平铺之后大大加大了分类难度,比赛后期一直想方设法提高这四类的精度,检查数据和标签,我发现这几类有个共同的特点,就是处于分类边界的图像非常多。于是尝试利用标签中的M,在交叉熵loss上加入,基于M的mse的loss,效果不佳,在这之后还尝试了centerloss,soft target,target smooth这些操作,都没有见到明显的提升。

3.数据平衡上:发现本次给的数据还是存在一定的不平衡性,所以尝试了数据的平衡,具体的操作有重采样,过采样。都没有明显的提升。不过,考虑到初赛和复赛的数据的差别,我采用了一半epoch在全部数据上训练,一半在复赛数据上训练的方法,能有一定的提升。

4.数据扩充上:参考许多图像细粒度分类的论文,很多都有通过爬取图片来扩充数据提升精度的。当时陶星也爬了几十g的数据,通过模型+人工的方式对数据进行筛选分类,加入到官方数据中,结果实验发现精度反而有所降低。分析其原因可能是爬虫得到的数据标注不够准确,这次的数据尤其是length这部分,边界的图像非常多,很容易混淆。

5.模型融合:组委会对模型的大小等进行了限定,在复赛第一阶段使用了两到三个模型在最后一层concate的方法进行融合,不过在第二阶段由于忘加bn进行特征的归一化导致结果反而变差,然而电脑由于过热死机没能改正。这也是从第一阶段的第三下降到第七的原因。

FashionAI全球挑战赛——服饰关键点定位

这个主要是学妹做的,当时主要关注第一个比赛也没帮上学妹什么忙,大致思路就是直接拿关键点定位的模型跑了几个,然后直接平均融合一下。
项目地址:待整理。

猜你喜欢

转载自blog.csdn.net/hzh_0000/article/details/81149268