比赛：
FashionAI全球挑战赛——服饰属性标签识别排名：7/2950
FashionAI全球挑战赛——服饰关键点定位排名：59/2322

FashionAI全球挑战赛——服饰属性标签识别

项目地址：team79/Tianchi_FashionAI_ClothingLabelRecognition
这个比赛当时和杭电的陶星一起组队的，然后也加了一些其他人。一段很棒的经历，水平提升不少。
尝试的方法有：
1.增强上：使用了基于人体检测的裁剪，看到很多方案都是基于热力图的裁剪，而在我们这个数据集上使用人体检测来的更为方便，再实际裁剪过程中，还需要根据分类的属性进行不同的裁剪，在length这类上能有两个百分点的提升（用的yolo和fasterrcnn）。考虑到淘宝图片亮度差异较大，也增加了亮度上的增强。亮度对比度颜色增强


# image enhancement classes
#
# For a background, see "Image Processing By Interpolation and
# Extrapolation", Paul Haeberli and Douglas Voorhies.  Available
# at http://www.graficaobscura.com/interp/index.html

2.loss上：length这类数据在复赛加入平铺之后大大加大了分类难度，比赛后期一直想方设法提高这四类的精度，检查数据和标签，我发现这几类有个共同的特点，就是处于分类边界的图像非常多。于是尝试利用标签中的M，在交叉熵loss上加入，基于M的mse的loss，效果不佳，在这之后还尝试了centerloss,soft target,target smooth这些操作，都没有见到明显的提升。

3.数据平衡上：发现本次给的数据还是存在一定的不平衡性，所以尝试了数据的平衡，具体的操作有重采样，过采样。都没有明显的提升。不过，考虑到初赛和复赛的数据的差别，我采用了一半epoch在全部数据上训练，一半在复赛数据上训练的方法，能有一定的提升。

4.数据扩充上:参考许多图像细粒度分类的论文，很多都有通过爬取图片来扩充数据提升精度的。当时陶星也爬了几十g的数据，通过模型+人工的方式对数据进行筛选分类，加入到官方数据中，结果实验发现精度反而有所降低。分析其原因可能是爬虫得到的数据标注不够准确，这次的数据尤其是length这部分，边界的图像非常多，很容易混淆。

5.模型融合:组委会对模型的大小等进行了限定，在复赛第一阶段使用了两到三个模型在最后一层concate的方法进行融合，不过在第二阶段由于忘加bn进行特征的归一化导致结果反而变差，然而电脑由于过热死机没能改正。这也是从第一阶段的第三下降到第七的原因。

FashionAI全球挑战赛——服饰关键点定位

这个主要是学妹做的，当时主要关注第一个比赛也没帮上学妹什么忙，大致思路就是直接拿关键点定位的模型跑了几个，然后直接平均融合一下。
项目地址：待整理。

FashionAI天池比赛总结 Rank7

FashionAI全球挑战赛——服饰属性标签识别

FashionAI全球挑战赛——服饰关键点定位

猜你喜欢