阿里天池比赛——街景字符编码识别

前言

之前参加阿里天池比赛,好久了,一直没有时间整理,现在临近毕业,趁论文外审期间,赶紧把东西整理了,5月底学校就要让我们滚蛋了,哭哭哭!!!大运会的牺牲品!!!

在这里插入图片描述

一、街景字符编码识别

先说一下比赛的基本情况吧,没有认真比赛,所以,你懂的,下面提供一下比赛连接和我的代码连接,感兴趣的小伙伴可以下载玩一玩哈。
在这里插入图片描述
比赛连接:https://tianchi.aliyun.com/competition/entrance/531795/introduction
代码连接:https://pan.baidu.com/s/1xN44KpPPxdUoEdIM9Vkvhw 提取码:fasf

1. 目标

先简单的介绍一下这个比赛,其实就是目标检测,就是把真实场景的门派号识别出来,任务就是把下面这种图片的数字按照从左到右的方式识别出来,有的人是不是已经想到了这是一个10个类的目标检测任务
在这里插入图片描述

2. 数据集

该数据来自真实场景的门牌号。训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和具体位置;为了保证比赛的公平性,测试集A包括4W张照片,测试集B包括4W张照片。
数据集图像长这样子,格式是.png
在这里插入图片描述
数据集标签长这样子,格式是json
在这里插入图片描述
需要注意的是json格式给出了一下信息,如果需要用yolov5的话,要转化为中心点+长宽的格式top 左上角坐标Y height 字符高度 left 左上角坐标X width 字符宽度 label 字符编码

3. 指标

交结果与实际图片的编码进行对比,以编码整体识别准确率为评价指标,结果越大越好,具体计算公式如下:

  S c o r e = 编 码 识 别 正 确 的 数 量 / 测 试 图 片 数 量 \ Score= 编码识别正确的数量 / 测试图片数量  Score=/

总结

以上就是今天要讲的内容,后面有时间我讲一篇详细的使用yolov5参加比赛的博客吧。

猜你喜欢

转载自blog.csdn.net/CharmsLUO/article/details/124313955