文本检测数据集以及标签形式说明

文本检测数据集以及标签形式说明

icdar15系列,带角度的四边形标签

 

打开标签文件,每行为一个文本框坐标以及语言类型,文字,###代表模糊不清

形式,是四边形的四个点的坐标。

ctw1500系列任意形状的数据集标签

每行共32个数字,前四个数字为该弯曲文本在整张图上的矩形框坐标值,

剩下的28个值为14个点,为相对于矩形框左上角得误差补偿即为与左上角坐标所形成的差值,形成封闭的弯曲文本框,

其计算方式可以简单的理解为:

1.将前4个坐标值的矩形框从原图中截取出来(左上右下4个点)

2.在截取之后的图中取14个点的坐标值

猜你喜欢

转载自www.cnblogs.com/ywheunji/p/12384377.html