自然图像中的字符识别：Chars74K 数据集 - 代码天地

自然图像中的字符识别：Chars74K 数据集

业界资讯 2023-06-25 02:03:38 阅读次数: 0

字符识别是研究人员从计算机早期开始工作视觉。随着当今相机的无所不在，应用的自动字符识别比以往任何时候都更广泛。为拉丁字母，这在很大程度上被认为是一个已解决的问题受限情况，例如扫描文档的图像包含常用字符字体和统一背景。但是，使用流行的相机获得的图像和手持设备仍然对字符识别。这个问题的挑战性方面在此数据集中很明显。
数据集论文介绍：http://personal.ee.surrey.ac.uk/Personal/T.Decampos/papers/decampos_etal_visapp2009.pdf
在此数据集中，可以使用英语和卡纳达语中使用的符号。

在英语中，拉丁字母（不包括重音）和使用印度教-阿拉伯数字。为简单起见，我们称之为 “英语”字符集。我们的数据集包括：

64个班级（0-9，A-Z，A-Z）
从自然图像中获得 7705 个字符
使用平板电脑的 3410 个手绘字符
62992 从计算机字体合成字符

这总共提供了超过 74K 的图像（这解释了名称数据集）。
卡纳达语的复合符号是被视为单个类，这意味着辅音和元音导致我们数据集中的第三类。显然，这不是此类脚本，因为它会导致非常大量的类。但是，我们决定将此表示形式用于我们的基线评估出现在[deCampos等人]中，作为一种方式以评估此问题的通用识别方法。
数据集网站地址：http://www.ee.surrey.ac.uk/CVSSP/demos/chars74k/

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_41194129/article/details/131352007

自然图像中的字符识别：Chars74K 数据集

字符识别--图像的读取与数据扩充

图像数据集制作

数据集-图像匹配

各类图像数据集

遥感图像数据集

加载图像数据集

医学图像数据集

开源标准数据集 —— mnist（手写字符识别）

keras中的数据集

数据集字符集转换

自然领域中的数据集

图像识别常见的数据集

RNN识别mnist数据集

【表情识别】数据集处理

[骨架动作识别]数据集

tensorflow识别MNIST数据集

行为识别数据集

keras对minist数据集识别

图像，分类的数据集的介绍

建立自己的图像数据集

ImageNet图像数据集介绍

医学图像开源数据集

医学图像数据集汇总

常用图像数据集大全

Mnist数据集图像分类

低照度图像数据集

目标检测图像数据集

图像分类与分割数据集

[数据集]遥感图像建筑/道路数据集

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)