Análisis de conjuntos de datos CASIA-HWDB2.0-2.2
enlace de descarga
http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html
Interpretación de conjuntos de datos
HWDB2.0-2.2 es un conjunto de datos de reconocimiento de texto de caracteres chinos escritos a mano, que contiene múltiples versiones de conjuntos de entrenamiento y conjuntos de prueba. Cada versión del conjunto de entrenamiento y del conjunto de prueba contiene varios archivos DGRL, y cada archivo DGRL contiene varias líneas de texto. Entre ellos, HWDB2.0 contiene aproximadamente 37 000 caracteres chinos, HWDB2.1 contiene aproximadamente 45 000 caracteres chinos y HWDB2.2 contiene aproximadamente 52 000 caracteres chinos. Estos conjuntos de datos se pueden usar para entrenar y probar modelos de reconocimiento de caracteres chinos escritos a mano.
OLHWDB2.0-2.2 es un conjunto de datos de reconocimiento de caracteres chinos escritos a mano en línea, que también contiene múltiples versiones de conjuntos de entrenamiento y conjuntos de prueba. Cada versión del conjunto de entrenamiento y del conjunto de prueba contiene varios archivos WPTT