¿Cuándo se debe marcar la opción "Escritura a mano" en el reconocimiento de formularios de Jinming?

136d577b9c39d813d03457773b199340.jpeg En el módulo de reconocimiento de formularios del sistema de reconocimiento de texto de formularios de Jinming, hay una casilla de verificación "escrita a mano" para que los usuarios la utilicen de forma selectiva. "Escritura a mano" aquí es la abreviatura de reconocimiento de escritura a mano. El propósito de configurar este elemento es permitir que los usuarios reconozcan con mayor precisión el texto en la imagen del formulario escrito a mano. ¿Por qué configurar esta opción por separado en lugar de que el programa la maneje automáticamente? La razón principal es que los algoritmos para el reconocimiento de texto escrito a mano y el reconocimiento de texto impreso son muy diferentes y son dos algoritmos diferentes. Las principales diferencias son las siguientes:

1. Diferencias en los conjuntos de datos: el reconocimiento de texto escrito a mano se basa en conjuntos de datos de texto escrito a mano, que contienen muestras de escritura a mano de varias personas, el reconocimiento de texto impreso se basa en conjuntos de datos de texto impreso, que generalmente se obtienen de materiales impresos, libros o documentos adquiridos.

2. Extracción de características: el reconocimiento de texto escrito a mano necesita extraer las características de letras y números escritos a mano, como la forma del trazo, la dirección, etc., mientras que el reconocimiento de texto impreso se basa en las características de las fuentes impresas, como el grosor del trazo, la forma, la curva, la etc.

3. Entrenamiento de modelos: el texto escrito a mano generalmente no es muy claro debido a la gran diferencia en la forma de la fuente.Además de usar el principio de reconocimiento óptico, el algoritmo de reconocimiento también se basa principalmente en tecnología de aprendizaje profundo, como la red neuronal convolucional (CNN) para entrenamiento; mientras se imprime Debido a la fuente ordenada del texto, el algoritmo de reconocimiento puede usar algoritmos tradicionales de aprendizaje automático, como máquinas de vectores de soporte (SVM).

4. Dificultad: el reconocimiento de texto escrito a mano es más desafiante que el reconocimiento de texto impreso, porque el texto escrito a mano generalmente tiene una gran variabilidad y los estilos de escritura de diferentes personas varían mucho, mientras que el texto impreso es muy estandarizado y uniforme, y la dificultad de reconocimiento es relativamente baja.

Se puede ver que existen grandes diferencias entre el reconocimiento de texto escrito a mano y el reconocimiento de texto impreso en términos de conjuntos de datos, extracción de características, entrenamiento de modelos y dificultad.El reconocimiento es independiente, lo que permite a los usuarios elegir libremente si el texto de la imagen es escrito.

En el módulo de reconocimiento de formularios de Jinming Recognition, si el texto principal de su imagen a reconocer está escrito a mano, recomendamos a los usuarios que marquen "Escritura a mano", de modo que el programa llamará al algoritmo de reconocimiento de escritura a mano para obtener resultados de reconocimiento de texto más precisos, y Si no hay texto escrito a mano en la imagen o solo hay muy pocos textos escritos a mano, no se recomienda marcar "Manuscrito", porque dijimos anteriormente, el reconocimiento de escritura a mano y el reconocimiento de texto impreso son algoritmos completamente diferentes, si usamos el algoritmo de reconocimiento de escritura a mano Utilizado a la fuerza para el reconocimiento de texto impreso, afectará la precisión y el efecto de su reconocimiento.

Supongo que te gusta

Origin blog.csdn.net/pictoexcel/article/details/131653921
Recomendado
Clasificación