Una revisión de la investigación sobre el reconocimiento de bocetos en línea

Resumen

Este artículo revisa el estado actual de la investigación del reconocimiento de bocetos en línea, incluido el tiempo de reconocimiento, el procesamiento de un solo trazo, el reconocimiento de un solo símbolo, la separación de imágenes y texto y la agrupación de trazos sin restricciones. Finalmente, se resumen el desarrollo futuro y los problemas clave.

definición del problema

El reconocimiento de bocetos consiste en completar el mapeo desde el espacio de escritura a mano al espacio cognitivo, es decir, dar a los bocetos expresiones semánticas específicas en un campo de aplicación específico.

La conferencia SBIM (modelado e interfaces basadas en bocetos) analiza la tecnología de modelado basada en bocetos cada año y publica algunos de los resultados más recientes. En el campo SIG, generalmente es necesario realizar operaciones de mapeo o recuperación en mapas topográficos o imágenes aéreas. Los mapas dibujados a mano y la nueva interacción persona-computadora integrada con el reconocimiento de voz y otras tecnologías brindan nuevas opciones para esta operación.

Primero defina formalmente los siguientes términos:
a) Trazo . La trayectoria del movimiento de la punta del lápiz desde que el usuario deja el lápiz hasta que lo levanta. Es la unidad más pequeña para la entrada del usuario. La forma de trazo más común es una secuencia compuesta de puntos de coordenadas bidimensionales. Algunos dispositivos de hardware también proporcionan presión, inclinación y otra información.
b) Primitivas básicas . Denominados primitivos, son los componentes más pequeños de los gráficos, como líneas rectas, arcos, círculos, elipses, etc. Normalmente un trazo dibujado por el usuario incluye una o más primitivas.
c) Icono . Los símbolos gráficos con semántica de dominio fijo se pueden dividir en símbolos de un solo trazo y símbolos de varios trazos.

Desde diferentes perspectivas, el reconocimiento de bocetos se puede dividir en bocetos bidimensionales y tridimensionales, en línea (en línea) y fuera de línea (fuera de línea), bocetos simbólicos y bocetos no simbólicos (bocetos lineales) [7]. Este artículo se centra en el reconocimiento de bocetos simbólicos 2D en línea.

Desde la perspectiva de la complejidad del nivel de composición del boceto y la dificultad de procesamiento, los bocetos se pueden dividir en tres categorías:
trazos únicos, símbolos gráficos de trazos múltiples y bocetos completos compuestos de múltiples símbolos, como se muestra en la Figura 1. Las dos primeras categorías solo incluyen el reconocimiento de un único objeto gráfico, y la tercera categoría incluye la segmentación y el reconocimiento de múltiples objetos, como diagramas de circuitos, diagramas de estructuras moleculares químicas, etc. Dado que hay muchos objetos gráficos y relaciones estructurales complejas, Se trata de una adquisición semántica de nivel superior, que los investigadores también llaman comprensión de bocetos [10] o comprensión semántica de bocetos [4].

Estado de la investigación

2.1 Momento de reconocimiento

2.2 Procesamiento de un solo trazo

Segmentación de trazos y reconocimiento primitivo
Reconocimiento de gestos con lápiz

2.3 Reconocimiento de símbolo de boceto único

(reconocimiento de iconos)

2.4 Comprensión del boceto

Separación de imagen y texto
a) Clasificación basada en características de un solo trazo.
b) Método basado en características del grupo de trazos.
c) Clasificación conjunta basada en el contexto.

Agrupación de trazos
a) Método basado en el contexto
b) Método basado en la percepción
c) Método basado en la búsqueda
d) Método basado en características
Insertar descripción de la imagen aquí

Desafíos

Aunque hay algunos datos de bocetos públicos, la mayoría son de una sola forma y carecen de una biblioteca de prueba pública de grupos de trazos.
Las direcciones principales que requieren más investigación en el futuro son: a) Los usuarios esperan tener mayor libertad
al dibujar mientras sus bocetos pueden ser entendidos por las computadoras . Los métodos de comprensión de bocetos en línea deberían respaldar los comportamientos personalizados de los usuarios en más aspectos . b) Reconocimiento de símbolos de croquis parciales. Actualmente, la mayoría de los métodos para este problema son métodos estructurales . Vale la pena estudiar más a fondo cómo utilizar métodos estadísticos para mejorar la solidez del reconocimiento parcial de iconos. c) Procesamiento de diseños de textos y gráficos complejos, como gráficos y textos, y textos en múltiples idiomas y en cualquier dirección. d) Aplicación y verificación de nuevos métodos de aprendizaje automático, como aprendizaje profundo, aprendizaje incremental, aprendizaje subespacial, aprendizaje en línea, etc. e) Manejo de errores. Aunque la tasa de reconocimiento es un indicador importante del algoritmo, la tecnología actual no es 100% correcta. Cómo localizar y corregir errores automáticamente también es una cuestión importante para mejorar el rendimiento del sistema. f) Sistema de aplicación práctica del método de reconocimiento de bocetos. La aplicación es siempre el objetivo final de la tecnología de reconocimiento de bocetos.





Énfasis en el texto Énfasis en el texto

texto en negrita texto en negrita

marcar texto

Eliminar texto

texto citado

El H2O es un líquido.

El resultado de la operación 2 10 es 1024.

Insertar enlaces e imágenes

Enlace: enlace .

imagen:Alt.

Imágenes con dimensiones:Alt.

Imagen centrada:Alt.

Imagen centrada y dimensionada:Alt.

Por supuesto, para hacerlo más conveniente para los usuarios, hemos agregado la función de arrastrar y soltar imágenes.

Cómo insertar un hermoso fragmento de código

Vaya a la página de configuración del blog y elija un estilo de resaltado de fragmento de código que le guste. El mismo estilo de resaltado se muestra a continuación 代码片.

// An highlighted block
var foo = 'bar';

Genera una lista que funcione para ti

  • proyecto
    • proyecto
      • proyecto
  1. Proyecto 1
  2. Proyecto 2
  3. Proyecto 3
  • Tareas programadas
  • misión cumplida

Crear un formulario

Una tabla simple se crea así:

proyecto Valor
computadora $1600
Teléfono móvil $12
catéter $1

Establecer contenido en el centro, izquierda o derecha

Utilice :---------:el centro
. Utilice :----------la izquierda.
Utilice ----------:la derecha.

primera fila la segunda columna tercera columna
La primera columna de texto está centrada. La segunda columna de texto está a la derecha. La tercera columna de texto está a la izquierda.

Pantalones inteligentes

SmartyPants convierte caracteres de puntuación ASCII en entidades HTML de puntuación tipográfica "inteligentes". Por ejemplo:

TIPO ASCII HTML
comillas simples 'Isn't this fun?' '¿No es divertido?'
Citas "Isn't this fun?" "¿No es divertido?"
guiones -- is en-dash, --- is em-dash – es en el tablero, — es en el tablero

Crear una lista personalizada

Reducción
Herramienta de conversión de texto a HTML
Autores
John
lucas

Cómo crear un pie de página

Un texto con notas a pie de página. 1

Los comentarios también son esenciales.

Markdown convierte texto a HTML .

Fórmula matemática KaTeX

Puedes renderizar expresiones matemáticas de LaTeX usando KaTeX :

Infraestructura gamma (n) = (n − 1)! ∀ n ∈ N \Gamma(n) = (n-1)!\quad\forall n\in\mathbb NC ( n )=( n.1 )!norteN es la integral vía Euler

Γ ( z ) = ∫ 0 ∞ tz − 1 mi − tdt . \Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,.C ( z )=0tz - 1 mit dt.

Puede encontrar más información sobre las expresiones matemáticas de LaTeX aquí .

Nueva función de diagrama de Gantt para enriquecer tus artículos

2014-01-07 2014-01-09 2014-01-11 2014-01-13 2014-01-15 2014-01-17 2014-01-19 2014-01-21 已完成 进行中 计划一 计划二 现有任务 Adding GANTT diagram functionality to mermaid
  • Con respecto a la sintaxis del diagrama de Gantt , consulte aquí .

diagrama UML

Se pueden utilizar diagramas UML para renderizar. Sirena ... Por ejemplo, el diagrama de secuencia se genera a continuación:

张三 李四 王五 你好!李四, 最近怎么样? 你最近怎么样,王五? 我很好,谢谢! 我很好,谢谢! 李四想了很长时间, 文字太长了 不适合放在一行. 打量着王五... 很好... 王五, 你怎么样? 张三 李四 王五

Esto producirá un diagrama de flujo. :

链接
长方形
圆角长方形
菱形
  • Con respecto a la sintaxis de Mermaid , consulte aquí ,

diagrama de flujo

Seguiremos admitiendo diagramas de flujo de diagramas de flujo:

Created with Raphaël 2.3.0 开始 我的操作 确认? 结束 yes no
  • Con respecto a la sintaxis del diagrama de flujo , consulte aquí .

Exportar e importar

Exportar

Si quieres probar a usar este editor, puedes editar lo que quieras en este artículo. Cuando termine de escribir un artículo, busque la exportación del artículo en la barra de herramientas superior y genere un archivo .md o .html para guardarlo localmente.

importar

Si desea cargar un archivo .md que haya escrito, puede seleccionar la función de importación en la barra de herramientas superior para importar el archivo con la extensión correspondiente y
continuar con su creación.


  1. Explicación de la nota al pie↩︎

Supongo que te gusta

Origin blog.csdn.net/Peanut31434331/article/details/132398015
Recomendado
Clasificación