在线草图识别研究综述
摘要
综述了在线草图识别研究现状, 内容包括识别时机、单笔画处理、单个图符识别、图文分离和无约束笔画成组等, 最后就今后的发展和关键问题进行了总结。
问题定义
草图识别就是完成从笔迹空间到认知空间的映射, 即在某个特定应用领域内赋予草图具体的语义表达。
SBIM( sketch-based interfaces and modeling) 会议每年就基于草图的建模技术进行讨论并公布一些最新成果。GIS 领域普遍需要在地形图或航空影像上进行标图或检索作业,手绘标图以及集成了语音识别等技术的新型人机交互为该作业提供了新的选择。
首先形式化定义以下术语:
a) 笔画。用户落笔到抬笔间,笔尖所移动的轨迹。它是用户输入的最小单位,最常见的笔画形式是由二维坐标点组成的序列,一些硬件设备还提供压力、倾角等信息。
b) 基本图元。简称图元,是图形的最小组成单元,如直线、弧、圆、椭圆等。通常用户绘制的一个笔画包括一个或多个图元。
c) 图符。具有固定领域语义的图形符号,可分为单笔画图符和多笔画图符。
从不同的角度看,草图识别有二维和三维、在线( 联机) 和离线( 脱机) 、符号化草图和非符号化草图( 线条素描图) [7]之分。本文主要关注在线二维符号化草图的识别。
从草图构成层次复杂度和处理难度看,草图可分为三类:
单笔画、多笔画图形符号和多个符号组成的整幅草图,如图 1所示。前两类只包括单个图形对象的识别,第三类包含了多个对象的分割和识别,如电路图、化学分子结构图等,由于图形对象多、结构关系复杂,涉及更高层的语义获取,研究者们也称之为草图理解[10]或草图的语义理解[4]。
研究现状
2.1识别时机
2.2单笔画处理
笔画分割与图元识别
笔手势识别
2.3单个草图符号识别
(图符识别)
2.4草图理解
图文分离
a)基于单笔画特征的分类。
b) 基于笔画组特征的方法。
c) 基于上下文的联合分类。
笔画成组
a) 基于上下文的方法
b) 基于感知的方法
c) 基于搜索的方法
d) 基于特征的方法
Challenges
虽然有一些公共草图数据,但多数是单个图形,缺少笔画成组的公开测试库。
未来需要进一步研究的方向主要有:
a) 用户希望在草图能被计算机理解的同时,具有更大的绘制自由度,在线草图理解方法要在更多方面支持用户的自定义行为。
b) 部分草图符号的识别。针对该问题目前多数方法是结构方法,如何利用统计方法增强部分图符识别的鲁棒性,还值
得进一步研究。
c) 复杂图文版面的处理,如既有图形又有文本,并且是多语言、任意方向的文本。
d) 新的机器学习方法的应用和验证,如深度学习、增量学习、子空间学习、在线学习等。
e) 错误处理。尽管识别率是算法的一个重要指标,但目前的技术还达不到 100% 正确。如何自动定位和纠正错误也是提高系统性能的一个重要问题。
f) 草图识别方法的实际应用系统。应用始终是草图识别技术的最终目标
强调文本 强调文本
加粗文本 加粗文本
标记文本
删除文本
引用文本
H2O is是液体。
210 运算结果是 1024.
插入链接与图片
链接: link.
图片:
带尺寸的图片:
居中的图片:
居中并且带尺寸的图片:
当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。
如何插入一段漂亮的代码片
去博客设置页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片
.
// An highlighted block
var foo = 'bar';
生成一个适合你的列表
- 项目
- 项目
- 项目
- 项目
- 项目1
- 项目2
- 项目3
- 计划任务
- 完成任务
创建一个表格
一个简单的表格是这么创建的:
项目 | Value |
---|---|
电脑 | $1600 |
手机 | $12 |
导管 | $1 |
设定内容居中、居左、居右
使用:---------:
居中
使用:----------
居左
使用----------:
居右
第一列 | 第二列 | 第三列 |
---|---|---|
第一列文本居中 | 第二列文本居右 | 第三列文本居左 |
SmartyPants
SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:
TYPE | ASCII | HTML |
---|---|---|
Single backticks | 'Isn't this fun?' |
‘Isn’t this fun?’ |
Quotes | "Isn't this fun?" |
“Isn’t this fun?” |
Dashes | -- is en-dash, --- is em-dash |
– is en-dash, — is em-dash |
创建一个自定义列表
-
Markdown
- Text-to- HTML conversion tool Authors
- John
- Luke
如何创建一个注脚
一个具有注脚的文本。1
注释也是必不可少的
Markdown将文本转换为 HTML。
KaTeX数学公式
您可以使用渲染LaTeX数学表达式 KaTeX:
Gamma公式展示 Γ ( n ) = ( n − 1 ) ! ∀ n ∈ N \Gamma(n) = (n-1)!\quad\forall n\in\mathbb N Γ(n)=(n−1)!∀n∈N 是通过欧拉积分
Γ ( z ) = ∫ 0 ∞ t z − 1 e − t d t . \Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,. Γ(z)=∫0∞tz−1e−tdt.
你可以找到更多关于的信息 LaTeX 数学表达式here.
新的甘特图功能,丰富你的文章
- 关于 甘特图 语法,参考 这儿,
UML 图表
可以使用UML图表进行渲染。 Mermaid. 例如下面产生的一个序列图:
这将产生一个流程图。:
- 关于 Mermaid 语法,参考 这儿,
FLowchart流程图
我们依旧会支持flowchart的流程图:
- 关于 Flowchart流程图 语法,参考 这儿.
导出与导入
导出
如果你想尝试使用此编辑器, 你可以在此篇文章任意编辑。当你完成了一篇文章的写作, 在上方工具栏找到 文章导出 ,生成一个.md文件或者.html文件进行本地保存。
导入
如果你想加载一篇你写过的.md文件,在上方工具栏可以选择导入功能进行对应扩展名的文件导入,
继续你的创作。
注脚的解释 ↩︎