《数学之美》第12章 有限状态机—地图与本地搜索的核心技术

    智能手机的定位和导航功能,其实只有三项关键技术:

        第一,利用卫星定位

        第二,地址的识别

        第三,根据用户输入的起点和终点,在地图上规划最短路线或者最快路线

1 地址分析和有限状态机

    地址的识别和分析是本地搜索必不可少的技术。

    地址的文法是上下文有关文法中相对简单的一种,因此有许多识别和分析的方法,但最有效的是有限状态机。

    有限状态机是一个特殊的有向图,它包括一些状态(节点)和连接这些状态的有向弧。

    每一个有限状态机都有一个开始状态和一个终止状态,以及若干中间状态。每一条弧上带有从一个状态进入下一个状态的条件。

    使用有限状态机识别地址,关键要解决两个问题:即通过一些有限的地址建立状态机,以及给定一个有限状态机后,地址字串的匹配算法。

    问题:当用户输入的地址不太标准或者有错别字时,有限状态机会束手无策,因为它只能进行严格匹配。为了解决这个问题,我们希望可以看到可以进行模糊匹配,并给出一个字串为正确地址的可能性。为了实现这一目的,科学家们提出了基于概率的有限状态机。这种基于概率的有限状态机和离散的马尔可夫链基本上等效。

2 全球导航和动态规划

    可以将一个“寻找全程最短路线”的问题,分解成一个个局部最短路线的小问题。只要将这条横切线从北京向广州推移,直到广州为止,我们全程最短路线就找到了。这便是动态规划的原理了。

3 有限状态传感器

    有限状态机的应用远不止地址的识别,今天的语音识别编码器基本上是基于有限状态机的原理。

    有限状态机在语音识别和自然语言理解中起着非常重要的作用,不过这些领域使用的是一种特殊的有限状态机——加权的有限状态传感器(Weighted Finite State Transducer,简称WFST)

    有限状态传感器(Finite State Transducer)的特殊性在于,有限状态机中的每个状态由输入和输出符号定义。

    WFST中的每一条路径就是一个候选的句子,其中概率最大的那条路径就是这个句子的识别结果。

猜你喜欢

转载自blog.csdn.net/wangsiji_buaa/article/details/80196074