用有限自动机（DFA）实现字符串匹配 - 代码天地

用有限自动机（DFA）实现字符串匹配

其他 2019-11-05 00:01:16 阅读次数: 0

这个算法在算法导论上写的很晦涩，而且还搞了一大堆定义和推导。其实背后的想法很naive。

既然要做字符串匹配，那就构造一个有限自动机出来：对于长度为n的pattern，如果当前字符串匹配上了一个字符，那么自动机的状态就是1；如果当前字符串匹配上了两个字符，那么自动机的状态就是2，……如果当前字符串把整个pattren都匹配了，那么自动机的状态就是n（也就是pattern的长度）。

现在问题来了，待匹配的字符串是千变万化的，怎么办？自动机的核心——状态转移函数——应该是什么样的？注意到，状态转移函数要对每个状态和每个可能的输入都有明确的定义，所以，只能对每个状态，都把整个字母表遍历一遍。

对于每个pattern，都有一个自动机；每个自动机也只和pattern有关（当然也和字母表有关，但是和待匹配的字符串无关）。

例如，pattern是“ababc”，待匹配的字符串是“abababc”那么，当字符串已经匹配了“abab”的时候（此时自动机的当前状态是4），下一个输入字符是“a”，那么，自动机的下一个状态应该是多少呢？稍微思考10秒钟，发现自动机的下一个状态应该是3。——这就是所谓的后缀函数的本质。

然后按照这个思路想下去，得到的结论和算法导论上讲的那一堆晦涩难懂的东西，是一样的。

其实就是，先针对pattern，咬咬牙先多花点时间（时间复杂度是pattern的长度乘以字母表的长度），把“任何状态X任何输入”的结果（用最笨的方法）算出来——其实不是算出来，是像小孩数数一样数出来。然后把这结果存到一个表里面（就是有限自动机的状态转移函数的矩阵表示）。然后，不管待匹配字符串是什么，都直接去查表就行了。

猜你喜欢

转载自www.cnblogs.com/adgjl/p/11795769.html

用有限自动机（DFA）实现字符串匹配

字符串匹配-有限自动机

有限自动机字符串匹配

利用有限自动机进行字符串匹配

字符串匹配算法之：有限状态自动机

DFA(有限自动机)的实例用法，判断字符串是否是十进制

【字符串】字符串匹配：有穷自动机DFA算法

有限存储的计算机等价于有限自动机（DFA、NFA）

确定有限自动机DFA和非确定有限自动机NFA

剑指 Offer 20. 表示数值的字符串(C++) 有限状态自动机

编译原理 --- NFA（非确定有限自动机）和DFA（确定有限自动机）之间的转换以及DFA的化简

确定有限状态自动机(deterministic finite automaton)DFA

词法分析（三）：有限自动机DFA与NFA

确定有限自动机(DFA)和不确定有限自动机(NFA)的主要区别

ac自动机详解（用失配指针实现多模字符串匹配）

笔记：有限自动机

有限自动机

有限状态自动机

剑指 offer：正则表达式引擎 & 有限确定自动机DFA的代码实现 & 状态迁移表实现

[软考考点解析]软件设计师--有限自动机(DFA)

LeetCode——8.字符串转整数(atoi)【有穷状态自动机DFA】

字符串匹配（三）——初学AC自动机

ac自动机(字符串的多模式匹配)

算法导论---字符串匹配以自动机方式

【软考】——有限自动机

词法分析——有限状态自动机（FA）

TCP FSM(有限状态自动机)

有限自动机向正规式α的转换

正规式与有限自动机的等价性

非确定有限状态自动机的构建-NFA的定义和实现

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)