KMP 算法(Knuth–Morris–Pratt algorithm)的基本思想

其他 2018-07-02 00:54:29 阅读次数: 0

KMP 算法(Knuth–Morris–Pratt algorithm)的基本思想

阅读本文之前，您最好能够了解 KMP 算法解决的是什么问题，最好能用暴力方式（Brute Force）解决一下该问题。
KMP 算法主要想解决的是文本搜索的问题: 给定一个模式字符串 p 和一个子串 t，找出 p 串出现在 t 串中的位置。

术语定义

"abc"(引号中的字符串): 代表字符串字面值
a…z(单个斜体小写字母): 代表字符串。
A…Z(单个大写字母)：代表单个字符。
prefix(x, n): 字符串 x 的前 n 个字符构成的子串(前缀)。
suffix(x, n): 字符串 x 的后 n 个字符构成的子串(后缀)。
|a|: 字符串 a 的长度。

如: 字符串 x = "abcdef", 则 prefix( x, 3) = "abc", suffix( x, 3) = "def"，| x| = 6。

KMP 算法的基本思想

假设字符串 x = prefix(p, n)，且存在 i > 0 使得字符串 y := prefix(x, i) := suffix(x, i),
则p, x 和 y 之间的关系如下图:

p,x,y之间的关系

若 t 串匹配到 p 串的前缀x，并且在 x 串的下一个串匹配失败，如下图:

匹配失败

仔细观察上图可以发现，此次匹配失败后，我们不用按照暴力算法直接将 p 串移动一位，从头开始比较。
而是将 prefix(x, i) 移动到 suffix(x, i) 的位置，继续比较第 |y|+1 位。
这是因为此时已经匹配成功的 p 串和 x 串(即, prefix(t,n)) 相等。
结合下图(移动后的情况)，仔细理解上一句话:

下一次匹配的情况

以上，就是 KMP 算法的最核心思想。我们不难发现，i 越大，移动之后匹配成功的字符就越多, 并且只有 i 取得最大值时，才不会移动过多的位。
因此，KMP 算法找的是使得 prefix(p, i) == suffix(p, i) 最大的 i, 记作 i_max, 此时的 y 串记作 y _max。

容易求得，每次移动的位数是 |x| - | y _max|。
将 prefix(p, 1…|p|) (即 p 串的所有前缀 ) 的 i_max 打成一个表格，就是 KMP 算法所谓的 next 数组。

猜你喜欢

转载自blog.csdn.net/yanglingwell/article/details/79829549

KMP 算法(Knuth–Morris–Pratt algorithm)的基本思想

Knuth-Morris-Pratt Algorithm（KMP算法）探赜索隐（一）

字符串匹配算法:KMP(The Knuth-Morris-Pratt Algorithm)

浅谈KMP（Knuth-Morris-Pratt）算法

从有限状态机的角度去理解Knuth-Morris-Pratt Algorithm(又叫KMP算法)

Knuth-Morris-Pratt Algorithm.

字符串匹配算法--KMP搜索(Knuth–Morris–Pratt string-searching)C语言实现与讲解

The Knuth-Morris-Pratt Algorithm in my own words(转)

模板: 字符串模式匹配 Knuth–Morris–Pratt Algorithm

Knuth-Morris-Pratt算法

kmp算法中next[]数组求法的基本思想

算法基本思想

KMP算法思想及实现

内存管理的基本思想与算法

机器学习--KNN算法基本思想

迭代（一）：迭代算法的基本思想

Knuth-Morris-Pratt Search vs Boyer-Moore Search

KMP Algorithm

串的基本操作及KMP算法

扩展KMP算法(Z-Algorithm)

串的基本操作（含KMP算法及KMP优化算法）

模拟退火算法(SA)的基本思想与算法流程

【图】普利姆算法(prim算法)基本思想

【scheduler】三. CFS调度算法基本思想

t-SNE算法的基本思想及其Python实现

回溯算法基本思想及其实现

KMP与扩展KMP算法

模式匹配算法思想和实现KMP

KMP (KMP+拓展KMP)算法总结

KMP算法

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)