上周学习了后缀自动机。
于是蒟蒻
在
和
的引导下逐渐对
这个东西有了自己的认识。
想法&总结
-
为啥会有 这个东西?
因为 可以做到利用 的时空来识别一个字串的 个字串。
因为 的增量构造法可以支持在线操作。
因为 建出的 树将所有状态的从属关系从图形转化成了树形。
因为 建出的 树正是其反串的后缀树。
… -
自动机上的转移边
要谈转移边,就先要提到一个神奇的词语:状态。
还记得在学习搜索的时候,我们就已经开始接触状态这个词语了。
我对状态的理解就是:记录了某一类具有相同性质的事物的集合
而对于 来说也同样是这样:同一个状态中的字串都有着相同的特点: 集合相同。这些都是后话了
而两个状态之间的联系正是神奇的转移边。
也就是说,一个字串被识别的过程正对应着 上的一条路径。
并且,这个关系是一个双射,即唯一的一个字串对应着一条唯一的路径妙不可言。 -
数组的妙用
在构建好 之后,设一个状态的大小为 。其后缀链接是 ,那么有性质:
还有就是两个状态的 就是其 的 大小。 -
与回文串的判断
对原串建立一个后缀自动机,然后用反串在上面匹配。
如果当前匹配的区间 包裹了当前状态的 中的最大值,那么 就是一个回文串。 -
广义
即对于所有的母串建立的后缀自动机。
广义 的3种建法:
5.1. 每建完一个字串之后把 指向根节点
5.2. 一个一个建,如果当前已经有相同转移就看是否需要分裂
5.3. 离线 按照层划分顺序来建。 -
可以解决的问题(动态更新)
最长公共子串
第 小的子串
第 小的本质不同的子串
某一个字串在另一个字串里的出现次数
题目收集
模板
求公共子串个数
求最长公共子串长度
求所有回文串出现次数
给两个字符串,让你求长度不小于k的公共子串的数量
给出最多10个串求最长公共子串
求第
小子串
求长度为1~n的子串出现次数的最大值
支持动态在串尾插入字符,查询在串中出现超过k次的子串的个数
后缀两两
之和
给出n个字串,对每个串求出有多少个子串在至少k个字串中出现过
给出一棵trie树,求树上所有路径组成的不同字串数
给一个字串,对于每个位置求出经过这个位置且只在字串中出现一次的子串的长度的最小值