「学习笔记」回文树/回文自动机(Palindromic Tree)

引入

有时候题目要求一些这样的问题
1. 求以串 s 本质不同的回文串个数(即长度不同或长度相同且至少有一个字符不相同的字符串)
2. 求以位置 i 结尾的回文串个数。

这时候使用Manacher显然有点力不从心,我们可以使用一种比较新颖的字符串处理工具回文树(Palindromic Tree)。

回文树的结构

回文树其实是由两棵树组成的森林,第一棵树的根节点是 o d d ,第二棵树的根节点是 e v e n 。每个森林中的节点其实是原串中的一个回文串。

每个节点保存以下信息:

  1. l e n 表示当前节点代表的回文串的长度。特别的, l e n o d d = 1 , l e n e v e n = 1
  2. f a i l 表示当前节点失配以后可能匹配的最长回文串(即当前节点的最长回文后缀),特别的 f a i l o d d = o d d , f a i l e v e n = e v e n
  3. c h 表示当前节点的孩子,其中 c h a 表示在当前字符串前后接上字符 a 所形成的新回文串。

示例:下图是字符串 b a b b a b 的回文树(实线表示 c h ,虚线表示 f a i l )

Markdown

其实就是论文1里的图啦
不难看出 o d d 的子树保存的都是奇数长度的回文串,而 e v e n 的子树中保存的都是偶数长度的回文串。

回文树的构造

回文树的构造采用增量构造。
假设我们已经构造串 s 的回文树。现在要求出在 s 后添加字符 c 的回文树。

定理:以新加入的字符为结尾的,且未在 s 中出现的回文字符串最多有 1 个,且必为新串的最长回文后缀。

所以只需要求出新串的最长回文后缀即可。不妨设原串 s 的最长回文后缀为 s i . . | s | ,那么只要 s i 1 = c ,则新串的最长回文后缀一定为 s i 1.. | s | + 1 ,否则转移到 f a i l s i . . | s | ,继续之前的操作。

如果新串的最长回文后缀没有在回文树中,则新建一个节点并找出它的 f a i l ,方法同上面类似。

回文树的复杂度

可以证明一个串 s 本质不同的回文串不超过 | s | 个,所以状态数为 O ( | s | )

而通过势能分析可以证明前文所述的方法时间复杂度为 O ( | s | l o g ) (使用平衡树或c++中的map表示 c h )或 O ( | s | ) (使用数组表示 c h )。其中 为字符集大小。

回文树的一些扩展

  1. 从前端插入([HDU5241]Victor and String)
  2. 前后端插入,删除字符
  3. 可持久化回文树

老实说,除了第一个我都不会我还是太菜了。但论文里有详细讲解。

模板题

[APIO2014]Palindrome

Description

考虑一个只包含小写字母的字符串 s ,定义一个回文串的出现值为 t s 中的出现次数与其长度的乘积。求 s 的所有回文字串中的最大出现值。

Solution

首先建出 s 的回文树,定义 v t = i = 1 | s | [ t s 1.. i ] 。可以证明最终的出现次数就是所有儿子(包括自身) v 值的和。那么只需要求出 v 即可。方法是每次添加一个字符进回文串时给新串的 v + 1

#include <bits/stdc++.h>
using namespace std;

const int maxn = 300005;
int ch[maxn][26], f[maxn], v[maxn], l[maxn], n, la, tot;
char s[maxn];
long long ans;

inline void add(int c, int n)
{
    int x = la;
    while(s[n - l[x] - 1] != s[n]) x = f[x];
    if(!ch[x][c]) {
        int v = ++tot, k = f[x]; l[v] = l[x] + 2;
        while(s[n - l[k] - 1] != s[n]) k = f[k];
        f[v] = ch[k][c]; ch[x][c] = v;
    }
    v[la = ch[x][c]]++; return;
}

int main()
{
    freopen("palindrome.in", "r", stdin);
    freopen("palindrome.out", "w", stdout);

    scanf("%s", s + 1); n = strlen(s + 1);
    l[++tot] = -1; f[0] = f[1] = 1;
    for(int i = 1; i <= n; ++i) add(s[i] - 97, i);
    for(int i = tot; i; --i) ans = max(ans, 1ll * l[i] * v[i]), v[f[i]] += v[i];
    printf("%lld\n", ans);
    return 0;
}

  1. 参考资料:国家集训队2017论文集《回文树及其应用》——翁文涛。

猜你喜欢

转载自blog.csdn.net/DSL_HN_2002/article/details/79175596