引入
有时候题目要求一些这样的问题
1. 求以串
本质不同的回文串个数(即长度不同或长度相同且至少有一个字符不相同的字符串)
2. 求以位置
结尾的回文串个数。
这时候使用Manacher显然有点力不从心,我们可以使用一种比较新颖的字符串处理工具回文树(Palindromic Tree)。
回文树的结构
回文树其实是由两棵树组成的森林,第一棵树的根节点是 ,第二棵树的根节点是 。每个森林中的节点其实是原串中的一个回文串。
每个节点保存以下信息:
- 表示当前节点代表的回文串的长度。特别的, ,
- 表示当前节点失配以后可能匹配的最长回文串(即当前节点的最长回文后缀),特别的 ,
- 表示当前节点的孩子,其中 表示在当前字符串前后接上字符 所形成的新回文串。
示例:下图是字符串 的回文树(实线表示 ,虚线表示 )
其实就是论文1里的图啦
不难看出
的子树保存的都是奇数长度的回文串,而
的子树中保存的都是偶数长度的回文串。
回文树的构造
回文树的构造采用增量构造。
假设我们已经构造串
的回文树。现在要求出在
后添加字符
的回文树。
定理:以新加入的字符为结尾的,且未在 中出现的回文字符串最多有 个,且必为新串的最长回文后缀。
所以只需要求出新串的最长回文后缀即可。不妨设原串 的最长回文后缀为 ,那么只要 ,则新串的最长回文后缀一定为 ,否则转移到 ,继续之前的操作。
如果新串的最长回文后缀没有在回文树中,则新建一个节点并找出它的 ,方法同上面类似。
回文树的复杂度
可以证明一个串 本质不同的回文串不超过 个,所以状态数为 。
而通过势能分析可以证明前文所述的方法时间复杂度为 (使用平衡树或c++中的map表示 )或 (使用数组表示 )。其中 为字符集大小。
回文树的一些扩展
- 从前端插入([HDU5241]Victor and String)
- 前后端插入,删除字符
- 可持久化回文树
老实说,除了第一个我都不会我还是太菜了。但论文里有详细讲解。
模板题
[APIO2014]Palindrome
Description
考虑一个只包含小写字母的字符串 ,定义一个回文串的出现值为 在 中的出现次数与其长度的乘积。求 的所有回文字串中的最大出现值。
Solution
首先建出 的回文树,定义 。可以证明最终的出现次数就是所有儿子(包括自身) 值的和。那么只需要求出 即可。方法是每次添加一个字符进回文串时给新串的 值 。
#include <bits/stdc++.h>
using namespace std;
const int maxn = 300005;
int ch[maxn][26], f[maxn], v[maxn], l[maxn], n, la, tot;
char s[maxn];
long long ans;
inline void add(int c, int n)
{
int x = la;
while(s[n - l[x] - 1] != s[n]) x = f[x];
if(!ch[x][c]) {
int v = ++tot, k = f[x]; l[v] = l[x] + 2;
while(s[n - l[k] - 1] != s[n]) k = f[k];
f[v] = ch[k][c]; ch[x][c] = v;
}
v[la = ch[x][c]]++; return;
}
int main()
{
freopen("palindrome.in", "r", stdin);
freopen("palindrome.out", "w", stdout);
scanf("%s", s + 1); n = strlen(s + 1);
l[++tot] = -1; f[0] = f[1] = 1;
for(int i = 1; i <= n; ++i) add(s[i] - 97, i);
for(int i = tot; i; --i) ans = max(ans, 1ll * l[i] * v[i]), v[f[i]] += v[i];
printf("%lld\n", ans);
return 0;
}
- 参考资料:国家集训队2017论文集《回文树及其应用》——翁文涛。 ↩