Manacher 算法学习小记

概要

一个字符串有多少个回文的字串？最多有 \(O(n^2)\) 级别个。但 Manacher 算法却可以用 \(O(n)\) 的时间复杂度解决这个问题。同时 Manacher 算法实现非常简单。

一个显而易见的结论是：如果 \(S_{1\cdots n}\) 是回文串，那么 \(S_{2\cdots n-1}\) 也是回文串。

根据这一个性质，我们可以得到 \(O(n^2)\) 的暴力的做法：

以 \(i\) 为中心，向两侧暴力扩展，得到所有以 \(i\) 位中心的回文串。这些回文串长度为奇数。

以 \(i\) 和 \(i+1\) 为中心，向两侧暴力扩展，得到所有以 \(i\) 和 \(i+1\) 为中心的回文串。这些回文串的长度为偶数。

实际上，为了方便实现，可以在两个字符间和首尾插入空字符。这样所有的回文串的长度都变为奇数。下面默认使用了这种方法，所有回文串长度为奇数，下标从 \(1\) 开始。

Manacher 充分利用了回文的性质，构造出令人惊叹的巧妙做法：

令 \(d_i\) 表示以 \(i\) 为中心的回文串最大长度的一半，那么只要求得 \(d\) ，就可以知道所有回文串的信息。

不妨令 \(l,r\) 表示当前考虑到的回文串中 右端点最靠右 的那个回文串。初始时不妨令 \(l=r=0\) 。

从左到右枚举回文中心 \(i\) 。如果 \(i > r\) ，那么调用暴力算法求得 \(d_i\) 。否则可以找到回文串 \(S_{l\cdots r}\) 中与 \(i\) 对称的位置 \(j=l+(r-i)\) 。此时，如果 \(i+d_j < r\) ，那么根据 \(S_{l\cdots r}\) 的对称性， \(d_i=d_j\) 。否则的话，由于无法保证 \(r\) 之后与 \(l\) 之前的对称性，先令 \(d_i=r-i\) ，再在此基础上执行暴力算法。

最后不要忘记更新 \(l,r\) 。

不难发现， \(r\) 是不减的。而暴力算法中向两侧暴力拓展的次数不超过 \(r\) 增加的值。所以 Manacher 算法中，暴力的部分均摊是 \(O(n)\) 的。外层循环也是 \(O(n)\) ，那么总的时间复杂度就是 \(O(n)\) 的。

例

luogu4555

\(S\) 长度 \(1e5\) 我线段树一只 \(log\) T 了？这个评测机略微有点快啊……不过可以 \(O(n)\) 的……

在 Manacher 之后，可以 \(O(n)\) 预处理出对于每个位置 \(i\) 为结尾的最长回文串和以 \(i\) 为开始的最长回文串。通过加入的空字符统计答案即可。注意必须要是两个回文串，所以单一一个空字符不能算作回文。

#include <cstdio>
#include <cstring>
#include <algorithm>

const int Maxn = 100010;
const int INF = 1e9;
char Ch[Maxn << 1];
int D[Maxn << 1];
int n, Ans, L[Maxn << 1], R[Maxn << 1];

inline void Manacher();

int main() {
    scanf("%s", Ch + 1);
    n = strlen(Ch + 1);
    for (int i = n; i >= 1; --i) Ch[i << 1] = Ch[i];
    for (int i = 0; i <= n; ++i) Ch[i << 1 | 1] = '_';
    n = n << 1 | 1;
    Ch[0] = '*', Ch[n + 1] = '\0';
    Manacher();
    for (int i = 1; i <= n; ++i) {
        L[i + D[i]] = std::max(L[i + D[i]], D[i]);
        R[i - D[i]] = std::max(R[i - D[i]], D[i]);
    }
    for (int i = 1; i <= n; ++i)
        if (i & 1) 
            R[i] = std::max(R[i], R[i - 2] - 2);
    for (int i = n; i >= 1; --i)
        if (i & 1)
            L[i] = std::max(L[i], L[i + 2] - 2);
    Ans = 0;
    for (int i = 1; i <= n; ++i)
        if (R[i] && L[i])
            Ans = std::max(Ans, R[i] + L[i]);
    printf("%d\n", Ans);
    return 0;
}

inline void Spand(int x) {
    for(; Ch[x - D[x] - 1] == Ch[x + D[x] + 1]; ++D[x]);
    return;
}

inline void Manacher() {
    int L = 0, R = 0;
    for (int i = 1; i <= n; ++i) {
        if (i > R) {
            Spand(i);
            L = i - D[i], R = i + D[i];
            continue;
        }
        int Ops = L + (R - i);
        if (i + D[Ops] >= R) {
            D[i] = R - i;
            Spand(i);
            L = i - D[i], R = i + D[i];
            continue;
        }
        D[i] = D[Ops];
    }
    return;
}

Manacher 算法学习小记

概要

例

猜你喜欢