马拉车算法(求最长回文串)

参考博客:

马拉车算法:

  • 什么是马拉车?
    Manacher算法,又叫“马拉车”,它可以在时间复杂度和空间复杂度都是O(n)的情况下,求出一个字符串的最长回文串长度(一般用法,也可以求字符串中回文串的个数)

  • 第一步,重组字符串
    例如: noon
    重组后:$#n#o#o#n#
    那为什么要这样做呢?
    1.首先,这样做的好处是不论原字符串是奇数还是偶数个,处理之后得到的字符串的个数都是奇数个,这样就不用分情况讨论了,而可以一起搞定。
    2.接下来我们还需要和处理后的字符串t等长的数组p,其中 p[i] 表示以 t[i] 字符为中心的回文子串的半径,若 p[i] = 1,则该回文子串就是 t[i] 本身,那么我们来看一个简单的例子:

    # 1 # 2 # 2 # 1 # 2 # 2 #
    1 2 1 2 5 2 1 6 1 2 3 2 1
    

    为啥我们关心回文子串的半径呢?看上面那个例子,以中间的 ‘1’ 为中心的回文子串 “#2#2#1#2#2#” 的半径是6,而未添加#号的回文子串为 “22122”,长度是5,为半径减1。这是个普遍的规律么?我们再看看之前的那个 “#b#o#b#”,我们很容易看出来以中间的 ‘o’ 为中心的回文串的半径是4,而 "bob"的长度是3,符合规律。再来看偶数个的情况 “noon”,添加#号后的回文串为 “#n#o#o#n#”,以最中间的 ‘#’ 为中心的回文串的半径是5,而 “noon” 的长度是4,完美符合规律。所以我们只要找到了最大的半径,就知道最长的回文子串的字符个数了。只知道长度无法定位子串,我们还需要知道子串的起始位置。
    我们还是先来看中间的 ‘1’ 在字符串 “#1#2#2#1#2#2#” 中的位置是7,而半径是6,貌似 7-6=1,刚好就是回文子串 “22122” 在原串 “122122” 中的起始位置1。那么我们再来验证下 “bob”,“o” 在 “#b#o#b#” 中的位置是3,但是半径是4,这一减成负的了,肯定不对。所以我们应该至少把中心位置向后移动一位,才能为0啊,那么我们就需要在前面增加一个字符,这个字符不能是#号,也不能是s中可能出现的字符,所以我们暂且就用美元号$吧,毕竟是博主最爱的东西嘛。这样都不相同的话就不会改变p值了,那么末尾要不要对应的也添加呢,其实不用的,不用加的原因是字符串的结尾标识为 ‘\0’,等于默认加过了。那此时 “o” 在 “KaTeX parse error: Expected 'EOF', got '#' at position 1: #̲b#o#b#" 中的位置是4,…#1#2#2#1#2#2#” 中的位置是8,而半径是6,这一减就是2了,而我们需要的是1,所以我们要除以2。之前的 “bob” 因为相减已经是0了,除以2还是0,没有问题。再来验证一下 “noon”,中间的 ‘#’ 在字符串 “$#n#o#o#n#” 中的位置是5,半径也是5,相减并除以2还是0,完美。可以任意试试其他的例子,都是符合这个规律的,最长子串的长度是半径减1,起始位置是中间位置减去半径再除以2。(此处偷了懒,复制了其他博客!如有侵权,请联系删除!抱歉!)

  • 第二步,理解下面这段代码

    // id 代表中心位置, mx 代表最右边的位置
    p[i] = mx > i ? min(p[id * 2 - i],mx - i):1;
    

    看上去不是很好理解,下面开始分步讲解
    首先对数据进行初始化,再对i进行判断,分为两种情况
    第一种情况,i>=mx,i在mx前面,直接让p[i]=1。
    第二种情况,i<mx,这时候就又有两种情况了,对p[j]和mx-i进行比较:
    (1)p[j]<=mx-i说明i的最右端还在mx里面,如上图所示,只需要让p[i]=p[j]即可。
    (2)p[j]>mx说明i的最右端大于mx了,如下图所示,所以我们需要对这两种情况再讨论一下,当p[j] < mx-i的时候,表示Len[i]的长度可能不会超过mx-i,所以我们就从i的p[2*id - i]也就是p[mx-i]的地方开始匹配。当p[j] > mx - i的时候,说明i位置的子串长度超过了mx,但mx以外的地方还没有遍历到,所以我们就从mx-i也就是mx的位置开始对i匹配。
    如果p[i]+i>mx,就对mx进行更新,并且将中间点id更换成i,再通过比较更新最长回文串长度,返回最大值。

  • 马拉车完整代码(求最长回文子串的长度):

/*
马拉车模板题: https://www.luogu.org/problemnew/solution/P3805
*/
//求最长回文串的长度
#include <bits/stdc++.h>
using namespace std;
const int MAXN = 32000005;
int hw[MAXN];
//马拉车
inline int Manacher(string s)
{
    //转换字符串
    memset(hw, 0, sizeof(hw));
    int len = s.length();
    string nowString = "$#";
    for(int i = 0; i < len; i++){
        nowString += s[i];
        nowString += "#";
    }
    //防止越界访问
    len = nowString.length();


    int maxRight = 0, mid = 0, maxAns = 0;
    //maxRight 最右边的位置 mid 中心的位置 maxAns 最长回文串的半径
    for(int i = 1; i < len; i++){
        if(maxRight > i){
            //当中心点没超过最右边maxRight
            hw[i] = min(maxRight - i, hw[(mid<<1) - i]);
        }
        else{
            //否则,就重新往外扩
            hw[i] = 1;
        }
        //如果当前不是最长, 就往外扩
        while(nowString[i + hw[i]] == nowString[i - hw[i]]){
            ++hw[i];
        }
        //更新最右边的位置, 同时更新最长字串的半径
        if(i + hw[i] > maxRight){
            maxRight = i + hw[i];
            mid = i;
        }
        maxAns = max(hw[i], maxAns);
    }
    //最长字串的长度等于半径减1
    return (maxAns - 1);
}
int main()
{
    ios::sync_with_stdio(false);
    string s;
    while(cin >> s){
        cout << Manacher(s) << endl;
    }
    return 0;
}


  • 马拉车求最长回文串的个数
//求回文串的个数
inline int Manacher(string s)
{
    //转换字符串
    memset(hw, 0, sizeof(hw));
    int len = s.length();
    string nowString = "$#";
    for(int i = 0; i < len; i++){
        nowString += s[i];
        nowString += "#";
    }
    //防止越界访问
    nowString += "^";
    len = nowString.length();


    int maxRight = 0, mid = 0, maxAns = 0, numAns = 0;
    //maxRight 最右边的位置 mid 中心的位置 maxAns 最长回文串的半径
    for(int i = 1; i < len; i++){
        if(maxRight > i){
            //当中心点没超过最右边maxRight
            hw[i] = min(maxRight - i, hw[(mid<<1) - i]);
        }
        else{
            //否则,就重新往外扩
            hw[i] = 1;
        }
        //如果当前不是最长, 就往外扩
        while(nowString[i + hw[i]] == nowString[i - hw[i]]){
            ++hw[i];
        }
        //更新最右边的位置, 同时更新最长字串的半径
        if(i + hw[i] > maxRight){
            maxRight = i + hw[i];
            mid = i;
        }
        //求最长回文串的长度
        //maxAns = max(hw[i], maxAns);

        //求回文串的个数
        numAns += (hw[i] / 2);

    }
    //最长字串的长度等于半径减1
    //return (maxAns - 1);

    //回文串的个数
    return numAns;
}

这里我们来探讨下为什么是:

//求回文串的个数
numAns += (hw[i] / 2);

例如:
#a#b#a#
1 2 1 4 1 2 1
这已经给出了每个字符所能延伸的半径, 例如b为4,因为这之内的所有字符都是以b字符为中心对称,又因为字符串中加入了#字符,所以以b字符为中心点的回文串个数为hw[b的下标] / 2

  • 求最长回文串
//求最长回文串
inline string Manacher(string s)
{
    //转换字符串
    memset(hw, 0, sizeof(hw));
    int len = s.length();
    string nowString = "$#";
    for(int i = 0; i < len; i++){
        nowString += s[i];
        nowString += "#";
    }
    //防止越界访问
    nowString += "^";
    len = nowString.length();


    int maxRight = 0, mid = 0, maxLen = 0, maxPoint = 0;
    //maxRight 最右边的位置 mid 中心的位置 maxAns 最长回文串的半径
    for(int i = 1; i < len; i++){
        if(maxRight > i){
            //当中心点没超过最右边maxRight
            hw[i] = min(maxRight - i, hw[(mid<<1) - i]);
        }
        else{
            //否则,就重新往外扩
            hw[i] = 1;
        }
        //如果当前不是最长, 就往外扩
        while(nowString[i + hw[i]] == nowString[i - hw[i]]){
            ++hw[i];
        }
        //更新最右边的位置, 同时更新最长字串的半径
        if(i + hw[i] > maxRight){
            maxRight = i + hw[i];
            mid = i;
        }

        if(hw[i] > maxLen){
            maxLen = hw[i];
            maxPoint = i;   //最长回文串的中心位置
        }

    }

    //截取最长回文串
    //这里为啥这样写,在本博客前文已经提到过: 1. 第一步,重组字符串
    return s.substr((maxPoint - maxLen) / 2, maxLen - 1);
}

后续再补上一些例题,以及求字符串中所有的回文串个数,最长的回文串!

2019.07.26, 已经将基本的马拉车算法应用补上.

待补题: 杭电6599

http://acm.hdu.edu.cn/showproblem.php?pid=6599

发布了27 篇原创文章 · 获赞 5 · 访问量 2505

猜你喜欢

转载自blog.csdn.net/HKer_YM/article/details/97324141