【POJ】2774 - Long Long Message(HASH + 二分)

题目连接

题意:给出两个字符串,求出它们的最长公共子串(Longest Common Substring)

分析:
如果两个串的长度在1e3的话,可以直接DP。但是这道题的长度在1e5,一定会超时加爆内存,改变思路。发现hash可以做,同时需要两次二分,第一次二分LCS的长度,第二次二分查找是否有满足的值。
时间复杂度:

O ( n ( l o g ( n ) ) 2 )

空间复杂度:
O ( n )

AC代码:

#include<stdio.h>
#include<vector>
#include<algorithm>
#include<string.h>
#define hash HASH
using namespace std;
typedef unsigned long long ull;
const int maxn = 1e5+100;
const ull p = 29;
int n,m;
char a[maxn],b[maxn];
ull ha[maxn],hb[maxn],base[maxn];
vector<ull> vec;
void init(){
    base[0] = 1LL;
    for(int i = 1;i<maxn;++i)
        base[i] = base[i-1] * p;
}
void gethash(){
    ha[0] = a[0] - 'A' + 1;
    for(int i=1;i<n;++i){
        ha[i] = ha[i-1]*p + a[i] - 'A' + 1;
    }
//  for(int i=0;i<n;++i)    printf("%llu%c",ha[i],(i==n-1)?'\n':' ');
    hb[0] = b[0] - 'A' + 1;
    for(int i=1;i<m;++i){
        hb[i] = hb[i-1]*p + b[i] - 'A' + 1;
    }
//  for(int i=0;i<m;++i)    printf("%llu%c",hb[i],(i==m-1)?'\n':' ');
}
bool solve(int x){
    vec.clear();
    for(int i=x-1;i<n;++i){
        ull t = ha[i] - ha[i-x]*base[x];
        vec.push_back(t); 
    }
    sort(vec.begin(),vec.end());
    for(int i=x-1;i<m;++i){
        ull t = hb[i] - hb[i-x]*base[x];
        if(binary_search(vec.begin(),vec.end(),t))  return 1;       //二分查找vec中是否存在 t  
    }
    return 0;
}
int main(){
    init();
//  int T;
//  scanf("%d",&T);
//  while(T--){
//  
//  } 
    scanf("%s %s",a,b);
    n = strlen(a);
    m = strlen(b);
    gethash();
    int l = 0, r = min(n,m),mid,ans;
    while(l<=r){            //二分LCS的长度 
        mid = (l+r)>>1;
        if(solve(mid)){
            ans = mid;
            l = mid + 1; 
        }
        else r = mid - 1;
    }
    printf("%d\n",ans);
    return 0;
}

看别人都是用后缀数组做的,不过还没学,待补。。。

猜你喜欢

转载自blog.csdn.net/qq_41009682/article/details/81873471