最长01字串

题目描述:

     已知一个长度为N的字符串,只由0和1组成, 求一个最长的子串,要求该子串出0和1出现的次数相等。

     要求算法时间复杂度尽可能的低。

     比如:  1000010111000001,加粗的部分有4个0、4个1  

思路:

(1) 最简单的想法就是遍历所有的子串,之后判断该子串是否满足条件

     N^2子串,每个子串扫一遍判断0、1是否出现的次数相等,复杂度为O(N^3)

     稍加思考就会发现, 如果一个长度为n的子串满足条件,加么这n个元素的和 加起来一定=(n/2) 

     这样在循环的过程中,增量加就可以了,不需要每个子串从头计算,复杂度降为O(N^2);

     伪码:

     输入 A[N]

复制代码

int maxlen = 0, sum = 0, currlen = 0;
for(int i = 0; i < N; ++i)
{
    sum = 0;
    for(int j = i; j < N; ++j)
    {
        currlen = j - i + 1;
        sum += int(A[j]);
        if(currlen%2 == 0 && sum == currlen/2 && currlen > maxlen)
            maxlen = currlen;
    }

复制代码

 (2) 还有没有办法进一步降低算法的复杂度呢?

      问了一下姚神,得到了这样一种巧妙的解法:定义一个数据B[N], B[i]表示从A[0...i]中 num_of_0 - num_of_1,0的个数与1的个数的差

      那么如果A[i] ~ A[j]是符合条件的子串,一定有 B[i] == B[j],因为中间的部分0、1个数相等,相减等于0。 只需要扫一遍A[N]就能把B[N]构造出来了。

      这样问题就转换成了求 距离最远的一对数,使得B[i] == B[j],因为B[i]的范围一定是[-N,N],-N到N的范围都存起来,这样每扫到B[i],查数就行了。

      其实代码真的非常简单,一个循环就搞定了,这就是算法和思考的乐趣:) 

复制代码

int A[N],B[N];
int num[2*N + 1];
int count[2] = {0,0}, maxlen = 0, currlen = 0;
memset(C, 2*N, -1);
for(int i = 0; i < N; ++i)
{
   count[ int(A[i]) ] += 1;
   B[i] = count[1] - count[0];
   if( num[ B[i] + N ] == -1)//尚不存在,B的下标是差,值是A的下标 
       num[ B[i] + N ] = i; 
   else//already exist
   {
       currlen = i - num[ B[i] + N ] + 1; //num[ B[i] + N ]是B[i]已存在的下标
       if(currlen > maxlen)
           maxlen = currlen;
   }

复制代码

转载请注明原文地址:http://www.cnblogs.com/worldisimple/archive/2012/04/13/2445051.html 

猜你喜欢

转载自blog.csdn.net/u010325193/article/details/87685314