求一个字符串中连续出现次数最多的子串

http://blog.csdn.net/imcdragon/article/details/6838565解答二

http://hi.baidu.com/icyday315/item/040aadab454c8a97151073da合并思路(不能重复abcdabcd 就不行了,abcda是最长重复子串)

  1. /*
  2. Author:Mcdragon
  3. Date:15-07-1121:17
  4. Description:求一个字符串中连续出现次数最多的子串.
  5. 基本算法描述:
  6. 给出一个字符串abababa
  7. 1.穷举出所有的后缀子串
  8. substrs[0]=abababa;
  9. substrs[1]=bababa;
  10. substrs[2]=ababa;
  11. substrs[3]=baba;
  12. substrs[4]=aba;
  13. substrs[5]=ba;
  14. substrs[6]=a;
  15. 2.然后进行比较
  16. substrs[0]比substrs[1]多了一个字母,如果说存在连续匹配的字符,那么
  17. substrs[0]的第1个字母要跟substrs[1]首字母匹配,同理
  18. substrs[0]的前2个字母要跟substrs[2]的前2个字母匹配(否则不能叫连续匹配)
  19. substrs[0]的前n个字母要跟substrs[n]的前n个字母匹配.
  20. 如果匹配的并记下匹配次数.如此可以求得最长连续匹配子串.
  21. */

这个题目不是编程珠玑上看到的,但是解法用到的数据结构在编程珠玑上有讲到,先归类到这里。

求一个字符串中连续出现的次数最多的子串。例如字符串“abababc”,最多连续出现的为ab,连续出现三次。要和求一个字符串中的最长重复子串区分开来,还是上面的字符串,那么最长的重复子串为abab。两个题目的解法有些类似,都用到了后缀数组这个数据结构。求一个字符串中连续出现的次数最多的子串,首先生成后缀数组例如上面的字符串为:
abababc
bababc
ababc
babc
abc
bc
c
可以看出第一个后缀数组和第三个后缀数组的起始都为ab,第5个后缀数组也为ab。可以看出规律来,一个字符串s,如果第一次出现在后缀数组i的前面,那么如果它重复出现,下一次出现应该在第i+len(s)个后缀数组的前面。这个规律也不难看出。那么从头到尾按照这个规律搜索下不难得出结果。下面是代码:


[cpp]
view plain copy
 
  1. #include<iostream>
  2. usingnamespacestd;
  3. intcon_sub(char*str,char**ret);
  4. intmain()
  5. {
  6. charstr[]="abcabcabcabcabcabbbb";
  7. char*ret=NULL;
  8. inttime=con_sub(str,&ret);
  9. printf("%soccuers%dtimes\n",ret,time);
  10. return0;
  11. }
  12. intcon_sub(char*str,char**ret)
  13. {
  14. intmax_time=0;//连续出现的最多次数
  15. intret_len=0;//连续出现的字符串的长度
  16. char*addr=NULL;//连续出现字符串的起始地址
  17. intlen=strlen(str);
  18. char**a=(char**)malloc(sizeof(char*)*len);
  19. //生成后缀数组
  20. for(inti=0;i<len;i++)
  21. a[i]=&str[i];
  22. //重复字符串的长度范围为1到(len+1)/2
  23. for(inti=1;i<=(len+1)/2;i++)
  24. {
  25. //当重复的字符串长度为i的时候,如果是连续出现的,那么第j和第j+i个后缀数组前面为重复的字符串
  26. for(intj=0;j+i<=len-1;j+=i)
  27. {
  28. intk=j;
  29. inttemp_time=1;
  30. while(k+i<=len-1&&strncmp(a[k],a[k+i],i)==0)
  31. {
  32. temp_time++;
  33. k+=i;
  34. }
  35. if(temp_time>max_time)
  36. {
  37. max_time=temp_time;
  38. ret_len=i;
  39. addr=a[k];
  40. }
  41. }
  42. }
  43. *ret=newchar[len+1];
  44. strncpy(*ret,addr,ret_len);
  45. returnmax_time;
  46. }

猜你喜欢

转载自vergilwang.iteye.com/blog/2011225
今日推荐