习题归纳:后缀数据结构的也许不是一句话题解

正题

      不同子串个数

      直接输出\sum len[i]-len[fail[i]])

      LCS - Longest Common Substring

      对第一个串建SAM,让第二个串在上面跑,跑不动就跳fail,记录下最长的匹配长度,就是答案

      [SDOI2016]生成魔咒

      每次只要加上新点的贡献,也就是加上(len[np]-len[fail[np]]),因为新拆的点没有影响

      [TJOI2019]甲苯先生和大中锋的字符串

      检查每个点的right集合大小是不是k,如果是的话就给这个节点管理的长度区间加

      Fake News (hard)

      也就是对于每一个SAM上的节点,求 \sum (len[i]-len[fail[i]])rig[i]^2

      JZPGYZ - Sevenk Love Oimaster

      建出所有串的广义后缀自动机,给每一个当前位置结束的节点打上一个该字符串的标记,然后线段树合并标记即可.

      [TJOI2015]弦论

      终于见到不用fail了,把SAM建出来,因为本身就是一个DAG,所以倒过来统计一下每一条出边有多少方案,从源暴力走就可以.

      [ZJOI2015]诸神眷顾的幻想乡

      题目保证只有20个叶子节点,就可以想到对把每一个叶子节点合到一个Trie上做广义SAM,那么最后像第一题一样统计一下就可以

      Match & Catch

      把两个串建广义SAM,rig打标记,当且仅当一个节点的两个权值都为1时更新答案.

      CF452E Three strings

      把三个串建广义SAM,还是给各个字符串位置的节点打上标记,然后统计fail子树三个权值,然后乘起来,贡献到所管理的长度区间.

      Cyclical Quest

      对S串建SAM,匹配因为要循环同构,把匹配串倍长,在SAM上跑匹配,跑不了就跳fail,如果当前匹配长度>原本匹配串长度,那么就跳fail.为了去重,我们直接在匹配l的等价类上打标记,如果到达了一个已经到达过的等价类,那么就不算贡献,否则就加上这个等价类的right集合大小,为什么?考虑等价类中两个长度相等的串必然是同一个串.

      [CTSC2012]熟悉的文章

      对于M个串,建广义SAM,然后让询问串上去跑,跑不动就跳fail,这样就可以知道对于每一个前缀i,可以匹配到的最长的后缀x有多长.记为p[i],那么就可以Dp了,首先我们先二分掉L这个限制,这个是显然符合二分性质的,我们设f[i]表示1~i匹配了f[i]个当前二分到了mid,发现对于p[i]>mid的还是要考虑一个区间,f[j]=max_{i\in[j-p[j],j-mid]}(f[i]+j-i)把它拆开就可以,i<j-p[j]的直接区间取max即可.

      [USACO17DEC]Standing Out from the Herd P

      把n个串建SAM,维护fail子树内标记的最小值和次小值,发现当前点只有最小值就更新最小值的独特值,这样就可以不用线段树合并.

      Security

      把S建SAM,建出fail树,然后线段树合并一下求出每个节点的right集合,每次询问把T串放到SAM上去跑,顺便记录一下路径,如果跑不动了,那么就不要跑了,从后往前遍历每一个经过的点,看看大于T的那些出边对应的right集合中是否包含合法的答案(也就是结束节点在l+L-1,r)即可.找到就退出

      [HEOI2016/TJOI2016]字符串

      一开始还不太会,看到题解二分两个字就会了,大概就是首先二分最长lcp的长度,因为一个长度可行小于它的长度肯定可行,相当于我们现在花费一个log把问题转化为一堆连续后缀和一个后缀求lcp,这个问题可以用主席树来维护这个后缀在sa数组中的前驱后继,找到O(1)求一下区间height的最小值.SAM大概也要二分,拿反串建后缀自动机,相当于有一堆关键点,现在求一个关键点和一个区间的关键点的最深lca,这个问题有待解决.

      SubString         

      强行用LCT来维护fail树子树和就可以了.

      Forensic Examination  

      S和T一起建广义SAM,把S[i]结束的位置记录下来,要想找到l,r所在的节点,就先找到s[r]在的位置,然后倍增跳fail.也是用线段树合并来维护T的标记.

      WD与数列

      首先相等的条件可以改成差分后第二位开始相等,所以先考虑长度为1的答案,显然是n*(n-1)/2,长度>=2的答案可以看做是[2,n]中选两个至少隔一个位置的两个子串相等.考虑将字符串建SAM,那么当两个点合并的时候我们计算一下答案,怎么计算,发现是两点距离与当前maxlen取min的形式,我们拆区间即可,即维护区间rig和 和 rig个数,因为可以转化为\sum_{j\in[i-maxlen-1,i-2]}i-j-1+\sum_{j\in[i+2,i+maxlen+1]}j-i-1+\sum_{j\in otherwise} maxlen,其中j还要是合法的rig,而且考虑的是合并的两个,所以计算完一个子树的答案,再把子树合并上去,由于查询的时间复杂度是不对的,所以总的时间复杂度就是两个log.

      

猜你喜欢

转载自blog.csdn.net/Deep_Kevin/article/details/108406002