补看毛片实验

    KMP好像是主要处理二进制数据匹配问题,平常的测试数据看不出他的优势。

    二进制数据的自相似率就很高了。。。。。。

你是陶拉里亚大专的一名高材生,你最近找了份给GXX教授打杂的工作。GXX教授前几天接了一个项目,与隔壁神器专业一起研究一个神秘的古代机械---仙贝。你的任务是记录每日仙贝的状态变化并统计规律。仙贝一共有两种状态:被食用和未被食用,分别记为1和0。

已知:1.仙贝的状态每秒钟随机变化一次。

     2.每当仙贝出现(|一个100M的二进制序列|)这样的变化时就会有一个panelatta先生被送进AHU监狱。

现在你拿到了1024T的仙贝数据,问在有数据记录的这段时间内一共有多少个panelatta先生被送进AHU监狱?

   你可以暴力匹配,不过你怕是众筹也凑不够用来等的时间。暴力匹配中如果有一项不符,那么前面已检测单位的信息就被浪费了,我们或许可以拿这些已知的信息做点什么。

   听说过分型吗?这类图形的特点之一就是自相似。比如这个

我们要查询的二进制文件也会碰见大量的自相似的地方,有些地方和之前的序列特别像。我们就可以利用这种已获得的相似信息来简化搜索过程。

我们先看这样一个情况:

   

猜你喜欢

转载自www.cnblogs.com/pornhub/p/9235860.html