原创算法：字符串查找匹配 - 代码天地

原创算法：字符串查找匹配

编程语言 2018-05-11 15:57:28 阅读次数: 1

从来没想过枯燥的算法居然也能上瘾。字符串匹配是不是可以这么做，类似于hash，但是更快

1. hash算法简化，比如取每个字符相加，
2. key长度len, 从0开始，取前len个字符hash
3. while (hash不一致 || 逐个字符比较不一致） && 没到字符串末尾
5. hash减掉当前字符，加上len+1位置字符

---------------------
3/20/2017
又想了一下，还可以改进:
相加的方法比较粗糙，基本上只有一个有效byte, 对于ab, ba很容易误判
我们可以利用寄存器长度多放几个字符，比如64位cpu, 一次可以放8个字符。
还有，hash一样对于海量数据来说是很容易发生的事情，可以引入两个或者更多的hash，计算量+1, 而冲突概率则减少了N倍。

Hash1: for(i=0;i<len;i++) hash1=hash1<<8+pattern[i]; 加减法是可逆的
Hash2: for(i=0;i<len;i++) hash2=hash1<<8^pattern[i]; 异或是可逆的

匹配的时候:
临时t_hash1=t_hash1>>>8+str[j]<<<SHIFT; 挤掉最低字符，hash上新的末尾字符
临时t_hash2=((t_hash1^str[i-1])>>>8+t_hash2<<<56) str[j]<<<SHIFT; 异或掉原来的首字符，循环左移，新的尾字符在该出现的位置上异或

这里用一个整型比较替代字符串比较，复杂度O(M+N), 需要遍历

对于长样本字符串，KMP也是个不错选择，可以根据样本尽量长的往前跳

猜你喜欢

转载自steeven.iteye.com/blog/2366365

原创算法：字符串查找匹配

字符串查找与匹配算法

字符串查找匹配算法

字符串查找与匹配之BM算法

字符串查找与匹配之KMP算法

字符串匹配算法

字符串的匹配算法

zcmu-1953 #103. 子串查找（KMP算法，字符串匹配）

字符串处理 —— 字符串匹配问题 —— 朴素的字符串匹配算法

算法字符串匹配算法

字符串匹配算法——KMP算法

KMP算法（字符串匹配算法）

字符串匹配算法 - BM算法

字符串匹配算法--BF算法

字符串匹配算法——Sunday算法

kmp算法字符串匹配算法

字符串匹配算法：Sunday算法

【算法】KMP - 字符串匹配算法

字符串匹配算法 - KMP算法

字符串匹配算法-KMP算法

字符串的匹配算法【学习算法】

【字符串】字符串匹配：KMP算法

字符串算法之KMP（字符串匹配）

字符串匹配的KMP算法

KMP-字符串匹配算法

KMP字符串匹配算法

字符串模式匹配--KMP算法

字符串匹配算法总结

字符串匹配 sunday算法

字符串匹配shiftand算法

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)