不到1000行的正则表达式代码分析07 - 代码天地

不到1000行的正则表达式代码分析07

其他 2019-01-13 14:46:18 阅读次数: 0

不到1000行的正则表达式代码分析07
早晨先翻开ruby0.49下的regex.c，发现还是头大，因为太长了，而且逻辑太复杂，比oz的复杂了不止一个数量级。于是仍旧回到oz的grep.c下的正则引擎源码。
昨天在睡觉时，一直在想，grep.c的正则引警是NFA，因为匹配时是正则表达式作主导，而ruby0.49中正则引擎是DFA的，我没有细看代码，但名字叫DFA，应该就是文本主导的，确定型自动机算法。
昨天对NFA的匹配逻辑仍有些模糊之处。
比如"fo[0-9]*ab"是如何实现的？
今天再打开re_pmathch，其流程如下：
static char *
pmatch(char *lp,CHAR *ap)
{
while((op=*ap++) !=END)
switch(op) {

       case CLO:
           are=lp;
           switch(*ap) {

           }
           ap+=n;
           while(lp>=are) {
               if (e=pmatch(lp,ap))
                   return 3;
               --lp;
           }
       }

}
对其中的lp>=are的那个循环始终不理解，后来灵机一动，那个《精通正则表达式》一书不是讲，NFA的匹配原理时，讲过回溯吗，此处，应该就是回溯。
象用"fo.+[0-9][0-9]"去匹配"this is abcdefg 12"
此时，".*"是能匹配到行末的2的，但此时，[0-9]就无法匹配了，因此，要吐出一个来，先把2吐出，让[0-9]匹配，但第二个[0-9]仍旧无法匹配，因此，要再吐出一个，走到[0-9][0-9]匹配”12“，哈哈，此处，应该是干这事儿的。
到此，基本把nfa的匹配算法读懂了。
但dfa仍旧不懂。先在网上找找资料。

猜你喜欢

转载自blog.csdn.net/woshiyilitongdouzi/article/details/86350021

不到1000行的正则表达式代码分析07

不到1000行的正则表达式源码分析04

不到1000行的正则表达式源码分析03

不到1000行的正则表达式源码分析05

不到1000行的正则表达式源码分析06

不到1000行的正则表达式源码分析02

不到1000行的正则表达式源码分析01

Ozan S. Yigit写的grep源码分析（不到1000行的正则表达式源码）

javascript学习笔记-正则表达式-少写1000行代码的正则表达式

少写1000行代码的20个正则表达式

能让你少写1000行代码的20个正则表达式

前端，少了这20个正则表达式，你得多1000行代码！

学会这二十个正则表达式，能让你少些1000行代码！

知道这几个正则表达式，能让你少写 1000 行代码

正则表达式匹配-1000到1000整数

Javascript 正则07- 正则表达式编程

正则表达式的简单分析

正则表达式（规则+代码）

07 JS CORE String API、正则表达式

07_oracle正则表达式语法

07 grep命令与正则表达式

正则表达式（十五）——统计代码中的代码行、注释行和空白行

常用的20个正则表达式，少写千行代码

8行python代码正则表达式实现电话号码按格式筛选

正则表达式（八）——空白行

正则表达式——行起始/结束位置

正则表达式去掉重复行

【正则表达式】自动生成各类正则代码

《正则表达式》正则表达式

正则表达式

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)