【编译原理】第三章词法分析（上）

其他 2018-09-24 14:06:41 阅读次数: 0

版权声明：本文为博主原创文章，转载请标明出处 https://blog.csdn.net/C2681595858/article/details/82776489

文章目录

3.1词法分析器的作用

词法分析器的作用
将词法分析和语法分析阶段分开的原因：

3.2输入缓冲

3.2.1 缓冲区对
3.2.2哨兵标记

3.3词法单元的规约

3.3.1串和语言
3.3.2语言上的运算
3.3.3正则表达式
3.3.4正则定义
3.3.5正则表达式的扩展

3.4词法单元的识别

3.4.1状态转换图
3.4.2保留字和标识符的识别

3.1词法分析器的作用

词法分析器的作用

①生成词素。
②过滤掉注释和空白。
③将编译器生成的错误消息与源程序的位置联系起来。

将词法分析和语法分析阶段分开的原因：

①简化编译器设计。
②提高编译器的效率。
③增强编译器的可移植性。

一个标识符的属性值是一个指向符号表中该标识符对应条目的指针。
词法分析器很难发现程序中的错误。

3.2输入缓冲

快速找到正确词素

3.2.1 缓冲区对

用两个指针，一个指向开头，另一个开始向前扫描，直到发现一个词素。
并且还要注意是否达到缓冲区末尾。
两个缓冲区，一个结束，马上开始另一个缓冲区的读取，加快处理速度。
每个词素的长度不能超过N.

3.2.2哨兵标记

扩展每个缓冲区的长度，并在其末尾设置哨兵，将对缓冲区末端的测试和对当前字符的测试合二为一。

3.3词法单元的规约

3.3.1串和语言

空串用ξ表示.
前缀、后缀、子串（包括空串和本身）
真前缀，真后缀，真子串（不包括空串和本身）
连接：将两个串连在一起。
- 任何串和空串连接后得到该串本身。
指数运算：就是将多个该串连接。
- 一个串的0次方是空串，1次方是它本身。

3.3.2语言上的运算

并：类似于集合的并
连接：就是从一个集合中任取一个串和另一个集合中的任意一个串连接得到的所有串的集合。
闭包：就是将无穷多个该串进行连接操作。包括空串。
正闭包：和闭包的区别就是不包括空串。

3.3.3正则表达式

每个正则表达式都可以由较小的正则表达式按照如下规则递归的构建：
每个正则表达式r表示一个语言L( r ),

归纳基础：
- ① $\epsilon$ 是一个正则表达式，L( $\epsilon$ ) = { $\epsilon$ },即该语言只包含空串。
- ②如果a是 $\sum$ 上的一个符号，那么a是一个正则表达式，并且L(a) = {a}, .
归纳步骤:r和s是正则表达式，L（r）和L(s)是对应的语言。
- ①（r）|（s）是一个正则表达式，表示L( r) U L（s）
- ② （r）（s）是一个正则表达式，表示L( r )L(s).
- ③ （r）*是一个正则表达式，表示（L( r )）*.
- ④ （r）是一个正则表达式，表示L( r ).
正则表达式运算优先级：
- *优先级最高，并且是左结合的。
- 连接具有次优先级。
- 并（|）的优先级最低。
可以用一个正则表达式表示的集合叫做正则集合。

正则表达式遵循的代数定律：

定律	描述
r\|s = s\|r	\|是可以交换的
r\|(s \| t) = (r\|s)\|t	\|是可以结合的
r (st) = (rs)t	连接是可结合的
r(s \| t) = rs \| rt	连接对并（\|）是可分配的
$\epsilon$ r = r
r* = （r\| $\epsilon$ ）*	闭包一定包含 $\epsilon$
r ** = r*	闭包具有幂等性

3.3.4正则定义

用一个新的符号表示一个正则表达式。

3.3.5正则表达式的扩展

①一个或多个实例（+）： $r^* = r^+|\epsilon$ 和 $r^+ =rr^*=r*r$
②零个或一个实例（？）： $r? = r|\epsilon$ $L(r?) =L(r)U\{{\epsilon}\}$
? + *具有同样的优先级
③字符类： $a_1|a_2|........|a_n = [a_1a_2......a_n] =[a_1-a_n]$

3.4词法单元的识别

词法分析器返回词法单元名和属性值。

3.4.1状态转换图

关于状态转换图的要求：
- 某些状态称为最终转态或者接受状态。这些状态表明已经找到了一个词素。用双圈表示。该状态可以向语法分析器返回一个词法单元和对应属性值。
- 如果需要回退一个位置，那么在状态附近加上一个*.
- 有一个状态被指定为开始状态，该状态由一条没有出发节点的、标号为start的边指明。

3.4.2保留字和标识符的识别

各个部分的状态转换图：

猜你喜欢

转载自blog.csdn.net/C2681595858/article/details/82776489

【编译原理】第三章词法分析（上）

编译原理第三章词法分析（上）

编译原理-第三章-词法分析

总结：编译原理－－第三章词法分析

【编译原理】第三章词法分析（下）

编译原理第三章词法分析（下）

【编译原理】第三章词法分析

编译原理-第三章词法分析-3.1 词法分析器的作用

编译技术图式（第三章词法分析）

编译原理第三章词法分析内容总结

编译原理-第三章词法分析-3.6 有限自动机

第三章词法分析

第三章-词法分析

独家思维导图！让你秒懂编译原理(三)——第三章词法分析

第三章——词法分析在线测试

编译原理-第三章词法分析-3.7 从正则表达式到自动机-从正则表达式构造NFA

编译原理-第三章词法分析-3.7 从正则表达式到自动机-从NFA到DFA的转换

编译原理-第三章词法分析-3.7 从正则表达式到自动机-DFA最简化

第三章-需求分析

第三章——词法分析器的自动产生（包含LEX程序简介）

第三章 - 有穷自动机与词法分析（一）

(三)【自控原理】（第三章线性系统的时域分析法）

计算机组成原理（上）_第三章测试题

编译原理第三章

编译原理——第三章

【软件构造】第三章知识整理（上）

【Android】第三章用户界面(上)

第三章 Java内存模型（上）

Godement 《theorie des faisceaux》第三章(上）

第三章 Java面向对象（上）

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)