初识编译原理（一）

编译的本质是一个翻译的过程，编译的输入是一个高级语言程序，输出是汇编语言程序或者机器语言程序。

过程：

词法分析的主要任务：

从左向右逐行扫描源程序的字符，识别出各个单词，确认单词的类型.
将识别出的单词转换成统一的机内表示–词法单元(token)形式

token：<种别码，属性值>

种别码：单词的词性

语法分析器（parser）从词法分析器分析输出的token序列中识别出各类短语，并构造语法分析树（parse tree）

语义分析主要任务：

文法

G=(Vt,Vn,P,S)

Vt:终结符集合
终结符(terminal symbol) 是文法所定义的语言的基本符号，有时也成为token
- 如：Vt={girl,boy,look,like}
Vn:非终结符集合
非终结符(nonterminal) 是用来表示语成分的符号，有时也称为“语法变量”
- 如：Vn={<句子>，<名词短语>，<动词短语>，<名称>…}

注意：

1. Vt、Vn相交为空集

2. Vt、Vn相并表示 文法符号集

产生式的一般形式：

graph LR
a-->B

读作：a定义为B
-

终结符
- 字母表中排在前面的小写字母,如：a、b、c
- 运算符，如：+、* 等
- 标点符号，如括号、逗号
- 数字，0、1、…9
- 粗体字符串，如：id、if等
非终结符
- 字母表中排在前面的大写字母，如：A、B、C
- 字母S。通常表示开始符号
- 小写、斜体的名字，如:expr、_stmt_等
- 代表程序构造的大写字母，如：E(表达式)、T(项)、F(因子)
字母表中排在后面的大写字母，如：X、Y、Z
表示文法符号（即终结符或非终结符）
字母表中排在后面的小写字母 （主要是 u,v、、、z）
表示终结符号串（包括空串）
小写希腊字母，表示文法符号串（包括空串）