1. 梳理第二章的内容,写一篇理解与总结。
在第二章的学习中,我们学习了符号、符号串、句子、语法树、短语、直接短语、句柄、文法、最左推导、最右推导、语言、二义性。
1、符号和符号串
字母表:字母表是元素的非空有穷集合,字母表中的元素称为符号,字母表也称为符号集。字母表中典型的符号是字母、数字、各种标点和运算符等。
符号串:字母表的符号组成任何又穷序列的符号串。如字母表A={a,b,c}则由这个字母表组成的符号串包括: {ab,ac,bc,abc,a,b,c}。如果某符号串x中有m个符号,则称其长度为m,表示为|x|=m。允许空符号串,即不包括任何符号的符号串,用ε表示,其长度为0,即|ε|=0。
符号串的运算:①符号串的连接:εx=xε=x;
②集合的乘积:AB={xy|x∈A,y∈B};{ε}A=A{ε}=A;
③符号串的幂运算:x=abc,x^2=abcabc;
④集合的幂运算:x^0= e ; x^1 = x;.....;(和小学数学的方幂一致)
⑤正闭包A+与闭包A*:A*={ε}∪A+
2、文法和语言的形式定义
文法:所谓文法就是描述语言的语法结构的形式规则。任何一个文法都可以表示为一个四元组G=(,P,S)。是一个非空的有限集合,它的每个元素称为非终结符号;是一个非空的有限集合,它的每个元素称为终结符号;S是一个特殊的非终结符号,称为文法的开始符号;P为规则(α→β)的集合。
3、文法的类型
0型文法/无限制文法:α->β,其中α∈(Vn∪Vt)*且至少含有一个非终结符,β∈(Vn∪Vt)*。 1型文法/上下文有关文法:αAβ->αuβ,其中A∈Vn,α,β∈(Vn∪Vt)*,u∈(Vn∪Vt)+。
2型文法/上下文无关文法:A->β,其中A∈Vn,β∈(Vn∪Vt)*。常用于句法分析。
3型文法/正规文法:常用于词法分析
i. 右线性文法:只能对推出式的右边展开,A->αB|α,A,B∈Vn,α∈Vt*。
ii. 左线性文法:只能对推出式的左边展开,A->Bα|α,A,B∈Vn,α∈Vt*。
4、上下文无关文法及其语法树
对于上下文无关文法,语法树是句型推导过程的几何表示。当给定一个符号串时,试图按照某文法的规则为该符号串构造推导或语法树,以此识别出它是该文法的一个句型;当符号串全部由终结符号组成时,就是识别它是不是某文法的句子。因此也有人把语法树称为语法分析树或分析树。
5、句型的分析
句型的分析是指构造一种算法,用以判断所给符号串是否为某一文法的句型(或句子)。主要分为两类方法:①自上而下分析(最右推导):从开始符推导出句子或句型;②自下而上分析(最左归约):从句子或句型归约出开始符。
6、 短语和句柄
短语:S=*>αAδ且A=+>β,则称β是相对于非终结符A的句型αAδ的短语;对应语法树中的子树概念。
直接短语:其中A=>β为直接推导;对应语法树中的简单子树。每个直接短语都是某规则的右部。
句柄:是直接短语(即某规则的右部),且具有最左性;对应简单子树中最左的一棵。
文法的二义性:如果一个文法存在某个句子对应两棵不同的语法树,包含两个或两个以上的最右(最左)推导(规约),则该文法是二义性;可以利用文法之间的等价性来消除二义性。 不改变文法中原有的语法规则,进增加一些语法的非形式定义,如优先级;构造一个等价的无二义性文法。
文法的二义性和语言的二义性:如果两个文法产生的语言相同,即L(G)=L(G?),则称这两个文法是等价的。有时,一个二义性的文法可以变换为一个等价的、无二义性的文法。有些语言,根本就不存在无二义性的文法,这样的语言称为二义性的语言。
在本章学习的内容中,大多都是概念性的,单看文字会比较难理解,但通过例子和做题便可理解和掌握本章的学习内容。
2. 尝试写出PL/0 语言的文法。
整数n
<整数> ::= [-] <数字> {<数字>}
<数字> ::= 0 | 1 | 2 | … | 8 | 9
标识符i
<标识符i> ::= <字母> { <字母> | <数字> }
<字母> ::= a | b | … | X | Y | Z
<数字> ::= 0 | 1 | 2 | … | 8 | 9
表达式e
<表达式e> ::= [+|-] <项> { <加减运算符> <项> }
<加法运算符> ::= + | -
<项> ::= <因子> { <乘法运算符> <因子> }
<因子> ::= <标识符> | <无符号整数> | ‘(’ <表达式> ‘)’
<乘法运算符> ::= * | /
<无符号整数> ::= <数字> { <数字> }
<标识符i> ::= <字母> { <字母> | <数字> }
<字母> ::= a | b | … | X | Y | Z
<数字> ::= 0 | 1 | 2 | … | 8 | 9
条件语句
::=if<条件>then<语句> ::= <表达式> <关系运算符> <表达式> | ODD <表达式>
赋值语句
<赋值语句>-> <标识符> = <表达式>
复合语句
::= BEGIN <语句> {;<语句>} END
函数
<函数> ::= <类型说明><函数名><复合语句>
<复合语句> ::= begin <语句> {;<语句>} end
<语句> ::= <赋值语句> | <条件语句> | <当型循环语句> | <过程调用语句> | <读语句> | <写语句> | <复合语句> | <空语句>
程序
<程序>-><外部声明> | <外部声明><函数>
<外部声明>-><头文件><函数声明> | <其他声明>
<函数>-><返回值类型><标识符><形参><复合语句>