LL(1)文法

预测分析法的工作过程

从文法开始符号触发,在每一步推导过程中根据当前句型的最左非终结符A和当前输入符号a,选择正确的A-产生式。为保证分析的确定性,选出的候选式必须是唯一的。

S_文法(简单的确定性文法)

特点:

  • 每个产生式的右部都以终结符开始。
  • 同一非终结符的各个候选式的首终结符都不同。
  • S_文法不包含 ϵ \epsilon 产生式

什么时候使用 ϵ \epsilon 产生式?

如果当前某非终结符A与当前输入符a不匹配时,若存在 A ϵ A \rightarrow{\epsilon} ,可通过检查a是否可以出现在A的后面,来决定是否使用产生式 A ϵ A \rightarrow{\epsilon} 。(若文法中无 A ϵ A \rightarrow{\epsilon} ,则应报错)。

例:

文法:

  1. S a B C S\rightarrow{aBC}
  2. B b C B \rightarrow{bC}
  3. B d B B\rightarrow{dB}
  4. B ϵ B \rightarrow{\epsilon}
  5. C c C\rightarrow{c}
  6. C a C \rightarrow{a}
  7. D e D \rightarrow{e}

输入:

a d a

推导:

a B C a d B C a d C a d a aBC \Rightarrow{adBC \Rightarrow{adC \Rightarrow{ada}}}

可以看到在第三步推导中,B转成了空串。而上述文字的意思就是,由于此时输入的字符是a,而B没有候选式能够匹配,因此检查a能否出现在B的后面。换句话说,看看B后面的C能不能匹配a 如果可以匹配则可以使用B ϵ \epsilon 产生式,没有则报错。

非终结符的后继符号集

可能在某个句型中紧跟在A后边的终结符a的集合,即为FOLLOW(A), F O L L O W ( A ) = { a α A a β , a V T , a , β ( V T V N ) } FOLLOW(A) = \{a | \Rightarrow^*{\alpha A a \beta}, a \in V_T, a,\beta \in (V_T \cup V_N)^*\}

注:如果A是某个句型的最右符号,则将结束符$添加到FOLLOW(A)中。

例:

  1. S a B C S\rightarrow{aBC}
  2. B b C B \rightarrow{bC}
  3. B d B B\rightarrow{dB}
  4. B ϵ B \rightarrow{\epsilon}
  5. C c C\rightarrow{c}
  6. C a C \rightarrow{a}

那么 F O L L O W ( B ) = { a , c } FOLLOW(B)= \{a, c\}

换句话说,当输入为bd时,选择产生式2或3。而当输入为a或c时,选择产生式4。

产生式的可选集

产生式 A β A \rightarrow{\beta} 的可选集是指可以选用该产生式进行推导时对应的输入符号的集合,记为 S E L E C T ( A β ) SELECT(A \rightarrow{\beta}) 也就是说,当遇到可选集中的字符输入时,可以选用可选集对应的产生式。

  • S E L E C T ( A a β ) = a SELECT(A \rightarrow{a \beta}) = {a}
  • S E L E C T ( A ϵ ) SELECT(A \rightarrow{\epsilon}) = F O L L O W ( A ) FOLLOW(A)

q_文法

  • 每个产生式的右部或为 ϵ \epsilon ,或以终结符开始
  • 具有相同左部的产生式有不相交的可选集。
  • q_文法不含右部以非终结符打头的产生式。

串首终结符集

  • 串首终结符:串的第一个符号,并且是终结符。简称首终结符。
  • 给定一个文法符号串 α \alpha α \alpha 的串首终结符集 F I R S T ( α ) FIRST(\alpha) 被定义为可以从 α \alpha 推导出的所有串首终结符构成的集合。如果 α ϵ \alpha \Rightarrow^*{\epsilon} ,那么 ϵ \epsilon 也在 F I R S T ( α ) FIRST(\alpha)
    • 对于 α ( V T V N ) + \forall\alpha \in(V_T \cup V_N)^+ F I R S T ( α ) = a α a β , a V T , β ( V T V N ) FIRST(\alpha)={a | \alpha \Rightarrow^*{a\beta},a \in V_T, \beta \in (V_T \cup V_N)}
    • 如果 α ϵ \alpha \Rightarrow^*{\epsilon} ,那么 ϵ F I R S T ( α ) \epsilon \in FIRST(\alpha) 。( α \alpha 中的每一个符号都是非终结符,且每一个非终结符都能推导出空串)
  • 产生式 A α A \rightarrow{\alpha} 的可选集 S E L E C T SELECT
    • 如果 ϵ F I R S T ( α ) \epsilon \notin FIRST(\alpha) ,那么 S E L E C T ( A α ) = F I R S T ( α ) SELECT(A \rightarrow{\alpha}) = FIRST(\alpha)
    • 如果 ϵ F I R S T ( α ) \epsilon \in FIRST(\alpha) ,那么 S E L E C T ( A α ) = ( F I R S T ( α ) { ϵ } ) F O L L O W ( A ) SELECT(A \rightarrow{\alpha}) = (FIRST(\alpha) - \{\epsilon\}) \cup FOLLOW(A)

LL(1)文法

文法G是 L L ( 1 ) LL(1) 的,当且仅当G的任意两个具有相同左部的产生式 A α β A \rightarrow{\alpha | \beta} 满足下面的条件:

  • 不存在终结符a使得 α \alpha β \beta 都能推导出以a开头的串。
  • α \alpha β \beta 至多有一个能推导出 ϵ \epsilon

  • 如果 β ϵ \beta \Rightarrow^*{\epsilon} ,则 F I R S T ( α ) F O L L O W ( A ) = Φ FIRST(\alpha) \cap FOLLOW(A) = \Phi
  • 如果 α ϵ \alpha \Rightarrow^*{\epsilon} ,则 F I R S T ( β ) F O L L O W ( A ) = Φ FIRST(\beta) \cap FOLLOW(A) = \Phi

因为如果 β ϵ \beta \Rightarrow^*{\epsilon} ,那么 S E L E C T ( β ) SELECT(\beta) 就包含了 F O L L O W ( A ) FOLLOW(A) ,所以 F I R S T ( α ) FIRST(\alpha) 就不能包含 F O L L O W ( A ) FOLLOW(A) 中元素。不然两个的 S E L E C T SELECT 集将会相交。

  • 同一非终结符的各个产生式的可选集互不相交

猜你喜欢

转载自blog.csdn.net/hjc256/article/details/87949500