自然语言处理——8.2 功能合一文法(Function Unification Grammar, FUG)

提出起因

  • Chomsky 短语结构语法生成能力太强,产生许多不符合语法或有歧义的句子;
  • 标记十分简单,分析能力有限,难以反映自然语言的复杂特性。

FUG 对短语结构语法的改进

  • 采用复杂特征集来描述词、句法规则、语义信息,以及句子的结构功能。
    试图以单一形式的结构模式来描述特征组合、功能分配、词条和组成成分的顺序,以达到对句子的完全功能描述。
  • 采用合一运算对复杂特征集进行运算。

复杂特征集

1. 复杂特征集功能描述的定义

设为一个功能描述 (Functional Description),当且仅当可以表示为:

其中,表示特征名,表示特征值,且满足以下两个条件:
(1) 特征名为原子,特征值为原子或另一个功能描述;
(2) ,读作:复杂特征集中,特征的值等于 。

2. 可以用复杂特征集描述词汇

在词典中单词的特征可以包括词类、形态、句法和语义等多方面的信息,如:

3. 可以用复杂特征集描述规则

4. 可以用复杂特征集描述句子

句子:
We helped her.

5. 复杂特征集的特点

(1) 允许利用多个特征描述同一个语言单位;
(2) 从结构上看,复杂特征集是一种嵌套结构,可以有效地表示复杂词组或句子结构;
(3) 特征名的定义及其相互关系具有明显的层次性,而所有自然语言的结构都是层次性的,复杂特征集的这一特点显然对语言的层次分析有益;
(4)复杂特征集便于运算,两个复杂特征集通过合一运算可以产生另一个复杂特征集,这与句法分析中词组和句子的产生是一致的。

合一运算

1. 复杂特征集相容的定义

若均为复杂特征集, 则是相容的, 当且仅当:
(1) 如果,且都是原子,那么是相容的,当且仅当;
(2) 如果 均为复杂特征集,是相容的,当且仅当 相容。

2. 合一运算的递归定义

(1) 在都是原子的情况下,如果,则, 否则;
(2) 如果均为复杂特征集,则
 (a) 若,但 的值未经定义,则属于;
 (b) 若,但 的值未经定义,则属于;
 (c) 若,但,且与 相容(不相抵触),则 属于,否则,。

合一运算的作用
(1) 合并原有的特征信息,构造新的特征结构;
(2) 检查特征的相容性和规则执行的前提条件是否满足,如果参与合一的特征相冲突,就立即宣布合一失败。

5631876-ee440d6ee5a95933.png
5631876-2a5bd7bb9411db74.png

猜你喜欢

转载自blog.csdn.net/weixin_33743661/article/details/87229758