自然语言处理综论-第13章小结-语言的复杂性

自然语言处理综论-第13章小结-语言的复杂性


本章介绍了两种不同的关于复杂性的思想:形式语言的复杂性和句子的复杂性,如下所示:

  • 语言可以用它的生成能力来刻画。如果一种语法能够定义的语言通过其他语法不能定义,就说这种语法比其它语法具有更大的生成能力或复杂性。Chomsky层级是建立在语法生成能力基础上的不同语法的层级。这些语法包括Turing等价语法、上下文有关语法、上下文无关语法和正则语法。
  • 抽吸引理(pumping lemma)可以用于证明一种给定的语言不是正则语言。英语不是正则语言,一些使英语变成非正则语言的句子类型使人们在分析这些句子类型时感到非常困难。数十年来人们试图证明英语不是正则语言,而是上下文无关语言。与此相反,瑞士德语的句法和Bambara语的形态是非上下文无关的,它们似乎需要使用上下文有关语法来描述。
  • 对中心嵌套句子进行剖析时会感到很困难。很多理论都一致认为,这种困难是由人们剖析时的记忆的有限性(memory limitation)引起的。

猜你喜欢

转载自blog.csdn.net/qq_17065591/article/details/109264025