语言概述
什么是语言?
- 语言是一定的群体用来进行 信息交流的工具。
信息交流的基础是什么?
- 按照共同约定的生成规则和理解规则去生 成“句子”和理解“句子”
例: “今节日上课始开译第一编” “今日开始上第一节编译课”
语言的特征
自然语言(Natural Language)
- 是人与人的通讯工具
- 语义(semantics):环境、背景知识、语气、二 义性——难以形式化
计算机语言(Computer Language)
- 计算机系统间、人机间通讯工具
- 严格的语法(Grammar)、语义(semantics) — —易于形式化:严格
语言的描述方法——现状
自然语言:
- 自然、方便-非形式化
- 数学语言(符号):严格、准确-形式化
- 形式化描述 :高度的抽象,严格的理论基础和方便的计 算机表示。
语言——形式化的内容提取
- 语言(Language):满足一定条件的句子集合
- 句子(Sentence):满足一定规则的单词序列
- 单词(Token):满足一定规则的字符 (Character)串
- 语言是字和组合字的规则
例(自然语言:第译始二天课今开编上节) 今天开始上第二节编译课
语言概述
语言是字及其组合规则的统一体 语言是字及其组合规则的统一体
程序设计语言——形式化的内容提取
- 程序设计语言(Programming Language):组成程序 的所有语句的集合。
- 程序(Program):满足语法规则的语句序列。
- 语句(Sentence) :满足语法规则的单词序列。
- 单词(Token) :满足词法规则的字符串。
例:变量:=表达式
if 条件表达式then 语句
while 条件表达式do 语句
call 过程名(参数表)
描述形式——文法
语法——语句
- 语句的组成规则
- 描述方法:BNF范式、语法(描述)图
词法——单词
- 单词的组成规则
- 描述方法:BNF范式、正规式
形式语言与自动机理论的产生与作用
语言学家Chomsky最初从产生语言的角度研究 语言。
1956年,通过抽象,他将语言形式地定义为是由一 个字母表中的字母组成的一些串的集合。可以在字 母表上按照一定的规则定义一个文法 (Grammar),该文法所能产生的所有句子组成的 集合就是该文法产生的语言。
**克林(Kleene)在1951年到1956年间,从识别 语言的角度研究语言,给出了语言的另一种描 述。 **
克林是在研究神经细胞中,建立了自动机,他用这 种自动机来识别语言:对于按照一定的规则构造的 任一个自动机,该自动机就定义了一个语言,这个 语言由该自动机所能识别的所有句子组成。
1959年,Chomsky通过深入研究,将他本 人的研究成果与克林的研究成果结合了起 来,不仅确定了文法和自动机分别从生成 和识别的角度去表达语言,而且证明了文 法与自动机的等价性。
20世纪50年代,人们用巴科斯范式(Backus NourForm 或Backus Normal Form,简记为 BNF)成功地对高级语言ALGOL-60进行了 描述。实际上,巴科斯范式就是上下文无关 文法(Context Free Grammar)的一种表示 形式。这一成功,使得形式语言在20世纪60 年代得到了大力的发展。
形式语言与自动机理论除了在计算机科学领域中的直 接应用外,更在计算学科人才的计算思维的培养中占 有极其重要的地位
计算思维能力的培养,主要是由基础理论系列课程实 现的,该系列主要由从数学分析开始到形式语言结束 的一些数学和抽象程度比较高的内容的课程组成。 „它们构成的是一个梯级训练系统。在此系统中,连续数学、 离散数学、计算模型等三部分内容要按阶段分开,三个阶段 对应与本学科的学生在大学学习期间的思维方式和能力的变 化与提高过程的三个步骤。