【语言学】论语言学知识点

版权声明:可以转载奥 https://blog.csdn.net/Jiajikang_jjk/article/details/83585109

论语言学知识点

前言

       最近一两篇博文是连载的,上一篇是关于 统计学 知识点概率,这一篇学习的是关于语言学的简单了解。
关于自然语言处理小分支的学习笔记都在 博主的这个专栏中,若是浏览至此,有任何意见和建议欢迎老铁给菜鸟留言,以此我们共同进步。

说明

       以下内容都是博主学习书籍所获,多半都是博主用自己的大舌头作为总结性的陈述至此,谨慎借鉴奥!!!

一、语音

1、 What is 语音???

       言简意赅就是说,通过人的发音器官----->发出有意义的内容(可不是大吼大叫的噪音奥)------->用于社会交际的声音

2、语音的三大属性

物理属性

       物理属性,顾名思义,这里用于物理学知识来理解,语音的本质是音波,由发声体振动而产生。因此语音同自然界其他声音一样,拥有音高、音强、音长、音色四种要素。

生理属性

       语音是由人的发音器官发出的,后者根据参与发音过程的先后顺序可分为三个部分:肺、气管、胸腔、横膈膜等呼吸器官,它们主要通过呼出气流为发音提供原动力;喉头、声带等发声器官,黏附在喉头的软骨上,由两片薄膜构成的声带在气流冲击下发生振动,形成音波;咽腔、鼻腔、口腔处的调音器官,它们将把从声带传出的音波进行加工,从而产生我们人耳听到的各种语音。

社会属性

语言是一套符号系统,语音作为其重要组成部分也是如此。语音的社会性质主要有以下三个方面:
       ⊚ 语音与相应语义之间的关系是非必然的,约定俗成的。汉语普通话中的[dà lù] 可以用来指代陆地,也可以用来指代宽广的道路。不同语言间的音义规定差别则更为明显,同样是苹果,英国人就会说成是“apple”。
       ⊚ 语音具有地域性、民族性。上面说到音义之间的对应关系是人为规定的,但是这种规定如果不能得到一个区域内特定群体的广泛认同,则人与人之间就无法进行有效的交流。如果进一步放任音义关系的随意扩展,那么就有可能产生《圣经》中“巴别塔”般的悲剧。为了避免上述现象的发生,不同民族和地区的人们在地理文化的差异下便产生了成百上千种各具特色的语言。
       ⊚ 语音具有系统性。这就意味着不同语言或方言拥有着不同的语音元素以及不同的内部关系。同样是说“牛奶”和“男人”这两个词,北京人和四川人就会有两种不同的发音结果(四川方言存在[n][l] 不分的情况)。

总结如下:
       社会属性没有一定性,都是按照各个不同的民族,国家(地域性,民族性)有各自的语言,就比如中国甘肃省和云南省都有自己的方言是一个道理, 在同一个语音在语义上也未必表达的是同一个意思。

3、 语音单位

       1、 音素
       2、 音节
       3、 声母、韵母、声调
       4、 音位

4、记音符号

       历史上汉语的记音方法很多,诸如反切法、“注音符号”(至今台湾等地区还在使用)标记等。现在国内通行的是1958 年审议通过的《汉语拼音方案》,相信绝大多数读者在小学语文课堂上就学习了相应的知识,在此就不再赘述。另外需要重点介绍的,也是目前国际上通用的记音符号就是国际音标(International Phonetic Alphabet,简称IPA)。它采用一符一音原则,大部分符号采用拉丁小写字母及其变体(如倒写、反写、合写、添加附加符号等)。
       注:赵元任和瞿霭堂两位先生的发音最为经典。

5、共时语流音变

       看名称好高大,,,其实就是一个音变。
       1、 变调
       2、 儿化

二、 词汇

what is 词汇

       是某种特定语言里所有词和固定短语的总和。
       大白话就是词和固定的短语统称为词汇。

词汇单位

1、语素

       构词的单位,语言中最小的音义结合体。例如,“笔”就是一个语素,它的语音形式是[sh],它的词汇意义是“写字、画图的工具”,语法意义是“名词、量词”及相关的语法作用。
       从音节角度看,语素有单复音节之分。现代汉语中绝大部分是由一个音节构成的语素,如“天、地、人、山、海、的、啥、啊”等;而复音节语素是指由两个及其以上音节构成的语素,如“蝴蝶、鸳鸯、玻璃、抠门、布宜诺斯艾利斯”等;另外还有小于一个音节的特殊语素,如“鸟儿”的“儿”字因是儿化标记,只算半个语素。
       有一个简单的判别语素的方法——“替代法”,即用一个新语素替代尚未确定为语素的语言单位,其间还要注意替代前后另外一个未被替代的语素,其意义不能发生变化。以“抠门”为例,该词虽可被替换为“铁门”“抠鼻子”等,然而“抠门”合在一起表示的“小气、不大方”义,并非拆开后各自的“用手指或细小的东西挖”“建筑物的出入口”等义简单组合就可得到。
       对于复音节语素,其语义常常是确定的,其组成元素也往往是不容随意更改的。
       从表意虚实看,语素还分为实语素和虚语素。前者有具体的词汇意义,如“天、人、喜”等;后者则只表示抽象的语法意义,如“吗、的、老(公)”等。
       从构词能力看,还有成词语素与不成词语素之分。前者又叫自由语素,指既能单独成词又可以与其他语素组合成词的语素,如“马跑了。”这句话中的成词语素“马”既可以单用,也可以组合成“白马、骏马、老马”等。而不成词语素则是指不能独立成词,必须和别的语素组合在一起的语素,也称黏着语素。不成词语素又可以分为两类,一类位置自由、承担了所成词部分乃至全部的基本意义,如“卉、健、民、丽”等,它与成词语素合在一起被称作词根,是词义的承担者;另一类位置固定只表示一些附加语义,被称作词缀,依所在位置被进一步分为前缀、中缀、后缀,如“者、第、化(白热化)、里(稀里哗啦)”等。

2、 词
3、固定短语
4、缩略语

注: 词,固定短语,缩略词就不多说了,,,,

词的构成

1、单纯词:只由一个语素构成的词。

        联绵词,叠音词,拟声词,音译外来词。

2、合成词:由两个及以上语素构成的词,主要由以下几类

       复合词,重叠词,附加词

词汇的构成

        现代汉语词汇分为基本词汇与一般词汇两类。前者具有稳固性、能产性、全民通用性等特征,是机器翻译训练集的理想词源;后者包括古语词、方言词、外来词、行业语、熟语及新兴的网络用语等,这些词数量多、适用范围窄、更新速度快,是专语语料库的主要面向对象,但并不适合作为机器自动学习的词汇语法教科书。

词义及其分类

1、什么是词义

       词义是词的意义,广义上包括词汇意义和语法意。

2、词义的分类

       理性义:也称概念义,是词义中反应事物概念的意义部分。
       色彩义:也称附属义,是附着在理性义之上旨在表达评价、形象等内容的词义部分。

义项与义素

义项

       词的理性意义的分项说明。例如,“经过”就有两个义项:一是“通过”,二是“经历的过程”。一个词若同时拥有几个义项,那其中必有一个义项是最为基本、常用的,我们把它称作基本义;其他的一些义项一般都是由它直接或间接转变而来的,我们称之为转义。根据转义产生的方式,又可以细分为两种:引申义与比喻义。前者是基本义经过推演而形成的意义,如“锤”基本义是“敲打物件的器具”,后来也引申为“用锤敲打”这一动作;后者是基本义被用来比喻为另一事物后逐渐固定下来的新意,如“手足”原指手脚,后也用它来比喻“兄弟”。
       根据词义项的多少我们可以将其分为单义词和多义词。值得注意的是,日常生活中我们很容易把多义词与一些特殊的同音词混淆在一起。多义词就是有两个及以上义项的词,而同音词则是语音相同而意义毫联系的一组词。试看一对例子:“广”是一个多义词,既可以在“宽广”中指“面积、范围宽阔”;又能在“广开言路”中作动词,表“扩大、扩充”义。而“花”则是由一组同音词构成的,一组以“花朵”为基本义,另一组如“花钱、花销”等,则是词义与前者毫不相干的另一组词。

义素

       和语音学部分所讲的“音素”“音位”类似,词义部分也有义素与义位两组概念。前者是最小的不能独立运用的意义单位,也称词的语义特征;后者则是最小的能独立运用的意义单位,略等于之前所讲的义项。有了这样一组概念,接下来我们就可以使用一种名为“义素分析法”的手段来深入分析词的内部意义构成,举例如下。
       父亲——[+ 男性+ 长辈+ 血亲] 伯父——[+ 男性+ 长辈—血亲]
       妹妹——[+ 女性-长辈+ 血亲] 姨妈——[+ 女性+ 长辈——血亲]
       要注意,只有相关的词才可以进行义素分析,反之如“大海”与“狗”,因二者词义相差过大而很难总结出较为短小的几条区别特征。另外,义素的选取也尤为重要,要仔细分析出一组可以区别目标词的特征,然后用“[]”将其标注出来,在前面用“+”“-”号进行分析。

语义场

       物理学上把物理量在空间中某个特定区域内的分布称为场,有温度场、引力场、电场、磁场等。语义学中也引入了“场”的概念,从而形成了语义场,它是根据词义的共同特点或关系划分出来的类。同场词有着共同的语义区别特征,同时其各个义素前正负号的差异又将它们在同一个语义场中做出区别。
只要词在同一语义场内,就可以认为其具有相关性,从而进行义素分析。那么语义场到底有哪些呢?根据场中各成员间的关系不同,语义场可以粗分为以下几类。

       (1) 类属义场场内成员同属于一个更高层的类,如“诗歌 散文 小说”都属于文学体裁类,其中“诗歌”“散文”等我们称其为下位词,“文学体裁”我们称其为上位词。上下位的概念是相对的、不断转换的,如“诗歌”就可以进一步细分为“古诗、近体诗、现代诗歌” 等。
       (2) 顺序义场场内成员之间存在某种顺序排列,如“状元 榜眼 探花”“立春 雨水 惊蛰” 等。
       (3) 同义义场场内成员意义相同或相近,如“高兴 开心 喜悦”“集合 汇合聚集” 等。
       (4) 反义义场与同义义场相反,场内成员意义相反或相对,如“高贵 卑贱”“干净 邋遢” 等。
       (5) 其他关系义场除上述义场外,仍有部分语义关系无法得以充分归纳,所以将其单列一项,一齐算入“其他关系义场”。例如:“父母 子女”“前边 后边” 等

三、语法

1、 what is 语法

       语法是语言三要素之一(另有语音、语义),专指一种语言中语素、词、短语和句子等有意义的语言单位由小到大组合所依据的规则。

2、词类

       词类是词在语法性质方面划分出的类别,主要依据三个标准:语法功能、形态和意义。其中尤以语法功能标准最为重要,它主要指词的组合能力及充当句法成分的能力。在三条标准的指导下,词可先粗分为两类:实词与虚词。前者可以单独充当句法成分,意义较为具体;后者不能充当句法成分,只能伴随实词发挥语法意义。二者还可进一步细分,具体如下

  • 实词
    1:名词
    2:动词
    3:形容词
    4:区别词
           一种特殊的形容词(非谓形容词),表示事物的区别性特征,往往成对出现。例如,“男:女、土:洋、国营:民营、小号:中号:大号”等。
    5:数词
    6:量词
    7:动量词
           用以计算动作次数多少及持续时间长短,如“下、次、场、番”等。另有借用的动量词,如“嗷一嗓子、打一拳、算了一算”等。
    8:副词
           表示范围、程度、时间等义,常用以修饰动词、形容词性词语,又分:
           (1) 表示范围——全、都、皆、均、总、共、齐、就、只、单、光。
           (2) 表示程度—— 很、非常、极、最、十分、太、越发。
           (3) 表示时频——立即、曾经、刚刚、一向、再次、偶尔。
           (4) 表示肯否——必须、一定、别、未、莫、没有、勿。
           (5) 表示语气——竟然、岂非、偏、难怪、未免、只好。
           (6) 表示处所——到处、处处、随处、四处。
           (7) 表示关联——遂、就、再、又、仍。
           (8) 表示情态方式——匆匆、一味、亲自、暗自、随意。
    9:代词
    10:拟声词
    11:叹词

  • 虚词
    1:介词
           也称“前置词”,常在实词、短语前组成介词短语,用以修饰或补充谓词性词语。可分为:
           (1) 表示施受关系—— 让、被、叫、把、给。
           (2) 表示原因、目的——因为、为了、由于。
           (3) 表示方式——据、按、照、依、靠、以。
           (4) 表示关涉对象——和、跟、同、比、对、关于。
           (5) 表示时间、处所、方向—— 自、从、往、到、至、趁着、当着
    2:连词
    3:助词
           附着在实词、短语或句子前后表示一定的结构关系或语法意义,又分:
           (1) 结构助词—— 的、地、得、之(定语后接“的”、状语后接“地”、补语前加“得”)(1) 结构助词—— 的、地、得、之(定语后接“的”、状语后接“地”、补语前加“得”)
           (2) 动态助词—— 着、了、过。
           (3) 尝试助词——看(轻声)。
           (4) 时间助词——来着、的(如“饭后是我洗的碗”等)。
           (5) 约数助词——把、来、多、左右。
           (6) 比况助词——似的、一般、一样。
           (7) 其他助词——所、连、给、等、们。
    4:语气词

3、 短语

什么是短语?

       短语也叫“词组”,是词和词按照一定的语法规则和语义搭配关系组合起来的,没有句调的语言单位。按照博主的理解通俗点来说就是小学组词填空那种套路。

短语的类型

1:组合分类
2:功能分类
3:结构关系不同产生的歧义
       A. 共享–单车,动宾,动宾短语(相当于“共享什么”)
       B. 共享–单车,定中,偏正短语(相当于“什么单车”)
4:语义关系不同产生的歧义
       A. 鸡–不–吃–了,主–谓–状–中,主谓短语(相当于“不吃鸡了”)
       B. 鸡–不吃了,主–谓状中,主谓短语(相当于“鸡不吃食了”)
5:结构、语义关系皆不同产生的歧义
       A. 咬–死–了–猎人–的–狗,动–谓–中–补–定–中,动宾短语(相当于“猎人的狗被咬死
了”)
       B. 咬死–了–猎人–的–狗,定–中–动–宾,偏正短语(相当于“狗咬死了猎人”)

4、单句

       单句是由短语或词构成的句子,在句子结构上与“复句”相对。这里博主直接理解成了一个句子。

5、 复句

       它特指由两个及以上意义相关而结构上互不包含的分句,加上贯通前后的句调后所构成的句子。这里博主直接理解成了多个句子。

猜你喜欢

转载自blog.csdn.net/Jiajikang_jjk/article/details/83585109