语料库基础学习

  1. 语料库:对语言进行全景性的透视。
  2. 语料库思想产生的背景:
    1. 电脑科技的发展,信息技术的支持;
    2. 从现象归纳原理的思考模式
  3. 语料库几个特征
    1. 语料库一定是机读的,不是为人准备的,因为其统计非常的繁杂,分析非常的繁杂;
    2. 必须是确认为真的,进入语料库的语言必须是经过挑选、筛选的
    3. 是一个有限集合,是一个语言的抽样
    4. 代表性和要研究的目的是紧密相关的
    5. 狭义的语料库只有文字,广义的语料库还有声音、视频、手语等多模态语料库
  4. 语料库建设的基本问题。
    1. 语料一旦确定,很少更新
    2. 人工参与过多,自动化程度不高
    3. 缺乏语言资源管理(缺乏网站式的管理工具)
    4. 缺乏用户定制功能
    5. 成本大,周期长
    6. 语料库建设网络化(更多的人一起建设)
  5. 语料库类型
    1. 可比语料库(最简单),由讨论一个领域的两种语料组成。举例:奥运会翻译的时候做排球赛事的翻译,首先要找讨论排球的英文文章和中文文章,建立可比语料库。
    2. 平行语料库,对其的文本。篇章对其、段落对其、句对其、亚句对其、词对其。句对其很重要,句对其的语料库可以作为翻译记忆存在。
    3. 单语语料库,语料库只有一种语言,外语单语语料库库,借助于语料检索与统计分析工具,可以得到远超词典和语法书的语用知识。(免费、量大、质高、检索方便、对翻译实务可用性较强)
    4. 按照加工与否,分为熟语料、生语料语料库
    5. 按照语料类型,分为通用、专门用途语料库
    6. 翻译学者语料库,统计口语错误、书面错误,用于对学习过程的分析的语料库
  6. 料库检索工具:wordsmith(商业)、CWB(sourceforge开源)、spss|weka 统计工具及数据分析工具(商业开源)、基于web的语料库系统:sketch engine  http://corpus.byu.deu http://ccl.pku.edu.cn
  7. 语料库在翻译实践中的用途
    1. 获取专业知识、学习专业术语、借鉴表达方法、模仿写作风格、提供翻译策略 
    2. 帮助译者理解原文、帮助译者寻找更合适的表达方法

语料库学习视频下载地址:链接:https://pan.baidu.com/s/1XBCCG0cS963cY1wZAU2aDQ 密码:ew3y

论文学习资料下载地址:链接:https://pan.baidu.com/s/1AHt37NLRQSBfHuNPP-bjBg 密码:ut9b

    

猜你喜欢

转载自www.cnblogs.com/zhenyuyaodidiao/p/9287538.html
今日推荐