第1章导论

其他 2020-03-22 11:12:02 阅读次数: 0

前言

定义
自然语言处理即NLP是一门交叉学科，包含语音和语言处理、人类语言技术、计算语言学以及语音识别与合成等。
应用场景
- 会话代理（对话系统）
- 机器翻译
- 基于网络的问答系统
- 拼写校正
- 语法检查
- 信息抽取
- 词义排歧

1.1 语音与语言处理中的知识

语音学与音系学
关于语言语音的知识。
形态学
关于词的有意义的组成成分的知识。
句法学
关于词与词之间结构结构关系的知识。
语义学
关于意义的知识。
语用学
关于意义与说话人的目的和意图之间关系的知识。
话语学
关于比一个单独的话段更大的语言单位的知识。

1.2 歧义

消歧方法
词类标注
词义排歧
词汇排歧
句法排歧

1.3 模型与算法

几个重要部分
- 状态机器模型
  即形式模型，应该包括状态、状态间的转移以及输入表示等，其变体有确定的有限状态自动机、非确定的有限状态自动机和有限状态转录机。
- 形式规则系统模型
  即陈述性模型，其中最重要的有正则语法、正则关系、上下文无关语法、特征增益语法以及这些语法相应的概率语法变体。
- 基于逻辑的模型
  一阶逻辑即谓词演算，以及诸如运算、特征结构、语义基元等相关形式化方法。
- 概率模型
  状态机器使用概率论来提升，从而成为加权自动机，或马尔可夫模型。
- 向量空间模型
  实质是通过表示输入假定的状态空间来进行搜索。对弈涉及状态机的非概率的任务，使用深度优先搜索之类的图算法，而对于具有概率的任务，则使用最佳优先搜索算法和A*搜索算法等试探性算法的变体，同时依靠动态规划算法来提高计算的可循环性。
- 分类器
  将一个单独客体指派到一个单独类别中。
- 序列模型
  对一个客体序列进行分类，将其排到一个类别序列中。
算法
- 动态规划的状态空间搜索算法
- 分类器算法
- 期望最大化（EM）算法

1.6 语音和语言处理简史

语音和语言处理包括一系列性质不同而又彼此交叉的学科：语言学中的计算语言学、计算机科学中的自然语言处理、电子工程中的语音识别、心理学中的计算心理语言学。

1.6.1 基础研究：1940s&1950s

自动机的研究和概率模型或信息论模型研究引起人们注意。

1.6.2 两大阵营：1957~1970

符号派
随机派

1.6.3 四个范型：1970~1983

随机范型
基于逻辑的范型
自然语言理解范型
话语模型范型

1.6.6 机器学习的兴起：2000~2008

建立带标记语料库的趋势
统计机器学习的趋势
高性能计算机系统发展的趋势

发布了104 篇原创文章 · 获赞 69 · 访问量 13万+

私信关注

猜你喜欢

转载自blog.csdn.net/github_39655029/article/details/97036419

第1章导论

第1章对象导论

第1章.需求工程导论

数据挖掘导论学习笔记1（第1 、2章）

工程导论第4章

第1章 Spark数据分析导论

《Java编程思想》第1章对象导论

《python》编程导论第1/2/3/4章

人工智能导论笔记——第1章绪论

机器人学导论习题——第 1 章概述

【算法导论】第11章，散列表

《算法导论》第11章：散列表

【算法导论】第15章，动态规划

算法导论第9章习题

算法导论第7章课后习题

算法导论（Python版本）（第6章）

算法导论（Python版本）（第15章）

算法导论第21章：并查集

算法导论第22章部分答案

《算法导论第3版》第1章笔记&习题答案

第1章软件工程学概述（软件工程导论第6版）

1. 重构导论

1. 对象导论

大数导论学习（1）

导论课后总结1

词汇课程——导论（1）

存储笔记1 导论

java编程思想学习笔记——第1章对象导论

Java002 【Java编程思想】第1章对象导论

《SystemVerilog验证-测试平台编写指南》学习 - 第1章验证导论

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)