自然语言处理综论-第4章小结-计算音系学与文本-语音转换 - 代码天地

自然语言处理综论-第4章小结-计算音系学与文本-语音转换

其他 2021-04-04 16:54:17 阅读次数: 0

自然语言处理综论-第4章小结-计算音系学与文本-语音转换

本章介绍了理解口语处理时需要的一些重要概念。

可以用称为音子（phone）的单位来表示词的发音。表示音子的标准系统是国际音标或IPA。使用ASCII字符的另一个只适用于英语的转写系统是ARPAbet。
根据发音器官如何产生音子可以对音子进行描述，根据辅音的发音部位和发音方法以及浊音化（voicing）的情况可以对辅音进行描述，根据舌位的前后可以对元音进行描述。
音位是对不同语音情况的一般化和抽象。音位变体规则描述一个音位在给定的上下文环境中的实现情况。
转录机可以用来模拟音位规则，其方法与在第3章中模拟拼写规则的方法一样。双层形态学是一种形态学/音系学的理论。这种理论把形态规则模拟为对于词汇形式和表层形式之间映射的一种有限状态的、良构的限制（well-formedness constraint）。
发音词典既可以用于文本-语音转换，也可以用于语音自动识别。发音词典要给出单词的发音，这种发音是音子的序列，有时也包括音节划分（syllabification）和重音。大多数联机发音词典的规模为10万词左右，但是还缺少专有名词、首字母缩写词和屈折变化形式。
文本-语音转换系统中的文本分析（text-analysis）部分把符合正词法的文字串映射为音子串。这通常要使用大型的发音词典来进行。大型的发音词典是在发音词典的基础上提升而成的，它应该带有一个用于处理能产性的形态规则、发音变化、专有名词、数字以及首字母缩写词的系统（这样的系统犹如一个转录机）。

猜你喜欢

转载自blog.csdn.net/qq_17065591/article/details/108113727

自然语言处理综论-第4章小结-计算音系学与文本-语音转换

自然语言处理综论-第7章小结-HMM与语音识别

自然语言处理综论-第3章小结-形态学与有限状态转录机

自然语言处理综论-第13章小结-语言的复杂性

自然语言处理综论-第14章小结-意义的表示法

自然语言处理综论-第12章小结-词汇化剖析与概率剖析

自然语言处理综论-第11章小结-特征与合一

自然语言处理综论-第9章小结-英语的上下文无关语法

自然语言处理综论-第8章小结-词的分类与词类标注

自然语言处理综论-第6章小结-N元语法

自然语言处理综论-第5章小结-发音与拼写的概率模型

自然语言处理综论-第10章小结-基于上下文无关语法的剖析

自然语言处理综论-第2章小结-正则表达式与自动机

学习NLP《自然语言处理综论第2版》中文PDF+英文PDF+对比分析

自然语言处理综论_第二版(中文)_高清pdf网盘下载

Python自然语言处理第2章获得文本语料和词汇资源学习笔记

自然语言处理（4）——从文本中提取信息

《自然语言处理入门》笔记-第1章

第1章自然语言处理简介

自然语言处理: 第十二章LoRA解读

自然语言处理---文本预处理

【日常】自然语言处理小结

《Python自然语言处理（第二版）-Steven Bird等》学习笔记：第07章从文本提取信息

《Python自然语言处理（第二版）-Steven Bird等》学习笔记：第06章学习分类文本

《Python自然语言处理（第二版）-Steven Bird等》学习笔记：第03章加工原料文本

实现高效准确的语音合成：掌握自然语言处理中的文本生成技术

自然语言处理-文本分类

自然语言处理—文本情感分析

自然语言处理——文本分类

文本识别（自然语言处理，NLP）

今日推荐

wlnmp 一键安装包更新 240522

ChatGPT 严重宕机，结果被造谣“遭遇俄罗斯黑客入侵”

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

周排行

mongodb 下载与安装与初步使用

20190530

iOS录制回放神器AutoTouch使用介绍

同心圆猜数字游戏

mamp pro安装redis扩展各个步骤截图

windows10下安装docker报错：error during connect

跨域授权 Federated Identity Pattern

js时间比较大小

pandas to_csv()使用方法

从JDK源码角度看Byte

每日归档

更多

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)