语音信号处理第七章:

语音信号处理第二章
语音信号处理第三章
语音信号处理第四章
语音信号处理第五章
语音信号处理第七章
语音信号处理第九章
语音信号处理第十章
语音信号处理第十二章

语音压缩编码
只针对考试内容,不全面讲解各类编码

语音压缩编码

原因:

语音信号编码最简单的方式是直接将语音信号进行量化,只要量化位数足够多,就能保证解码后语音信号有很好的音质。缺点是这样所需的数码率太高,传输信道难以承受。因此必须对语音信号进行压缩编码

信源编码主要解决有效性的问题,也就是数据压缩的问题,以最少的数码表述信源所发的信号,减少容纳给定信息集合或数据采样集合的信号空间。信道编码主要解决可靠性问题,即尽量使处理过的信号在传输的过程中不出错或少出错,即使出了错也要能自动检错和尽量纠错。因此本章主要讲信源编码

原理:

依据语音信号的冗余度和人的听觉感知机理。

(1)时域冗余度:

1)幅度非均匀分布。小幅度样本出现的概率高
2)对于短时自相关函数,相邻样本间的相关性很强
3)浊音语音段具有准周期性
4)声道的形状及其变化缓慢
5)存在语音间隙

(2)频域冗余度:

1)非均匀的长时功率谱密度高频能量较低,对应于时域上相邻样本间的相关性。
2)对于短时功率谱密度,整个谱随着频率增加而递减。整个谱形成基于基音频率的高次谐波结构。共振峰频率处能量较大。

(3)人的听觉感知机理:

1)掩蔽效应。高声级单音会掩蔽临近频率声音。可用于抑制与信号同时存在的量化噪声。
2)人耳对不同频段声音的敏感程度不同。人的听觉对低频段比较敏感,对高频段不太敏感。
3)人耳对语音信号的周期性(即音调)极为敏感,而对相位变化不敏感

上限:语音压缩编码的极限速率(下限)为80~100bps

语音合成系统模型:

技术
(1)线性预测
在这里插入图片描述
短时相关性使用以下模型来描述:
在这里插入图片描述
长时相关性使用以下模型来描述:
在这里插入图片描述
一般来说,长时预测系数的个数在1(q=r=0)到3(q=r=1)之间

在这里插入图片描述
(2)合成分析法:将综合器引入编码器,使之与分析器相结合,在编译器中生成和译码端完全一致的语音。将次合成语音与原始语音相比较,根据一定的误差原则,来调整计算各个参数,使得两者之间的误差最小。

(3)感觉加权滤波器

评价标准:

理想的编码器应该是低速率、高语音质量、低时延、高误码容限、低复杂度、具有良好的健壮性和算法可扩展性。
客观评价的方法有信噪比,主观评价的方法有可懂度评价、音质评分

分类:

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/jieyannn/article/details/107200410
今日推荐