语音信号处理之预处理简述(一)

目录

1. 采样

2. 量化

3. 编码

4. 小结


1. 采样

(1)连续时间信号

自变量t是连续的,在自变量上都有对应的函数值。函数值(幅值)可以连续,可以不连续。如果幅值是连续的,则称为模拟信号。

连续时间信号幅值不连续的例子:单位阶跃信号在t=0处并不连续。

(2)离散时间信号

自变量t是离散的,幅值是连续的。

(3)采样:采样的过程就是将模拟信号变成离散时间信号的过程。

采样后没有经过量化处理,因此幅值是连续的。这里连续的概念和数学上函数连续的概念有区别,函数连续指曲线光滑,且处处可导。而这里信号的连续指的是可以取到原模拟信号数值区间的任意值。

例:对于正弦波的电压信号

若信号的峰值是正负1.4V。那么取样得到的电压就可能是-1.4V到+1.4V之间的任何数值。这个数值本身并没有量化,所以取到的是连续的值。

采样的过程如下图(看竖线):

 

2. 量化

量化:采用一组数码(如二进制数码)来逼近离散信号的幅值,将离散时间信号变成数字信号。

量化涉及一个重要概念,那就是“采样位深”。采样位深度是每一个采样点的值用几个比特数来表示,很容易理解,bit越多,能表示的数范围就越广,更加能逼近模拟信号,可以直观理解,如果采样率和位深都很大,采样的离散序列就可以近似等于模拟信号。

常用的采样位深如下:

8bit:256个值,从0~255

16bit:65536个值,从0~65535

24bit:………………………………

32bit:………………………………….

量化的过程如下图(看横线):q1=2, q2=3, q3=4, q4=5

经过量化之后,时间连续幅值也连续的模拟信号就变成了时间离散幅值也离散的数字信号。

3. 编码

编码是模拟信号数字化的第三个阶段,把量化的抽样信号变换成给定字长的二进制码流的过程称为编码过程。如下图:ADC芯片输出就是0和1的音频数据流。

4. 小结

(1)模拟信号数字化包括三个过程:采样+量化+编码

(2)采样将连续时间信号变为离散时间信号

(3)量化和编码之后才得到数字信号,此时自变量和因变量都是离散的数值

下一篇:语音信号处理之预处理简述(二)_卡卡6的博客-CSDN博客

猜你喜欢

转载自blog.csdn.net/qq_40088639/article/details/127231738