音频学习(1):基础知识

一、声音的基本概念    

声音是通过一定介质传播的连续的波。 

                                        

重要指标:  

  1. 振幅:音量的大小  
  2. 周期:重复出现的时间间隔  
  3. 频率:指信号每秒钟变化的次数 

声音按频率分类: 
                                 

二、声音的数字化

1.声音信号的类型 

  • 模拟信号(自然界、物理) 
  • 数字信号(计算机)

2.声音数字化过程 

                                    

3.声音数字化过程示意图

                                        

4.声音数字化三要素 

采样频率 量化位数 声道数 
每秒钟抽取声波幅度样本的次数  每个采样点用多少二进制位表示 数据范围  使用声音通道的个数 

采样频率越高

声音质量越好

数据量也越大 

量化位数越多

音质越好

数据量也越大

立体声比单声道的表现力丰富,

但数据量翻倍 

11.025kHz 8 位=256 单声道 
22.05 kHz 16 位=65536 立体声(双声道)
44.1  kHz     

为什么是44.1,22.05,11.025?这几个数都是11.025的倍数

在进行模拟/数字信号的转换过程中,当采样频率大于信号中最高频率的2倍时,采样之后的数字信号完整地保留了原始信号中的信息。也就是说,数字信号可以恢复成原先的模拟信号!

例如用44.1KHZ的采样频率进行采样,则可还原为最高22.05KHZ的频率——这个数值略高于人耳的听觉极限

5.声音数字化的数据量

音频数据量=采样频率×量化位数×声道数/8(字节/秒) 

                                 

三、音频的文件格式

1.WAV 文件

WAV 是 Microsoft/IBM 共同开发的 PC 波形文件。

  • 因未经压缩,文件数据量很大。
  • 特点:声音层次丰富,还原音质好

2.MP3 文件

MP3(MPEG Audio layer3)是一种按 MPEG 标准的音频压缩技术制作的音频文件。

特点:高压缩 (11:1),优美音质 比

3.WMA 文件

WMA(Windows Media Audio)是 Windows Media 格式中的一个子集(音频格式)。

特点:压缩到 MP3 一半

4.MIDI 文件

MIDI(乐器数字接口)是由一组声音或乐器符号的集合。

特点:数据量很小,缺乏重现自然音

四、数字音频压缩标准

1.音频压缩方法概述 
                              

压缩编码技术是指用某种方法使数字化信息的编码率降低的技术 音频信号能压缩的基本依据:

  • ①声音信号中存在大量的冗余度;
  • ②人的听觉具有强音能抑制同时存在的弱音现象。

音频信号压缩编码的分类:

①无损压缩:(熵编码) 霍夫曼编码、算术编码、行程编码

②有损压缩:

  • 波形编码--PCM、DPCM、ADPCM 、子带编码、矢量量化
  • 参数编码--LPC
  • 混合编码--MPLPC、CELP 

2.音频压缩技术标准 

                        

五、声卡

1.声卡的主要功能 声卡是负责录音、播音和声音合成的一种多媒体板卡。

其功能包括:

  • ①录制、编辑和回放数字音频文件
  • ②控制和混合各声源的音量
  • ③记录和回放时进行压缩和解压缩
  • ④语音合成技术(朗读文本)
  • ⑤具有 MID 接口(乐器数字接口)

2.芯片类型 

  • CODEC 芯片(依赖 CPU,价格便宜) 
  • 数字信号处理器 DSP(不依赖 CPU) 

猜你喜欢

转载自blog.csdn.net/QQ2558030393/article/details/92836628