音频学习(1)：基础知识

一、声音的基本概念

声音是通过一定介质传播的连续的波。

重要指标：

声音按频率分类：

二、声音的数字化

1.声音信号的类型

2.声音数字化过程

3.声音数字化过程示意图

4.声音数字化三要素

为什么是44.1，22.05，11.025？这几个数都是11.025的倍数

在进行模拟/数字信号的转换过程中，当采样频率大于信号中最高频率的2倍时，采样之后的数字信号完整地保留了原始信号中的信息。也就是说，数字信号可以恢复成原先的模拟信号！

例如用44.1KHZ的采样频率进行采样，则可还原为最高22.05KHZ的频率——这个数值略高于人耳的听觉极限

5.声音数字化的数据量

音频数据量＝采样频率×量化位数×声道数/8(字节/秒)

三、音频的文件格式

1.WAV 文件

WAV 是 Microsoft/IBM 共同开发的 PC 波形文件。

2.MP3 文件

MP3(MPEG Audio layer3)是一种按 MPEG 标准的音频压缩技术制作的音频文件。

特点：高压缩 (11:1)，优美音质比

3.WMA 文件

WMA(Windows Media Audio)是 Windows Media 格式中的一个子集(音频格式)。

特点：压缩到 MP3 一半

4.MIDI 文件

MIDI(乐器数字接口)是由一组声音或乐器符号的集合。

特点：数据量很小，缺乏重现自然音

四、数字音频压缩标准

1.音频压缩方法概述

压缩编码技术是指用某种方法使数字化信息的编码率降低的技术音频信号能压缩的基本依据：

音频信号压缩编码的分类：

①无损压缩：(熵编码) 霍夫曼编码、算术编码、行程编码

②有损压缩：

2.音频压缩技术标准

五、声卡

1.声卡的主要功能声卡是负责录音、播音和声音合成的一种多媒体板卡。

其功能包括：

2.芯片类型