关于音频数据的关键属性和sox的使用方法举例

本文转载自:https://www.jianshu.com/p/be8977de4a6b
音频数据主要有以下 4 种属性:

1.采样率(sample rate):指声音由模拟信号转换成数字信号的过程中,每秒从连续信号中提取的用于组成离散信号的样本个数。
音频CD所用的采样率为 44100 Hz,数字音频磁带和许多计算机系统使用 48000 Hz,专业级音频系统通常使用 96000 Hz。
2.采样大小(sample size 或 Precision):音频采样时用于存储每个样本的数据位数(bits)。如今 16 bit 的采样大小已被广泛使用,24 bit 主要用于专业音频领域。
3.编码格式(data encoding):即每个音频样本的表示(即“编码”)方式。常用的编码类型包括 floating-point、μ-law、ADPCM、singed-integer PCM、MP3 和 FLAC 等。
4.通道(channel):即文件中包含的音频通道的数量。其中单声道(mono)和双声道(stereo)是最常见的两种,“环绕声”音频(Surround sound)通常包含六个或更多声道。

此外,音频文件还使用比特率(Bit Rate)表示一个单位时间内编码音频信号占用的存储空间大小, 它的数值一般取决于所有的上述四个参数。
MP3 编码的立体声音乐通常具有 128-196kbps 的比特率, FLAC 编码的立体声音乐通常具有 550-760kbps 的比特率。

可以将一段音频数据看成很长很长的一排苹果树,从头走到尾,每隔一段距离停下,摘下满满一筐苹果。。。
筐的大小就是采样大小,停下来采摘的次数就是采样频率,比特率就是把一定数量的苹果“榨成汁”(以特定的格式对音频编码)以后的重量,当然有些榨汁方法会造成一定的损失。

soxi Faded.wav——————显示音频详情内容
sox Faded.wav Faded.mp3 ——————将 Faded.wav 文件的格式由 wav 转为 mp3
sox Faded.wav -c 1 Faded-mono.wav ——————将 Faded.wav 文件转换成单声道(-c 1)后输出
sox -M left.wav right.wav stereo.wav——————将左右两个声道的单声道音频合并成一个双声道文件
sox stereo.wav left.wav remix 1 ——————(提取左声道音频)
sox stereo.wav right.wav remix 2 ——————(提取右声道音频)
sox -v 0.5 foo.wav bar.wav——————将 foo.wav 音频放大 0.5 倍音量后输出至 bar.wav 文件
sox Input.wav Half1.wav trim 0 30:00 ——————截取输入文件中前 30 分钟的音频
sox Input.wav Half2.wav trim 30:00 30:00 ——————截取输入文件中从第 30 分钟开始到第 60 分钟的音频
sox Half1.wav Half2.wav Full.wav——————将 Half1.wav 和 Half2.wav 合并至 Full.wav 文件。注意合并前的音频文件需保持一致的类型和采样率等。
sox -n -r 48000 silence.wav trim 0.0 0.250——————在 slience.wav 文件中创建一段长度为 250ms 采样率为 48000Hz 的静音片段。

发布了112 篇原创文章 · 获赞 45 · 访问量 33万+

猜你喜欢

转载自blog.csdn.net/zh515858237/article/details/104916340