音频基础知识——学习笔记

  • 可以通俗理解为:
  • 音调:声音很细很尖,或者低沉。
  • 音量:声音大小,俗称大嗓门。
  • 音色:钢琴和小提琴音色不同。

  • 上图:甲乙频率相同,可认为是两个女生说话。乙嗓门大(振幅大)。如果两个人一起说话,那就很容易听不见甲说话。
  • 下图:甲乙嗓门一样大(振幅相同),甲是频率慢的(男生), 乙是频率大的(女生),这就能区分了。

  • 左图的声音,听着 比右图舒服。但实际上,声音中几乎没有完美的正弦波。

  • 次声波和超声波,人类听不到。Hz(赫兹) :1秒钟震动的次数。

  • 可以看到一个有趣的现象,人喊的声音,根本不会打扰到蝙蝠的睡眠。可能是蝙蝠容易抓,然后蝙蝠被抓,然后就就很多。。。

  • 模拟数据,然后按照某频率(1秒钟采集几次)进行采样,对采样的数据进行量化,量化后的数据根据峰值进行编码,编码之后就是数字信号了。
  • 采样大小指图中的高度。16bit常用。0-65535, 没有负值。
  • 20HZ--2wHZ,从模拟信号采样, 1S采样20次---2w 次。

看例子中的计算,1s要传输那么大的数据,所以传输音频不用PCM,要用AAC等将PCM压缩之后进行传输。

  • 有损压缩,删掉冗余数据,且不能恢复。
  • 无损压缩,删掉后,还可以恢复。

  • 黑线以下听不到,因为分贝小(响度小),比如小小声音说话,就很有可能听不到。
  • 蓝线以下听不到,因为在紫色范围中,突然后一个高声,就听不到这个频段的其他低声了,比如a在小声说话,b突然大声,c就听不到a说话,只能听到b说话了。
  • 绿色可以听到,因为绿色在红色音频的影响范围之外,比如,男生女生同时发声,虽然女生分贝高,但依然可以听到男生说话。

  • 在一个平缓的声音中,突然有一个大声,盖过了其他声音,这个大声音的前50ms 和 大声之后的 50ms 是影响范围。

  • 心理声学模型,指的就是上面绿色图和上上面的柱状图。

  • opus 最流行。1核口(实时性),1核耳(高保真)。不支持RTMP协议。
  • AAC 常见,常用泛娱乐直播系统。要求音质高,实时性低一些。RTMP协议。
  • speex 包括回音消除、降噪等。
  • G.711,音视频会议,固话常用。

  • 1. AAC 应用范围广,90%+
  • 2. AAC 传输协议rtmp支持AAC speex, 
  • 3. AAC 本身编码质量高,高保真


  • 三种格式码流依次是:128kb/s, 64kb/s,  32kb/s

  • ADTS每一帧都多7-9个字节

整理自慕课网——移动端音视频入门

发布了417 篇原创文章 · 获赞 156 · 访问量 8万+

猜你喜欢

转载自blog.csdn.net/qq_34732729/article/details/104519643