从信息熵到Codec

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

多媒体与通信是个即传统有新潮的领域，在这几天的Google I/O、微软Bulid大会上，AI让数字助理让个人生活和会议变得更加轻松有趣，这背后有不少多媒体技术默默的贡献。

文 / Ant

过去几个月，我常常思考一个问题——多媒体（通信）技术到底解决什么问题？交付什么样的服务呢？目前得到的答案是：

以更低的成本，呈现更身临其境的视听感受。

“成本”和“身临其境”形成了一对矛盾，这就对多媒体（通信）技术提出了挑战。从贝尔发明电话，到即将到来的5G网络，人类都在想方设法在有限的网络条件下传输更多的数据。换句话说，需要尽可能的压缩数据，但不同的数据集压缩的比例并不一样。比如，电影中一段纯色的蓝天的视频，压缩后和一张蓝天的图片大小差不多，甚至更小。这是由于数据中的冗余信息非常大造成的，而信息中的非冗余信息就是信息熵：

Shannon 在 1948 年发表的论文“通信的数学理论（ A Mathematical Theory of Communication ）”中， Shannon 指出，任何信息都存在冗余，把信息中排除了冗余后的平均信息量称为“信息熵”。

Codec的价值就是尽可能找到视频中的冗余信息，并将其压缩。当然，Codec还可以有损压缩，找到画质和比特率的平衡点。如今，全球最顶尖的科学家仍然在为之奋斗。关于数据压缩的极限与信息熵的关系，可参考阮一峰的blog：

http://www.ruanyifeng.com/blog/2014/09/information-entropy.html

Google I/O和微软Bulid上，展示了大量的AI赋能的产品与服务，人工智能的时代已经到来，而且还刚刚开始。相比而言，Codec这样略显枯燥无趣的技术并没有基于足够的关注。

比如，YouTube通过优化策略提升用户体验的同时节省了14%带宽，Facebook使用AV1让编码效率比x264、VP9提升了30%，这些收益往往不易察觉，但却真实可观。

在今天凌晨的Google I/O大会上，Zoe Liu在“Build awesome media experiences on the web”专题中，代表Google面向全球开发者介绍了AV1的背景技术以及应用前景。AV1是AOM联盟推出的第一个Codec。AV1开源并且免专利费，是开放、共享的互联网精神下的产物。

在5月19-20日在上海举行的WebRTCon 2018大会上，Zoe Liu将在“WebRTC与Codec”专题向国内的开发者分享AV1的最新进展与技术探索。此外，北京大学教授王荣刚、Google软件工程师姜健、英特尔实时通信客户端架构师邱建林、Aupera傲睿智存 CTO周正宁将分别分享国产Codec AVS2的最新演进、VP9的SVC优化，H.264的硬件编码优化，FPGA加速WebRTC服务端和转码。在主题演讲环节，上海交通大学图像通信与网络工程研究所副所长宋利会分享学术界在Codec优化的最新思路与尝试，他会介绍AI、区块链和大数据赋能的Codec。

了解更多WebRTCon 2018议题信息，点击【阅读原文】移步大会官网。

猜你喜欢