即时通讯音视频开发(四):视频编解码之预测技术介绍

前言


即时通讯应用中的实时音视频技术,几乎是IM开发中的最后一道高墙。原因在于:实时音视频技术 = 音视频处理技术 + 网络传输技术 的横向技术应用集合体,而公共互联网不是为了实时通信设计的。

系列文章

1. 预测技术的作用


目的是去除空间冗余和时间冗余。因为视频存在大量的空间冗余和时间冗余,包括空间冗余、时间冗余,预测后得到去除大部分空间或时间冗余的残差。

2. 空间冗余


图像空间相邻像素具有很强的相关性,帧内预测技术去除空间冗余。

104906jo7xhmli7ou77207.png (576Ã272)

3. 亮度预测模式

104951qaabbaz222sv2bby.png (576Ã284)

104952ekkkau4iagu4n5gy.png (548Ã596)

104952vxwxwan4sf5jwdz7.png (576Ã375)

4. 色度预测模式

105041fzymtigmmcotx4ta.png (576Ã363)

105041rjrrf1abkxcvvvd0.png (576Ã360)

5. 时间冗余


视频图像在时间上有较强的相关性,即存在时间冗余。去除时间冗余的编码技术有:运动估计(Motion Estimation,ME)、运动补偿(Motion Compensation,MC)。

105407swrb8bienmecnrr8.png (562Ã477)

6. 运动模型

105501icz1tc4p1zapxaxk.png (576Ã270)

105537jpei6bwdd6bdz66d.png (576Ã356)

105543ka5a6z6xkz53x9kx.png (576Ã488)

7. 匹配准则

105644w7yhkq3oy7qol66k.png (576Ã257)

8. 运动估计


目的是去除视频图像的时间冗余。运动估计在搜索范围内为当前块寻找匹配最好的预测块,全搜索方式的运动估计计算复杂度高。

105746kufbzh1nuaa4gzvv.png (455Ã467)

9. 快速运动估计算法种类


在保持预测精度的同时减少运动估计的搜索次数,典型算法有:
 


  • 三步搜索(Three Step Search,TSS)
  • 二维Log搜索(2D Logarithmic Search,2DLOG)
  • 正交搜索(Orthogonal Search Algorithm,OSA)
  • 十字搜索(Cross Search Algorithm,CSA)
  • 新三步搜索(New Three Step Search,NTSS)
  • 四步搜索(Four Step Search,FSS)
  • 共轭方向搜索(Conjugate Direction Search,CDS)
  • 梯度下降搜索(Gradient Descent Search,GDS)
  • 层次块搜索(Hierarchical Block Matching Algorithm,HBMA)

10. 搜索算法复杂度比较

110000x0nvvcin881t8j7v.png (576Ã305)

11. 分像素运动估计与运动补偿


时域运动位置更可能在整象素之间,即分像素上。利用相邻的整象素可以估计出分象素的值:常用线性或双线性插值得到分象素的值。分象素运动估计有更高的预测精度,但复杂度也更高:1/2分象素运动估计,图像存储空间增加4倍,运动矢量需要放大2倍,1/4分象素运动估计,图像存储空间增加16倍,运动矢量需要放大4倍,计算复杂度也成倍增加。

110127ihmhho2ykbmmko6c.png (576Ã358)

12. 分像素插值

110158uuz5cifzbkec1zef.png (576Ã227)

13. 多参考帧预测


有更多的候选图像,搜索更精确的预测块。

110249tvaq42d06f6kqnkl.png (576Ã236)

14. 图像分块编码

110335qqi33r5z93nn09vw.png (576Ã412)

110347pc88nn3c64ynynf5.png (576Ã425)

视频内容的运动非常复杂,图像分块编码可以更好的提高运动预测精度,提高压缩效率。要在编码块大小和附信息(MV,Mode)编码比特数之间权衡,小的编码块大小会有更好的预测但有更多的附信息比特数。

110436hoxj1xxkksssxjzr.png (576Ã188)

15. 双向预测编码

110509mva9v7eiae03qzk7.png (576Ã386)

16. B帧有更好的编码效率


新出现的对象参考将来的帧有更好的预测效果,前后两个预测的平均值可以减少预测方差。

110630nw57ssz37w904a0e.png (576Ã276)

17. 全局运动估计


基于全局仿射运动模型。预测精度不如基于块的运动估计。MV数目少,适合简单运动场景的运动估计。

110713phese8u8877l8zn5.png (576Ã264)

网易云信,你身边的即时通讯和音视频技术专家,了解我们,请戳网易云信官网

想要阅读更多行业洞察和技术干货,请关注网易云信博客

本文转载自52im,作者:JackJiang

猜你喜欢

转载自blog.csdn.net/netease_im/article/details/83758134