HEVC BLA、CRA、IDR

CRA使得编码视频序列的任意位置都能成为随机访问点,与插入一个IDR相比,插入一个CRA编码效率更高,压缩比更高。在解码顺序上处于CRA之后,在输出顺序上处于CRA之前的图片,可以采用在解码顺序上处于CRA之前的图片作为参考。CRA作为随机访问点的时候,在解码顺序和输出顺序上都处于CRA之后的图片必须是可解码的。

围绕CRA图片的典型的预测架构如图所示,该图采用了SOP(structure ofpicture)的概念,一个SOP就是一个或者多个解码顺序上连接的图片,在最低子层按解码顺序第一个图片是参考图片。图片解码的相对次序以图片中的数字编号给出,处于前面的SOP中所有图片的数字编号小于处于后面的SOP中的所有图片的数字编号。图示中编号为28的CRA图片与编号为29、30、31的图片共同构成了一个SOP,其中29、30、31在解码次序上在CRA之后,在输出次序上在CRA之前,29、30、31被称作CRA的leadingpicture,其中29和31不参考在解码顺序上处于CRA之前的图片,若解码从CRA开始,它们能够被正确解码,于是叫做RADL(randomaccess decodable leading)。30叫做RASL(random access skippedleading),如果从CRA开始解码,那么30不能够被正确解码,只有解码从CRA之前的一个随机访问点开始的时候才能够被正确解码,因此像30这样的图片,当解码从CRA开始的时候需要丢弃。如果28是IDR,解码器会清理DPB,30就不能采用24作为参考图片,但是如果28是CRA就可以。

基于解码起始位置,参考图片可能不可用,要阻止参考图片的错误传播,如图所示,所有的NextSOP中的图片不能采用在解码顺序或者输出顺序上先于CRA图片的图片作为参考图片,NextSOP中的图片无论在解码顺序上还是在输出顺序上都在CRA图片之后。

对于CRA开始的流,与之对应的RASL图片不能够解码,因为RASL的参考图片不在这个流中,要让这样的流的拼接更直接,把NAL单元类型设为BLA图片,与BLA相关的RASL图片特点是不可解码的因此不被输出。
在这里插入图片描述

BLA只是CRA在视频流切换情况下的一种特例。视频流在某个RAP上要求切换到另一个视频流继续解码,则直接将该CRA同另一个视频流中的接入CRA连接,后者便是BLA。由于BLA之前解码到缓存的视频流与当前视频流无关,因此其特性类似于直接从该点进行随机存取后的CRA。

RASL和RADL。这是两种GOP间的图像类型。如果解码器从某个CRA随机接入,则按照显示顺序的后面几帧数据由于缺少参考帧而不能解码,这些图像将被解码器抛弃,即skip leading。而对于没有从当前CRA接入的数据,这些图像可以被正常解码显示,因此称为decodable leading。由于这些数据是有可能舍弃的,因此其他图像(trailing pictures)不能参考这些数据,否则万一这些图像被舍弃,将会有更多的图像受其影响而不能正常解码。

假设视频序列的显示顺序为①,这是一个完整的GOP,解码顺序为②

①I B B P B B P B B P

②I P B B P B B P B B

在H.264中,第一个I帧为IDR,GOP为闭合结构,因此两个GOP组成视频的结构为

I B B P B B P B B PI B B P B B P B B P(显示顺序)

I P B B P B B P B BI P B B P B B P B B(解码顺序)

而在HEVC中,两个I帧为CRA,GOP为开放结构,因此GOP的结构为:

I B B P B B P B B PB B I B B P B B P B(显示顺序)

I P B B P B B P B B I B B P B B P B B…(解码顺序)

两个红色的B帧表示的是按照解码顺序在CRA之后,该GOP内参考的前一个GOP进行编码的图像。这样便很容易得知,如果选择在第二个CRA进行随机接入,这两个红色的B帧将会由于没有参考帧无法解码而被舍弃。这两个粗体的B帧即RASP。如果没有选择这个CRA进行随机接入,这两个粗体B帧将可以顺利解码,即成为RADP。

对于BLA,情况也是类似的。由于出现码流拼接,第二段码流的CRA之后的B也会因为没有参考帧无法解码而丢弃。很容易理解,此时缓存中的参考帧数据还来自上一段码流,跟当前码流没关系,当然不能用作B的参考了

猜你喜欢

转载自blog.csdn.net/bvngh3247/article/details/83824679
今日推荐