Paper | A Pseudo-Blind Convolutional Neural Network for the Reduction of Compression Artifacts

发表在2019年TCSVT。

本文提出了一个兼具 预测压缩系数 和 非盲去压缩失真 功能的 伪-盲(pseudo-blind)去压缩失真网络。该网络是在Inception的基础上修改的,并加上了一个 压缩系数预测子网络。

这篇文章的Introduction、相关工作回顾、失真成因都写得很一般,我们看个方法就好。

值得一提的是,这可能是第一篇尝试“盲”QP增强论文,但是!作者准备了4个增强网络,应对4种预测QP。因此严格意义上不是盲的。

非盲增强网络结构

整体上看:
网络整体

局部的Inception module:
Inception module

训练目标

最小化\(L_1\)损失。

在HEVC下的4种QP:34、37、42、47训练了4个网络。

压缩系数预测子网络

网络结构

这是一个19层、\(3 \times 3\)卷积的VGG网络,参数量高达5.8M。

根据块QP判决结果得到帧QP预测结果

注意,我们不适用平滑区域的块。原因是:这些块的判决结果非常不稳定,很难反映QP信息。因此我们提取具有丰富纹理的块。

扫描二维码关注公众号,回复: 7507981 查看本文章

当判断该帧的QP时,我们取 50个 判决结果最悬殊的块 的结果。即分类器置信度最高的前50个块 的结果。然后voting得到最终预测QP。

保持时序连续性

为了保证帧间QP具有一定的连续性,作者考虑了软判决。具体策略看论文。

最终大网络就是这个样子,很简单都不需要多解释:
网络

实验

我们只看分类器的准确率:
实验

猜你喜欢

转载自www.cnblogs.com/RyanXing/p/11703345.html