三大主流图像视频评价方法简介PSNR SSIM VMAF

1.PSNR

一种纯客观的评价方式,用途比较广泛,取值范围一般是20-40.包括两个方面的影响因素:MSE和峰值信噪比,PSNR和质量成正比。

                                                  MSE=\frac{1}{MN}\sum_{x=0}^{m}\sum _{y=0}^{n}\left \| I(x,y)-J(x,y) \right \|

                                                  PSNR=10log_{10}(\frac{MAX^{^2}}{MSE})

这里的max一般是图像的灰度级255。

2.SSIM

一种偏主观的客观评价方式,计算比较复杂,和PSNR相比可以较好地反映人眼的主观质量感受,取值范围0-1,越大质量越好。也叫结构相似性指标,认为图像中每个像素都是有互相关联的,比较的是两种图像前后结构性的改变。用到均值\mu,标准差\delta,协方差COV(X,Y)作为结构相似度的度量,

                                         COV(X,Y)=E[(X-EX)(Y-EY)]

                                         SSIM(x,y)=\frac{(2\mu _{x}\mu _{y}+C_{1})(2\delta _{xy}+C_{2})}{(\mu _{x}^{2}+\mu _{y}^{2}+C_{1})(\delta _{x}^{2}+\delta_{y}^{2}+C_{2})}

SSIM 其实是三个部分比较的乘积:

均值比较部分:

                                             l1(x,y)=\frac{2\mu _{x}\mu _{y}+C_{1}}{\mu _{x}^{2}+\mu _{y}^{2}+C_{1}}

对比度比较部分:

                                             l2(x,y)=\frac{2\delta _{x}\delta_{y}+C_{2}}{\delta _{x}^{2}+\delta_{y}^{2}+C_{2}}

结构比较部分:

                                             l3(x,y)=\frac{\delta _{xy}+C_{3}}{\delta _{x}\delta_{y}+C_{3}}

其中,

                                              \delta_{xy}=\frac{1}{N}\sum _{I=1}^{N}(x_{i}-\mu_{x} )(y_{i}-\mu_{y} )

计算SSIM是以NxN为滑动小窗单位,把所有计算完取平均就是当前图像的SSIM值,考虑到窗口形状对分块的大小,亮度差异和低对比度敏感的特点,在实际应用中会用高斯加权来计算。

3.VMAF

由netflix提出,目标是构建自己的评价标准,更加符合主观质量,vmaf是最偏向主观的视频评价标准。上述评价标准和最终人眼感知不是完全线性正相关关系,而VMAF则很好的做到了这一点。

                                   

 缺点:不同视频、不同分辨率的视频不能直接比较

优点:搜索多样性数据集来做评价数据库,使用了一种基于机器学习的模型设计能真实反映人对视频质量感知情况的指标(主观打分),将多种指标融合为一种指标,包括1视觉信息保真度2细节丢失指标3运动量,前两个是图像指标。

1. 视觉信息保真度(Visual Information Fidelity,VIF)。VIF是一种获得广泛使用的图像质量指标,该指标基于这样一种前提:质量与衡量信息保真度丢失情况的措施是互补的。在最初的形式中,VIF分数是通过将四个尺度(Scale)下保真度的丢失情况结合在一起衡量的。在VMAF中我们使用了一种改进版的VIF,将每个尺度下保真度的丢失看作一种基本指标。

实际上比较的是两次是通过HVS(Human Visual System)结果的信息匹配程度,一种是未压缩通过HVS的结果,一种是压缩后通过通过HVS的结果。
2. 细节丢失指标(Detail Loss Metric,DLM)。DLM是一种图像质量指标,其基本原理在于:分别衡量,可能影响到内容可见性的细节丢失情况,以及可能分散观众注意力的不必要损失。(描述失真的两个指标)这个指标最初会将DLM和Additive Impairment Measure(AIM)结合在一起算出最终分数。在VMAF中我们只使用DLM作为基本指标,但也对一些特殊情况采取了必要的措施,例如会导致原始公式中的数值计算失效的黑帧。

3. 运动量。这是一种衡量相邻帧之间时域差分的有效措施。计算像素亮度分量的均值反差即可得到该值。
经过多次测试和验证作为迭代,我们最终选择了使用这些基本指标和特性。

                                               

附:Y(0-255) 灰度值 255最亮,0最灰 8bit表示8bit表示Y 10bit表示10bit表示Y

振铃效应:图像在剧烈变化处产生震荡,就好像钟被敲击后产生的空气震荡,主要是滤波器陡峭变化引起。

蚊式噪声:伴随着运动物体边缘的失真,表现为围绕着物体四周有一层象飞行物体和/或模糊的气泡的物质(就像蚊子围绕着人头部和肩膀飞),主要是高压缩比下量化引起。

      

     

猜你喜欢

转载自blog.csdn.net/maryhaocoolcool/article/details/86747893
今日推荐