读“基于机器学习的无参考图像质量评估综述”有感

摘要: 无参数图像质量评价(NRIQA)因其广泛的应用需求一直以来都是计算机视觉及其交叉领域的研究热点。回顾近十几年来基于机器学习的典型NRIQA模型，介绍图像质量评价的常用数据库、算法性能指标、NRIQA主要难点和现有的解决方法；分析了不同模型的思想、实现、特点；最后统计对比多个数据库上的测试结果。
1.前言
视觉质量是图像复杂且固有的特征，其复杂度在和人脑视觉处理机制相关，因此对图像质量准确建模一直是热点研究问题。通常方法是与理想的成像模型或者完美的参考图像对比得到失真度量。根据是否存在可参考的图像，将图像质量评价方法分为全参考（FullReference，FR）、半参考（Reduced Reference，RR）和无参考（No Reference，NR）质量评价三类，其中无参考图像质量评价（NRIQA）也叫盲图像质量评价（Blind ImageQuality Assessment，BIQA）.
NRIQA 方法在实际应用中，需求广泛但实现难度大于有参考图像或特征的方法。随机器学习发展尤其是深度学习对各个领域的影响一致，NRIQA技术也在不断革新。本文主要分析近十几年最为典型的NRIQA算法。

2.无参考图像质量评价方法衡量
图像质量评价旨在拟合人眼，通常以算法的评价价值与人眼的主观评分值进行计算比较。在公共数据库上，图像的主观评分值用平均主观得分（Mean OpinionScore，MOS）表示或者使用平均主观得分差异（Differential Mean Opinion Score，DMOS）表示。其范围因不同数据库而异，常见有[0，1]、[0，5]、[0，9]和[0，100]。MOS值越大表示图像质量越好，DMOS值越大表示图像质量越差。近年来提出的NRIQA方法大都基于机器学习方法，每种算法都有自己的提出思想和特点。为了方便与其他方法对比，通常选择在公共数据库上训练并测试，使用公认的技术指标进行算法性能衡量.
3.常用数据库和算法性能指标
今天我们就仅介绍常见的几个公开数据库和常用性能指标。
（1）LIVE（Laboratory for Image & Video Engineering）数据库是最为广泛应用的共享数据库，共 982幅图像，包含 JPEG2000、JPEG、白噪声、高斯模糊和快速瑞利衰减5种其他基准库共有失真类型，图像质量用范围为[0，100]的DMOS值表示。
（2）CSIQ（Categorical Subjective Image Quality）数据库[9]共 866 幅失真图像，6 种失真，图像质量由范围为[0，1]的DMOS值表示。
（3）TID2008（Tampere Image Database）数据库包
括 1 700失真幅图像，17种失真，范围[0，9]的 MOS值表示质量。
（4）TID2013数据库将TID2008扩充至3 000幅图像，包含 24 类失真，同时给出峰值信噪比、结构相似度SSIM值[2，6]、MSSIM值、像素域的VIF值等作参考。
除此之外,NRIQA算法性能衡量指标最广泛采用的是视频质量专家组（VQEG）采用的评估标准——线性相关系数和秩相关系数。此外，还有评估方式以解决没有MOS值的大规模图像数据库。
（1）线性相关系数（Linear Correlation Coefficient LCC），也称皮尔逊线性相关系数（Pearson Linear Correlation Coefficient，PLCC），描述预测值与主观评分之间的相关性和算法的准确性.
（2）秩相关系数（Spearman’s Rank-Order Correlation Coefficient，SROCC）衡量算法的单调性.

除此之外为解决图像标注数据量不足，基于深度学习的 BIQA 算法分为两类：一类直接利用标注的 MOS/DMOS 标签训练浅层网络，这类方法称为OA-BIQA（Opinion Aware）；另一类从结合其他非IQA数据库设计自动标签生成模型、任务分段实现等方式增加训练数据规模，称为 OF- BIQA（OpinionFree）方式或OU-BIQA（OpinionUnaware）.
4.机器学习中的典型模型

通用 BIQA 算法学习从图像特征到相应质量分数映射，或者在映射之前将图像分成不同的失真。这类型的算法均面临以下问题：（1）需要大量样本训练鲁棒性；（2）实验证明算法对不同数据集敏感；（3）使用新训练样本时必须再训练。而NSS 特征反映了图像内容的自相似性和特定性，因此不存在对不同数据库敏感，使用新样本时也无需再训练.
在深度学习中质量预测是在输出层做回归，将图像多维特征转化为一个可以表示质量的数值。通常依赖失真图像和相应意见分数来学习将图像特征映射到质量分数的回归函数。这类型的模型被认为是具有“观察意识”（Opinion Aware，OA）的BIQA模型.
训练可靠的OA-BIQA模型需要大量的人工评分训练样本，但通过主观测试获得意见分数通常昂贵且耗时，训练数据极其有限。同时OA-BIQA模型通常具有弱泛化能力，在实践中的可用性受限。相比之下 OF-BIQA不需要主观评分来进行训练，具有更好的综合能力的潜力。因此有必要开发不依赖主观意见分数来进行训练“自主意识”（Opinion Free，OF）的 BIQA 模型。第一个OF-BIQA 模型是 2012 年由 Mittal 等提出的 TMIQ 模型.

5.结束语
经过此次的学习,我认为我们要积极利用各个领域的新方法新技术去大胆学习,虽然在这片文章中我看到了许多技术和方法,但是各个方法之间还是有有一些可以相互借鉴,相互补充的.
[参考文献]:
1.杨璐, 王辉, 魏敏. 基于机器学习的无参考图像质量评价综述[J]. 计算机工程与应用, 2018, 54(19):40-48.

读“基于机器学习的无参考图像质量评估综述”有感

读“基于机器学习的无参考图像质量评估综述”有感

猜你喜欢