Rich Model for Steganalysis of Color Images

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.csdn.net/weixin_43383164/article/details/102703126

Abstract

在这篇文章中提出了一种对于Spatial rich model的扩展,附加特征由RGB三个通道的三维共现形成,他们的作用是捕捉颜色通道之间的依赖关系。这些CRMQ1(color rich model)对于展现了色彩插值痕迹的图片可以非常有效地检测其隐写信息。内容自适应算法由于其修改相同像素信息的趋势而受到更大冲击。该特征集的有效性在BOSSbase三个不同的颜色版本和两种隐写算法上得到验证。

1. Introduction

所有针对灰度设计的隐写分析技术都可以通过将彩色图像看做三倍大的灰度图像来应用于彩色图像,但这种方法失去了色彩之间的依赖性信息。

文献18中提出了第一个考虑颜色通道间相关性的彩色图像隐写分析特征集。作者使用了高阶的噪声残差矩,残差通过对三颜色通道的图像进行QMF分解的系数进行预测得到。
文献19中提出了另一种LSB颜色匹配检测器。作者使用图像的3D颜色立方体表示,提出了3*3*3领域的相对频率作为隐写特征。这种方法在解压后的JPEG文件中表现很好,但在大量具有单一色彩的图像中表现不佳。比如未经压缩或调整大小的图像。
另一种工作使用了直方图特征函数(HCF)的重心,通过重新采样进行校准,并通过汇总颜色成分进行了扩展。
这种方法依然不能在未经压缩的图像上表现优秀。
最后,文献15通过使用更加精确地预测做出了改进。这种方法考虑了CFA(颜色滤波器阵列)插值算法引入的像素间和通道间的依赖关系。

2. Common Core of Experiments

三个版本的BOSSbase:

  1. 10000张512*512 ppm的真彩色图像。我们将这个版本的color BOSSbase称为BOSSbaseRes(resized);
  2. 使用PPG(Patterned Pixel Grouping)算法的图像,称为BOSSbasePPG;
  3. 使用AHD(Adaptive Homogeneity-Directed)算法的图像,称为BOSSbaseAHD。

所有检测器都使用FLD训练为二分类器。对每个图像源、嵌入算法和负载都训练单独的分类器,以显示负载大小如何影响检测性能。定义总的分类错误概率 P E = min P F A 1 2 ( P F A + P M D ) P_E=\min_{P_{FA}}\frac{1}{2}(P_{FA}+P_{MD}) , P F A P M D P_{FA}和P_{MD} 分别表示误报(false-alarm)概率和漏检(missed-detection)概率。我们在超过十个5000/5000的数据集上用 P E P_E 的均值 P E \overline P_E 评估安全性结果,统计扩展是样本标准差。

我们采用了两种嵌入算法:

  1. 非自适应的LSB匹配(LSBM),以变化率作为失真度度量(LSB:将秘密信息嵌入到载体图像像素值的最低有效位,也称最不显著位,改变这一位置对载体图像的品质影响最小);
  2. 内容自适应的WOW(WOW:在平滑区域小修改,在不平滑区域大修改)。
    两种算法都在他们相应的失真度范围内进行模拟。测试的负载为0.05,0.1,0.2,……,0.5bpc(bits per channel pixel)都将彩色图片的三个通道看做三个灰度图像,并在每个通道中嵌入相同的相对负载以应用于彩色图片。还有一种方法是将彩色图像看做灰度图像的三倍大,并嵌入相同的相对负载。这种方法下,WOW可以自动将负载分配到不同的彩色通道上,这潜在地在更嘈杂的通道中嵌入了更多负载,因此提供了更好的安全性。本文采用了第一种方式,即在每个通道中嵌入相同的相对负载,因为这使我们可以更好的解释通道间的嵌入变化的统计检测结果。

3. Rich Model for Steganalysis of Color Images

大多数彩色图像,存储在一个光栅格式,如TIFF, PNG, BMP, PPM,等等,已经经历了一个潜在的长期处理管道组成的增益调整白平衡,色彩校正,颜色插值,伽马校正、去噪、滤波、对比度、亮度调整,和廓形修正,其中包括透镜畸变校正和色差。这就是设置为以未压缩格式(如24位TIFF)存储图像的相机内部所发生的事情,当原始图像在Adobe Lightroom等图像编辑软件中手动处理时,也会发生类似的处理链。在这种情况下,生成的图像将不包含或只包含相当弱的颜色插值痕迹。另一方面,如果彩色图像显示出可检测到的颜色内插痕迹,则可能有助于隐写分析人员进行检测,所以在本文中,我们在三个版本的color BOSSbase上测试所提出的特性。

我们提出了Spatio-Color rich模型(SCRMQ1),由两部分组成:

  1. SRMQ1(Spatio Rich Model):量化步长q=1,维度为12753。SRMQ1特征由每个颜色通道计算得到,三个特征融合以保持与灰度图像同样的维度。
  2. CRMQ1(Color Rich Model):一组三维颜色的共现。由与SRMQ1相同的噪声残差构建,但其特征由每个像素跨通道合成。

SRMQ1噪声残差由两种本地像素预测器计算得到:(1)线性——垃圾残差:由一个移位不变内核的高通滤波器与图像卷积得到;(2)非线性——最小最大残差:由在许多线性滤波器中取最大/最小值得到。这种残差根据滤波器结构,被分为五类:一阶、二阶、三阶差分,边缘内核,平方内核。

我们假定有一张真彩图片, I = { R , G , B } I=\{R, G, B\} 表示三个 n 1 n 2 n_1 * n_2 矩阵, R = ( r i j ) , G = ( g i j ) , B = ( b i j ) , r i j , g i j , b i j { 0 , 1 , , 255 } R=(r_{ij}), G=(g_{ij}), B=(b_{ij}), r_{ij},g_{ij}, b_{ij} \in \{0, 1, ……, 255\} 。另外,令 Z ( r ) = ( z i j ( r ) ) Z^{(r)}=(z_{ij}^{(r)}) 表示红色通道的量化噪声残差,比如,作为其水平邻域的均值, z i j ( r ) j = Q T ( [ r i j ( r i , j 1 + r i , j + 1 ) / 2 ] / q ) z_{ij}^{(r)}j = Q_T ([r_{ij} − (r_{i,j−1} + r_{i,j+1})/2]/q) Z ( g ) , Z ( b ) Z^{(g)},Z^{(b)} 同上。
SRMQ1使用四个邻居残差的4D共现,比如 ( z i j ( r ) , z i , j + 1 ( r ) , z i , j + 2 ( r ) , z i , j + 3 ( r ) ) (z^{(r)}_{ij} , z^{(r)}_{i,j+1}, z^{(r)}_{i,j+2}, z^{(r)}_{i,j+3}) ;CRMQ1使用每个像素的不同颜色通道 ( z i j ( r ) , z i j ( g ) , z i j ( b ) ) (z_{ij}^{(r)},z_{ij}^{(g)},z_{ij}^{(b)}) 的共现。
因此,即使噪声残差是“方向性的”,我们也只需要一个共现。由于自然图像的对称性,我们将预测器水平方向的三维共现与垂直方向的相结合。根据残差内核的对称性,我们可以在添加了内核的镜像版本和旋转了90度之后的版本上添加来自4个或8个残差版本的统计信息。

由于SRMQ1由8个一阶残差、8个三阶残差,5个二阶残差,8个边缘残差,2个平方残差构成,所以在CRMQ1模型中共有31个3D共现。在原始SRM中,它们都将通过方向和符号进行对称。因为我们在CRMQ1中形成了3D共现,所以我们选择了一个更大的阈值T = 3,而不是SRM中的残差使用的T = 2。对称化之后,所有的3D共现对垃圾(spam)类型残差的维度为100,对最小-最大残差的维度为196。由于有7个垃圾类型残差和24个最小最大残差,因此CRMQ1模型的最终维数为7×100 + 24×196 = 5404。

总结:我们提出的特性集由12753维SRMQ1模型(使用T = 2和q = 1的4D共现)与颜色通道融合,和5404维CRMQ1模型(由T = 3和q = 1的3D共现)与跨颜色通道融合。我们称之为SCRMQ1模型(C表示SRMQ1的彩色版本),它的维数是12753 + 5404 = 18157。

4. 实验

第一个实验结果展示在表1中,展现了一个负载的平均检测误差 P E \overline{P}_E ,图2和图3展示了三个数据集中,对于LSBM和WOW,将 P E \overline{P}_E 作为负载的函数的形状。

从表中可以看出,将SRMQ1的特征连接而非合并它们(并在特征维度上节省3个元素),只能带来很小的改进(2.5%)。而且,与预期一样的是,对于LSBM和WOW,使用SCRMQ1的隐写分析在带有去马赛克痕迹的图片中都比在重新调整大小的图片中更容易。
对比仅仅使用SRMQ1,CRMQ1在LSB算法调整大小的图片匹配上提升较小,在WOW上提升较大。我们认为原因是,自适应的WOW更倾向于调整给定像素多个通道的信息。对于LSBM和WOW,CRMQ1特征都比SRMQ1特征强大得多,并且了利用去马赛克技术,负责SCRMQ1中更多的检测能力。
WOW的高可检测性是由于简单地将WOW用于了彩色图片。彩色图片中内容自适应算法的安全性可以通过考虑通道间的依赖性设计失真函数而获得极大提高。

在两种去马赛克算法中,PPG和AHD对于使用任何一个特征集的隐写分析效果类似。使用AHD进行隐写分析容易一点点。但是BOSSbaseRes中的彩色图像和灰度图像使用SRMQ1的可检测性几乎相同(见图2,3的第一行)。
显然,由于平方根律的影响,在三倍小图像的隐写分析中,可检测率的下降几乎被彩色图像转为灰度图像的平滑特性所补偿了。而在去马赛克图像中,彩色图像和灰度图像的SRMQ1的隐写分析非常大,因为将彩色图像转为灰度图像大量削减了色彩差值的痕迹。

单独颜色通道中的检测,红色最难,绿色最容易。可能的原因是,红色通道是最嘈杂的通道。分析使用KB预测器在每个颜色通道上得到的噪声残差RMS,发现红色通道的噪声最大。我们将这归因于红色通道中更高的增益调整(白平衡系数)。我们计算了平均增益律确认了这一点。

在调整大小的图像中,最好的子模型是具有大量支持的模型;在去马赛克的图像中,趋势相反。见图1。可能的原因是,每个颜色通道都是同一位置四种像素的一种组合。具有更大支持的残差混合了更多信号,导致了低可检测性。

5. Conclusion

文章提出了一种SRM的扩展模型,SRM只为灰度图像设计,本文的模型可用于彩色图像。SRMQ1特征通过颜色通道间对称的残差3D共现增强,得到维度为5404的CRMQ1。尽管这些附加特征在不显示颜色插值痕迹的彩色图片检测中只有少量提升,但当这些痕迹出现时,CRMQ1却独立于两种经过测试的去马赛克算法和隐写图像算法,成为检测能力的主要承担者。

但是,在每个颜色通道中单独简单使用LSB和WOW时,两者对于去马赛克图像的安全性差别很小。这是因为WOW组合了纹理区域的嵌入变化,因此更经常地调整给定像素的多个通道信息。所以内容自适应的隐写方法应用于彩色图片时,需要使用捕捉了颜色通道依赖性的失真函数。

另外,丰富的模型可以压缩到更低的维度,拥有更强大的分类器。比如可以使用高斯SVM提高检测率。模型的SRM部分可以通过特征选择或使用可变的共现来实现。且通过使用较小的阈值T = 2, CRMQ1的特征维度可以从5404减少到2074,而性能损失很小。

在去马赛克的图片中,隐写的检测从颜色通道的残差共现中获益良多。但残差仍然是由像素的每个颜色通道中计算得到,因此‘对CFA视而不见’。未来可以研究让残差本身了解CFA的基本结构,从而更好地分离具有不同统计特性的信号来进一步改进检测。由于数字图像中的颜色插值篡改很容易被检测到,隐写分析可能在测试时先使用预分类器,然后将其发送给更恰当的训练后的分类器。

SRMQ1和CRMQ1的代码可以在http://dde.binghamton.edu/download/得到。

猜你喜欢

转载自blog.csdn.net/weixin_43383164/article/details/102703126