一.本次讲座的学习总结

从密码到信息隐藏

密码主要解决了信息保密传输、数据来源认证与完整性认证等信息安全问题。
保护保密通信的数据--加密，但密码方法不能解决以下两方面问题：
- 保密通信的行为隐蔽性问题(隐写)
- 内容保护与内容认证问题

信息隐藏

信息隐藏式指将特定用途的消息隐蔽地藏于其他载体中，使得它们难以被发现或者消除，通过可靠提取隐藏地信息、实现隐蔽通信、内容认证或内容保护功能，类型主要包括水印、可视密码、隐写等。

鲁棒水印

可视密码

可视密码技术是 Naor 和 Shamir 于1994年首次提出的，其主要特点是恢复秘密图像时不需要任何复杂的密码学计算，而是以人的视觉即可将秘密图像辨别出来。其做法是产生 n 张不具有任何意义的胶片，任取其中 t 张胶片叠合在一起即可还原出隐藏在其中
的秘密信息。

隐写

隐写是基于信息隐藏的隐蔽通信或者隐蔽存储方法，将秘密消息难以感知地隐藏在内容可公开的载体中，保护保密通信或者保密存储这些行为事实。

隐写分析

隐写分析对抗隐写的主要手段是，发现与识别隐写对各类特征的扰动。具体方法有三种：有效提取隐写分析特征；有效构造隐写特征识别系统；有效获得先验知识。

文本（轻微改变字符间距，不可见字符，PDF、HTML、Office的格式信息）
音频（MP3，AMR（手机录音的音频格式，微信语音保存也是此格式））
视频（运动向量、变换系数帧内、间预测模式、量化参数、熵编码）
图像（空域图像、JPEG图像）

隐写方法
LSB嵌入、矩阵嵌入（改的少）、自适应隐写（改的好）。

LSB是最低有效位嵌入算法，最简单普遍的隐写算法。
矩阵嵌入是以最小的嵌入修改数目达到嵌入要传递消息的目的，可提高嵌入效率，即利用较少的嵌入修改嵌入同样数量的秘密消息。（LSB算法2bit的消息，平均改动1个像素；矩阵嵌入算法2bit的消息，平均改动3/4个像素）
自适应隐写是根据构造的嵌入失真函数计算载体图像中元素发生更改所引起的失真，利用隐写编码控制秘密信息的嵌入位置，在最小化图像总体嵌入失真的同时保证秘密信息的准确提取。（HUGO算法：嵌入失真函数+ STCs 编码）

首先补充以下隐写对图像格式的要求：

png图片是一种无损压缩的位图片形格式，也只有在无损压缩或者无压缩的图片（BMP）上实现lsb隐写
jpg图片对像数进行了有损压缩，就没法使用lsb隐写了。

LSB隐写就是修改RGB颜色分量的最低二进制位也就是最低有效位（LSB），而人类的眼睛不会注意到这前后的变化，每个像数可以携带3比特的信息。

上图十进制的235表示的是绿色，我们修改了在二进制中的最低位，但是颜色看起来依旧没有变化。我们就可以修改最低位中的信息，实现信息的隐写。我修改最低有效位的信息的算法就叫做lsb加密算法，提取最低有效位信息的算法叫做lsb解密算法。
最低有效位示意图如下：

二.学习中遇到的问题及解决

问题1: 图像的空域与频率域的用途不清楚

问题1解决方案：

空间域又称图像空间(image space)。由图像像元组成的空间。在图像空间中以长度(距离)为自变量直接对像元值进行处理称为空间域处理。
频率域是以频率(即波数)为自变量描述图像的特征,可以将一幅图像像元值在空间上的变化分解为具有不同振幅、空间频率和相位的简振函数的线性叠加,图像中各种频率成分的组成和分布称为空间频谱。这种对图像的频率特征进行分解、处理和分析称为频率域处理或波数域处理。
二者关系：
空间域与频率域可互相转换。在频率域中可以引用已经很成熟的频率域技术,处理的一般步骤为：①对图像施行二维离散傅立叶变换或小波变换,将图像由图像空间转换到频域空间。②在频率域中对图像的频谱作分析处理,以改变图像的频率特征。即设计不同的数字滤波器,对图像的频谱进行滤波。
频率域处理主要用于与图像空间频率有关的处理中。如图像恢复、图像重建、辐射变换、边缘增强、图像锐化、图像平滑、噪声压制、频谱分析、纹理分析等处理和分析中。
空间域处理主要用于直方图均衡化、灰度变化、光滑处理等基础图像处理操作。

三.本次讲座的学习感悟和思考

最近正好有机会参加CTF竞赛，在misc（杂项）中的Stego部分就是关于隐写的部分。当前隐写术不光对常见jpg、tiff、png等格式进行隐写，对mp4，pdf，pcap，midi，exe，TTL等都进行隐写。隐写分析的常用工具有pngcheck，webStego4open、MSU VideoStego。
讲座中老师提醒我们要练习好编程，多看顶级论文。在日常学习和这次比赛之中越来越觉得实操与理论研究都是研究生必备的能力。有时间也要多参加比赛。

四.最新研究现状

研究进展

在语音隐写的领域中，因为语音本身所具有的连续性，在文章RNN-SM: Fast Steganalysis of VoIP Streams Using Recurrent Neural Network中利用递归神经网络RNN来检测语音文本之间的相关性。之前使用的方法是利用HMM来建模字符序列，接着利用PCA来选择特征，特征中既包含局部特征又包含全局特征。该文章中的隐写分析模型是RNN-SM是通过CCM和FCM级联在一起，数据集采用https://github.com/fjxmlzn/RNN-SM/与之前的算法比较，在样本长度方面，RNN-SM对短样本隐写检测具有更高的准确度。在嵌入率方面，当嵌入率较低时，英语语音样本的准确率高于中文语音样本。然而，当嵌入率很高时，两个语言的准确度很接近。这种现象可以通过两种语言的不同特征来解释。英语由20个元音和28个辅音组成。但是，在中文中，有412种音节。当嵌入率较低时，多样性使汉语相关模型更加复杂，因此在汉语语音中检测隐写术更加困难。当嵌入率增加时，检测难度降低，并且语言特征导致的影响下降。因此，两条精度曲线都收敛到相同的高水平。
在mp3隐写的领域中,Multi-Layer Architecture for Efficient Steganalysis of UnderMp3Cover in Multi-Encoder Scenario提出的模型第一层检测编码器，第二层执行隐写分析工作。该架构的一个优点是可以分别针对每个编码器优化特征提取和特征选择。在第一层在检测编码器中进行分类，编码器使用了4个特征，使用传统径向基RBF内核的二进制SVM实现的。然后在第二层中进行实际的隐写分析。第一层相当于数据的预处理，例如，语音中的性别，照明条件或图像中的姿势等。第二层为执行实际的工作，例如，语音中的语音识别，图像中的人脸识别等。在第一层分类器中采用了传统的机器学习方法。
在图像隐写的领域中，图像隐写术可以分为两大类：空间域和频域隐写术。即便深度学习可以更好的得到图像特征，但在隐写器的设计中，依然存在很多传统算法并且效果好于神经网络。在WISERNet: Wider Separate-then-reunion Network for Steganalysis of Color Images提出一种WISENet用于彩色图像的隐写分析，其创新点在于分析出图像卷积操作对隐写的影响，卷积层中求和保留了强相关模式，但损害了不相关的噪声。所以WISENet中在底部卷积层不采用加和操作，在上卷积层使用正常的卷积求和操作。这种加和的影响在文中被称为“linear collusion attack”，并做了大量实验证明WISENet优于其他隐写模型。模型的优势在于其参数量比其他深度学习隐写分析器少，复杂度小，因此比之前更容易训练。
在Large-Scale JPEG Image Steganalysis Using Hybrid Deep-Learning Framework 文中，提出了一种用于JPEG隐写分析的通用混合深度学习框架结合了底层手工卷积内核和阈值量化器与上层紧凑深度学习模型的配对。第一阶段是手工制作特征，对应于丰富模型的卷积阶段和量化和截断阶段。量化和截断是计算每个残差以进一步改善所得特征的多样性，以及降低计算复杂度。第二阶段是包含多个深子网的复合深度神经网络，其中在训练过程中学习模型参数。目标图像与一组内核进行卷积，以生成不同的噪声残差。该阶段的目的是抑制图像内容以及提高SNR（信噪比）。最后聚合噪声残差中的值以进一步降低特征维度。其底部由三个独立的结构相同的量化和截断子网组成。
数字图像中隐含的隐写通信检测器主要包括三个步骤，即残差计算，特征提取和二元分类。图像隐写分析的深度学习层次表示该文提出的CNN使用在空间丰富模型（SRM）中计算残差图的基本高通滤波器组来初始化所提出的CNN的第一层中的权重，而不是随机策略，在初始化充当正规化器以有效地抑制图像内容。图像中隐写提取特征方法有区别人工，传统，神经网络提取特征，而隐写方法基本采用如下四种方法：WOW 、S-UNIWARD 、HILL 和MiPOD。

密码与安全新技术专题之隐写