HCGAN一种基于GAN的高容量信息隐藏算法

第49卷第4期2022年4月
Vol.49,No.4
Apr.2022湖南大学学报(自然科学版)
Journal of Hunan University(Natural Sciences)
HCGAN:一种基于GAN的高容量信息隐藏算法
张克君1,2,李旭1,于新颖2†,冯丽雯1,秦昊聪1,张健毅1
(1.北京电子科技学院网络空间安全系,北京市100071;
2.北京邮电大学网络空间安全学院,北京市100876)
摘要:针对现有信息隐藏算法存在隐写容量低、信息提取困难以及安全性差等问题,本文提出了一种基于生成对抗网络的高容量信息隐藏算法(High Capacity Information Hiding Al⁃
gorithm Based on GAN,HCGAN).在秘密信息嵌入方面,使用基于Im-Residual结构的编码器将
秘密信息嵌入载体图像中,避免了秘密信息嵌入时由卷积层提取特征导致的信息损失.在秘
密信息提取方面,使用基于稠密结构的解码器从含秘图像中提取出秘密信息,利用特征复用
来增加秘密信息的提取率.在抗隐写分析方面,利用基于隐写分析的鉴别器与基于Im-
Residual结构的编码器进行对抗训练,以提高含秘图像的抗隐写分析能力.实验表明,经过对
抗训练后,HCGAN在2bpp嵌入率下比WOW和S-UNIWARD在0.4bpp嵌入率下具有更低的
隐写分析检测率.
关键词:信息隐藏;深度学习;生成对抗网络;自编码器;卷积神经网络
中图分类号:TN915.08文献标志码:A
HCGAN:A High Capacity Information Hiding Algorithm Based on GAN
ZHANG Kejun1,2,LI Xu1,YU Xinying2†,FENG Liwen1,QIN Haocong1,ZHANG Jianyi1
(1.Department of Cyberspace Security,Beijing Electronic Science and Technology Institute,Beijing100071,China;
2.School of Cyberspace Security,Beijing University of Posts and Telecommunications,Beijing100876,China)
Abstract:Aiming at the problems of low steganographic capacity,difficult information extraction,and poor secu⁃rity in existing information hiding algorithms,this paper proposes a high capacity information hiding algorithm based on GAN(HCGAN).For secret information embedding,an Im-Residual structure-based encoder is applied to embed the secret information into the carrier image,avoiding the information loss caused by the feature extraction of the con⁃volution layer.For secret information extraction,a dense structure-based decoder is utilized to extract secret informa⁃tion from the secret image,and feature reuse is used to increase the extraction rate of secret information.In terms of anti-steganalysis,the discriminator based on steganalysis and the encoder based on Im-Residual structure are used for adversarial training to improve the anti-steganalysis ability of the secret image.Experiments show that after adver⁃sarial training,HCGAN has a lower steganalysis detection rate at an embedding rate of2bpp than the WOW and S-
∗收稿日期:2021-11-29
基金项目:北京高校高精尖学科建设项目(20210086Z0401),Advanced Discipline Construction Pr
oject of Beijing Universities (20210086Z0401);国家重点研发计划网络空间安全重大专项课题资助(2018YFB0803601),National Key Research and Development Program on Cyberspace Security(2018YFB0803601)
作者简介:张克君(1972—),男,山东临沂人,北京电子科技学院教授,博士
†通信联系人,E-mail:********************
文章编号:1674-2974(2022)04-0035-12DOI:10.16339/jki.hdxbzkb.2022280
超滤膜清洗湖南大学学报(自然科学版)2022年UNIWARD algorithms at an embedding rate of0.4bpp.
Key words:information hiding;deep learning;generative adversarial networks;autoencoder;convolutional neu⁃ral network
随着网络信息技术的快速发展和移动终端设备的不断普及,数字多媒体成为互联网通信的主要载体.数字多媒体的广泛应用使得网络中充斥着大量对国家、企业或个人而言十分敏感的信息.为保证这些信息能被安全地传递,发送方通常需要对信息进行加密,同时加密后的密文只能被持有特定密钥的接收者解密,但密文的伪随机性会暴露秘密信息的存在,从而引来攻击者的怀疑和攻击.信息隐藏技术通过将敏感的秘密信息伪装成普通信息来隐藏秘密信息,为上述问题提供了解决方案,对信息安全有着重要
意义[1].
在信息隐藏过程中,发送方首先将秘密信息嵌入载体中形成含秘载体,随后把含秘载体上传到公共信道[2].特定的接收方从公共信道中下载含秘载体,使用密钥或提取算法从中提取出秘密信息.在秘密信息的传递过程中,除了通信双方之外,其他人虽然可以下载含秘载体但无法获取其中的秘密信息.信息隐藏技术的这种隐蔽性能够有效阻止攻击者对秘密信息的感知和破坏,进而保证了秘密信息在传递过程中的安全[3].蜂巢格室
信息隐藏技术和加密技术的结合既防止了秘密信息的存在被知晓,又保护了秘密信息的内容,但仍不能保证秘密信息的绝对安全.发送方在嵌入秘密信息时会不可避免地对载体造成干扰,隐写分析就可以对这些干扰进行分析并判断出载体是否含有秘密信息.信息隐藏和隐写分析互为对手,在相互对抗中不断发展进步.为了对抗隐写分析,信息隐藏已经从早期的最低有效位(Least Significant Bit,LSB)替换算法[4]发展到现在根据载体内容来嵌入秘密信息的自适应信息隐藏算法.在不断进步的信息隐藏技术的推动下,隐写分析也很快实现了从专用到通用,从低维特征到高维特征的跨越.
不断进步的隐写分析算法虽然促进了信息隐藏算法的发展,却对信息隐藏技术的安全性提出了挑战.近年来,深度学习技术在运算速度更快的硬件支持下迅速发展,不断涌现出各种网络模型.深度置信网络[5]及反向传播算法的提出更是推动了深度学习技术在计算机视觉、自然语言处理和自动驾驶等领
域的发展.深度学习强大的学习能力和特征表达能力,使得隐写分析算法的设计不再需要丰富的专业知识.在基于深度学习的隐写分析算法被提出之后,隐写分析对含秘载体的检测能力越来越强,这迫使信息隐藏领域的研究者开始研究更加安全的信息隐藏算法.
在对信息隐藏技术的探索中,Goodfellow等人于2014年提出的生成对抗网络[6](Generative Adver⁃
sarial Networks,GAN)受到了信息隐藏技术研究者的关注.GAN包含两个神经网络,其中一个网络能够生成符合真实样本分布的生成样本,另一个网络用来区分真实样本和生成样本,这两个网络互相对抗并交替训练.GAN这种对抗博弈的方法和信息隐藏技术与隐写分析算法互相对抗并不断发展的情况十分相似,因此信息隐藏技术的研究者期望将GAN用于信息隐藏中以得到更强的安全性和更高的隐写容量.迄今为止,基于GAN网络的信息隐藏算法并没有完全实现上述目标,它们在隐写容量、安全性和秘密信息提取准确率等方面还存在不足.因此,研究基于GAN的信息隐藏技术并使其在隐写容量和安全性等方面获得提升有着重要的实际意义.
本文提出了一种新的基于GAN的高容量信息隐藏算法(HCGAN).该算法能够在高容量的情况下保持较高的秘密信息提取率,并且有较强的抗隐写分析能力.HCGAN算法由三部分组成:①基于Im-Residual结构的编码器,发送方能够通过编码器将秘密信息嵌入载体图像中形成隐秘图像;②基于稠
密结构的解码器,接收方可以通过解码器将秘密从隐秘图像中提取出来;③基于隐写分析的鉴别器,用来进行对抗性训练以提高隐秘图像的抗隐写分析能力.本文的主要贡献如下:
1)提出了基于Im-Redisual结构的编码器,其中Im-Residual结构是基于Residual结构进行优化所形成的,Im-Residual结构的编码器采用多次嵌入的思想能够降低秘密信息因特征提取而产生的信息损失,从而提高秘密信息提取率.
36
第4期张克君等:HCGAN:一种基于GAN的高容量信息隐藏算法
2)设计了基于稠密结构的解码器,利用Dense结构特征复用的能力提取出更多有用特征,以进一步提高解码器的秘密信息提取率.
3)提出了一种基于隐写分析的鉴别器,通过GAN的对抗训练思想进一步提升HCGAN信息隐藏算法的抗隐写分析能力.
1相关工作
1.1经典的信息隐藏算法
根据所使用的方法不同,信息隐藏技术可以分为经典的信息隐藏算法和基于深度学习的信息隐藏算法.
最低有效位替换算法作为早期的信息隐藏算法,只对像素中最不影响图像视觉效果的最低有效位进行修改[4].LSB替换算法能保证载体的视觉质量,但在嵌入过程中没有考虑载体的统计特征.因此,隐写分析算法可以轻易地根据直方图异常等特征识别出通过LSB替换算法获得的含秘载体.像素值差分[7](Pixel Value Differencing,PVD)使用两个连续像素之间的差来表示秘密信息,比LSB替换算法更安全,但是也存在统计特征的异常.此后,研究者们设计信息隐藏算法时就注意保持某些统计特征不变.LSB匹配算法对LSB替换技术进行改进,如果秘密比特和载体图像的LSB不匹配,则在相应的像素值上随机加减1[8].随机加减1的方法可以保持载体图像的统计直方图不变,但最低位和次低位的统计特征异常仍会使LSB匹配算法不够安全[8].除了可以在空间域嵌入秘密信息以外,也可以在各种变换域嵌入秘密信息.离散余弦变化(Discrete Cosine Trans⁃form,DCT)就是一种变换域.与傅立叶变换类似,DCT可以将图像从空间域转换到频率域.JPEG格式的图像就使用了DCT,其对每个颜成分使用余弦变换来将大小为8×8的连续像素块转换为64个余弦系数.JSteg[9]、OutGuess[10]等方法都是在DCT的基础上嵌入秘密信息的信息隐藏算法.
信息隐藏算法能够根据载体内容自适应地嵌入秘密信息来提高算法的安全性.2010年,Pevný等人[11]提出的HUGO就是一种自适应的信息隐藏算法.HUGO首先通过嵌入信息对载体图像的影响来定义失真函数,随后使用加权范数函数将像素空间压缩为特征空间,并在失真函数最小的位置嵌入秘密
信息[11].2012年,Holub等人[12]提出的WOW (Wavelet Obtained Weights)算法可以根据图像内容在纹理复杂的区域嵌入更多的信息.2014年Holub 等人[13]提出的S-UNIWARD算法是一种与嵌入域无关的通用失真函数.虽然HUGO、WOW和S-
UNIWARD的失真函数各不相同,但三个算法的最终目的都是通过最小化失真函数来自适应地嵌入秘密信息.此后提出的经典的信息隐藏算法或是改进失真函数[14],或是改进隐写编码[15].这些改进虽然提高了信息隐藏的安全性,但对信息隐藏算法的隐写容量提高非常有限.
1.2基于深度学习的信息隐藏算法
基于深度学习的信息隐藏算法被提出后,经典信息隐藏算法的安全就面临着严重的威胁.将深度学习应用于信息隐藏领域以对抗基于深度学习的隐写分析算法成为信息隐藏领域中新的研究方向.特别是生成对抗网络,其优秀的图像生成能力和博弈对抗的思想引起了信息隐藏领域研究者们的关注. 2017年,Hayes等人[16]提出将GAN与信息隐藏相结合的Ste-GAN-ography算法.该算法使用三个普通的神经网络分别作为嵌入秘密信息的生成器、提取秘密信息的提取器和进行隐写分析的鉴别器,训练过程和一般的生成对抗网络相同.2017年,Tang 等人[17]提出了ASDL-GAN算法.该算法首先学习一个概率映射矩阵来为秘密信息寻合适的嵌入位置,然后使用传统的STC方法嵌入秘密信息.Yang等人[18]在ASDL-GAN的基础上进行改进,使用Tanh-simulator激活函数、基于U-NET[19]的生成器
和SCA[20]判别器来减少训练时间并增强抗隐写分析能力.Liu等人[21]于2018年提出了一种直接使用ACGAN生成器进行无载体信息隐藏的Stego-ACGAN算法.该算法通过建立图像类别与文本之间的映射字典,将秘密信息表示为图像类别信息,然后将图像类别信息输入生成器生成含秘图像,从而实现无载体的信息隐藏[21-22].2019年,Zhang等人[23]提出一种基于约束采样的含密载体生成方法.该方法首先训练一个生成器,然后通过数字化卡登格子对生成器进行约束采样,以获得满足条件的含密图像.
自2017年提出在载体图像中隐藏秘密图像的应用场景后,图像信息隐藏这一方向迅速成为信息隐藏领域的研究热点[24].2017年,Baluja等人[24]提出使用神经网络在图像中寻合适的位置并嵌入秘密图像信息.该方法对编码过程进行训练,将整个秘密图像嵌入载体图像中并使秘密图像信息分散到图像的每个比特中.2018年,Zhang等人[25]提出将封面图像分为Y、U、V三个通道,并通过编码器将灰度化的
37
湖南大学学报(自然科学版)2022年
秘密图像隐藏到封面图像的Y 通道中.2020年,Duan 等人[26]提出了一种结合图像椭圆曲线密码学和深度学习的大容量信息隐藏算法.该算法利用离散余弦变换对秘密图像进行变换,再用椭圆曲线密码
术对变换后的图像进行加密,最后使用SegNet [27]网络来隐藏和提取秘密信息.
图像信息隐藏算法带来的高隐写容量是在损失部分秘密图像数据的前提下达成的.这些算法之所以能隐藏秘密图像信息,是因为图像能够在损失部分数据后不影响信息的呈现.如果要隐藏较多的文本或其他类型的秘密信息,使用现有的图像信息隐藏算法会导致较低的秘密信息提取准确率和较弱的抗隐写分析能力.
本文对图像信息隐藏算法进行研究后发现引起秘密信息损失的主要原因是卷积层只能提取有限特征.因此,本文设计了基于Im-Redisual 结构的编码器,通过减少编码过程中的信息损失来提高秘密信息提取率.本文利用基于稠密结构的解码器和基于隐写分析的鉴别器分别来提高秘密信息提取率和抗隐写分析能力.车座头枕
2基于GAN 的高容量信息隐藏算法HCGAN
为解决信息隐藏算法存在的隐写容量低和抗隐写能力弱的问题,本文提出了一种基于GAN 的高容量信息隐藏算法(HCGAN ).如图1所示,HCGAN 算法主要由三部分组成:基于Im-Residual 结构的编码器、基于稠密结构的解码器和基于隐写分析的鉴别器.基于Im-Residual 结构的编码器将输入的秘密信息和载体进行编码以得到含秘载体.发送方得到含秘载体后将其上传到公共信道中.接收方从公共信道中获得含秘载体后,使用基于稠密结构的解码器从含秘载体中解码出秘密信息.基于隐写分析的鉴别器
的任务是区分含秘载体和普通载体,并在训练时提供梯度以优化基于Im-Residual 结构的编码器.需要注意的是,基于隐写分析的鉴别器只在模型训练时使用.模型只需使用基于Im-Residual 结构的编码器和基于稠密结构的解码器就可以完成秘密信息的传递.本节将详细介绍HCGAN 模型的三个组成部分及其总体架构,并描述其训练过程.
2.1基于Im-Residual 结构的编码器
为提高模型的隐写容量,本文在残差网络结构的基础上进行改进,得到了一种被称为Im-Residual 的网络基础结构.Im-Residual 结构通过增加秘密信息的直接映射来减少秘密信息在特征提取过程中的损失.基于Im-Residual 结构的编码器更适用于信息隐藏,并且能够增加载体中可以嵌入的秘密信息.
编码器的目标是将秘密信息安全地嵌入载体图像中,从而方便解码器从中提取出秘密信息.如图2(a )所示,基于深度学习的信息隐藏算法的编码器一般使用多个基础卷积层+LeakyReLU 激活函数+BN 层结构作为卷积神经网络.因为卷积神经网络是
硬质合金密封环通过卷积核提取特征,再将提取出来的特征归一化处理后作为下一个卷积核的输入,所以在此过程中不可避免地会因为提取特征而损失信息.对图像类型的秘密信息而言,损失一部分不重要的信息是可以接受的,并且不会影响秘密信息内容的传递.但是对于其他类型如文本类型的秘密信息而言,损失一部分信息是不可接受的.因此,为了使编码器结构能适用于其他类型的秘密信息,Kevin A.Zhang 等提出
使用Dense 结构的卷积神经网络来降低编码器对于信息的损失,如图2(b )所示.但Dense 结构也会导致输入增加,进而增加需训练的参数[28].
在研究和分析了Dense 结构之后,我们发现其能
秘密信息
载体
发送方
基于Im-Residual
结构的编码器
基于隐写分析的鉴别器
含秘载体基于稠密结构的解密器
含秘载体
接收方
秘密信息
图1基于GAN 的高容量信息隐藏模型的整体框架
Fig.1Overall framework of high capacity information hiding model based on GAN
38
第4期张克君等:HCGAN :一种基于GAN 的高容量信息隐藏算法
电脑加密锁减少信息损失的核心原因不是Dense 结构带来的特征的多次重复使用,而是对秘密信息的多次嵌入.因此,本文提出了基于Im-Residual 结构的编码器,如图2(c )所示.在残差结构的基础上通过短路多次嵌
入秘密信息,优化了编码器模型,减少了约1/3的训练参数,最终得到了更优的提取率和视觉性能.Dense 结构和Im-Residual 结构的参数对比如表1所示,表中D 为嵌入率.
在本文中,基于Im-Residual 结构的编码器通过
Im-Residual 结构的卷积神经网络将秘密信息嵌入载体图像中以得到含秘图像,如公式(1)所示:
S =C +E Im -Redisual (
C ,M
)
(1)
式中:C 为W ×H ×3的彩载体图像,M ∈{0,1}D ×w ×H 为将要嵌入的秘密信息,S 为W ×H ×3的彩含秘图像.
2.2基于稠密结构的解码器
在基于Im-Residual 结构的编码器将更多的秘密信息嵌入载体中之后,如何从含秘载体中更好地提取出秘密信息就成了后续研究的重点.Im-Residual 结构可以使用更少量参数完成将少量信息嵌入图片等含有大量信息的载体中,以减少过拟合风险并完成编码器工作.但在需要从大量信息中提
取出少量信息的解码器场景中,Im-Residual 结构就无法提供足够的信息供后续网络层使用.因此为提高解码器的提取能力,本文设计出了一种基于稠密结构的解码器.稠密连接网络中每一个网络层输出的特征映射会直接叠加到后面网络层的输入中,以Image Tanh 3×3Conv 3×3Conv LeakyReLU BN BN LeakyReLU 3×3Conv
BN LeakyReLU 3×3Conv Cover
Data
(a )基础的编码器
3×3Conv
LeakyReLU 3×3Conv Cover
Data
BN LeakyReLU BN 3×3Conv LeakyReLU BN 3×3Conv Image (b )Dense 结构的编码器
Image
3×3Conv BN LeakyReLU 3×3Conv BN LeakyReLU 3×3Conv
Data
BN LeakyReLU 3×3Conv Cover
(c )Im-Redisual 结构的编码器
图2三种编码器对比图Fig.2Comparison of three encoders
表1Dense 结构和Im-Residual 结构的参数对比Tab.1Comparison of parameters between Dense structure and Im-Residual structure
网络层数Conv1Conv2Conv3Conv4总参数量
Dense
3×3×3×323×3×(32+D )×32
3×3×(2×32+D )×32
3×3×(3×32+D )×3
31164+1755D
Im-Residual 3×3×32
十字滑台3×3×(32+D )×323×3×(32+D )×323×3×(32+D )×320160+1755D 39

本文发布于:2024-09-24 07:17:37,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/230001.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:信息   秘密   隐藏   算法   图像   载体
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议