基于W2ID准则的RichModel隐写检测特征选取方法

第44卷第4期2021年4月
Vol.44Ao.4
Apr.2021计算机学报
CHINESE JOURNAL OF COMPUTERS
基于W2ID准则的Rich Model隐写检测特征选取方法马媛媛年徐久成年张祎0杨春芳2第向阳1
年(南师范大学计算机与信息工程学院河南新乡45302)
中国人民解放军战略支援部队信息工程大学郑州45002)
讥数学工程与先进计算国家重点实验室郑州45002)
摘要数字隐写是信息安全领域一个重要分支,其通过将秘密信息嵌入到数字图像、声音、视频等文件中并通过公开信道数:Email邮箱、微博推文和即时通信等)进行传递,从而实现信息的隐蔽通信.图像自适应隐写是近年来数字隐写技术的研究热点,而Rich Model特征是检测图像自适应隐写的一大类主流高维特征,这类高维特征在实现对图像自适应隐写较高检测正确率的同时,带来了高额的计算开销和和存储
开销,并使得隐写检测中的分类器训练变得极为困难•为此,本文提出了一种基于加权类间距离和类内距离差异准则(W2ID准则)的图像Rich Model 隐写检测特征选取方法(记为W2IDp方法).首先,在对Fisher-basee方法这一隐写检测特征经典选取方法进行原理分析的基础上,指出该方法可能存在误删有用特征分量、保留冗余和冲突特征分量的不足;然后,通过将“内距离差异”则引入到隐写检测特征分量的可分性度量,提出了基于类间距离和类内距离差异的特征可分性度量准贝KW记为2ID准则),给出了类内距离差异的一个相关性质;同时,为了合理体现“间距离”重要性,本文提出了基于频数统计加权法的权重分配算法,为该准则分配合理权重,使得对特征分量可分性的度量结果相比传统的Fish—则更为准确;最后,依据W2ID准则的度量结果,基于决策粗糙集b域约简方法约简隐写检测特征分量,并在约简特征分量过程中,将每次处理一个特征分量改进为每次处理一组特征分量,以提升决策粗糙集b域约简的效率首出的W2IDp方法因无需设置可分性下限,避免了阈值设置不准确可能造成去除有用特征分量的问题,从而消除了现有Steganalysisb隐写检测特征选取方法依赖经验参数的问题.基于数字隐写领域通用的BOSSbase-1.02图像库年000幅原始图像和基于经典SI-UNIDARD隐写方法生成的多组隐写图像为十对从这些图像组每幅图像中提取的35263维J+SRN特征和年000维GFR特征(两类典型的图像Rich Ml隐写检测特征),进行了一系列特征选取实验,结果表明:本文提出的W2ID-1方法能够在大幅降低Rich Ml隐写检测特征维数的同时,基于选取后特征的隐写检测提高了对隐写图像的检测正确率,与Fisher-Used、Steganalysis-u和PCA-basee等现有典型特征选取方法相比具有显著优势本口对嵌入率=0.1的SI-UNIDARD隐写图像,基于提出的W2ID1方法将J+SRN特征从35263维降到2723维的同时,还提高了  3.63%的检测正确率图
关键词隐写检测然ich Ml;特征选取然2ID准则;旷正域约简;Fisher-basee方法
中图法分类号TP39)DOI号年基年7/SP首首维.2021.00724
W2ID Criterion-Based Rich Model Steganalysis Features Selection
MAYuanUuan年其XU JOCheng图ZHANG Yi4YANG Chun-Fang4LUO Xiang-Yang6为
年(Wenan Normal Universily,Xinxiang,Henan453002)
4(PLA Slralegic Support,Forcr InformaLioa Engineering Universily,Zhengzhou450001)
维两犪F Key Laboratory of MalJiemaSal Engineering and Advancer CompuLfg,Zhengzhop450001) Abstract Digital steganograpUy is an importane branch of the information security technology.
Digital steganograpUy embeds the secret informatios into the digital files,which includee isage, voice,viden anS ethers,anS transmits them through public E-mail,Twitter, Instaot messaginy,etc.),so ne to realizr七1'3_115111让打1年the information C secret.The imaac 收稿日期:2019-11-11;在线发布日期:2020-02-m.本课题得到国家自然科学基金数年04263,06%年,61772549,年%年卷年7244卷、国家重点研发计划(2016YFB0801303,2016QY01W0105)s河南省科南昌大学办公自动化系统
技创新杰出人才项目(W4200510017)和河南省科技攻关项目(202102210165)资助.马媛媛,博士,讲师,主主研究方向为图像隐写技术.E-mail:yuanyuanma821)123.首久成,博士,教授冲国计算机学会数CF)会员,主主研究领域为粗糙集、粒计算.张祎,博士研究生,主主研究方向为图像隐写与分析技术•杨春芳,博士,副教授,主要研究方向为图像隐写与分析技术•罗向阳数信作者)和授,博士生导师,主主研究领域为网络信工安全.E u O
4期马媛媛等:基于W2ID准则的Rich Model隐写检测特征选取方法725
adaptive steganography is a research liotspot in the area of steganography in recent years,while the Rich Model steganalysie feature is the mainstream high-dimensional feature foe detecting imaas adaptiva steganography.Thir kind of high dimensioo steganalysie featura noh only achiever high detection accuracy of imaas adaptiw steganography,bus also brings the high computational overheap anO storage spare.Thus,the classifiee in steganalysis is very cUfficult to train Toe thn reasoo,this papee proposes p steg^rlysis featurs selectioo methoO(W2IDp)baseg on ths Weight Inter-clase Distance anO Intra-clase distancc Difference criterioo(W2ID criterion).Fiet, this papee analyzee the principle of the Fisher-baseR method,which is e classical steganalysie featurc selectioo methoO.Then,it pointe ou I thn this methoO may haw the shortcominae of deleting useful feature components,retaining redundaoe anO conflicting feature componente Uy mistake.Second,Uy introdu
cing the principle of u Intra-class distance Difference"to separability measuremeoi of the steganalysie feature component,this papee proposee p separability measuremeoi criterioo baseR on both Interclassee Distance and Intra-clase distance Difference(2D criterion).
The propertiee of Intra-clase aggregatioo Difference are also giveo.Meanwhile,in ordee to highlightina the importance of the u Inter-clase DistycR,n weight assignmeoi algorithm baseR oo the frequencs statistical weighting method is proposeR to assigo weighte to the separaLility criterioo reasonably.
This criterioo is c allee W2ID criterioo.Thus,the separability resuit of the steganalysie feature componeoi cao Ue measureR by the W2ID criterioo more accurate thao thai of the traditional Fishee criterioo.Finally,According to the measuremeoi resulte b aseR on the W2ID criterion,thie method selecte the steganalysie feature componente baseR on the decisioo rough sei a-positive regioo reductioo method.In the procese of feature componeoi reductioo,in ordee to improve the reductioo etficiency,an improved decisioo rough sei^-positive regioo reductioo is proposeO.The improveR decisioo rough set^-positive regioo reductioo methoU,which is deal with one feature componeoi ni a time,is changed to deal with one group of feature componente ni a time.Thus, useful feature componente will be remaineR and the lowee limit will not be s D,by which the dependency of empiric
al parametere of the existing Steganalysis-c method cao be eliminated.Two kinds of typical Rich Model steaganalysie featuree(35263-D J+SRR feature and17000-D GFR feature)are extracI from both10000originae imagee in the BOSSbase-7.00imaae database and multiple groups of stego imagee generated by chssich SI-UNIWARD stega_nogra_phy algorithm.
Theo,p seriee of feature selectioo experimente are carrieR on the J+SRR feature and the GFR feature.The experimentU resulte show thaI the proposeR W2ID-)method cao sig r df i cantly reduce Rimensione of Rich Model steaganalysie feature,meanwhile increase the accuracy to OetecI stego imagee.Compared with the resulte of existing typical feature selectioo methods,o e.Fishee-based,Steganalysis-c method and O C A-base R method,the propose R W2ID-7metho d h a s sigrdficaoI advantagee.Foe example,for the steg。imaae with payloaO10%generated by SI-UNIWARD steganography,the dimensioo of J+SRR feature is reduced based on the proposed W2ID-) method from35263to2723,and the detectioo accuracy is improved by3.63%.
Keywords steganalysis;Rich Model;feature selectioo;W2ID criterioo;)-positive regioo eaerthootioeeaecaneaemaheoe
1引言
近年来,自适应隐写技术的快速发展,对传统隐写检测方法提出了严峻挑战Rich Model类隐写检测特征5通过提取图像的多类统计属性构建高维特征,从而刻画隐写图像在信息嵌入前后的失真,能够有效捕捉到自适应隐写图像在嵌入前后的细微变化.高维Rich Model隐写检测特征和集成分类器相结合的方法已经成为当前对自适应隐写检
203计算机学报2026年
测的主要手段,对基于HUGO(Highly Undetectablr steGO会〕、WOW(Wavelet Obtained Weights)[4]和SI-UNI W ARD Wide-informed Universa;WavOu Relativc准stortion)⑷等自适应隐写得到的图像,都表现出了较高的检测准确率.然而,尽管Rich Mode;特征在检测自适应隐写方面表现出良好的效果,但这些特征往往高达上万维甚至数万维,给特征提取以及相应的分类器训练都带来了庞大的计算开销和存储开销,限制了这类方法的实际应用.如何降低Rich Mode;隐写检测特征的维数,从而减少存储空间、降低计算开销和提高检测效率,已成为自适应隐写检测中亟待解决的问题之一,本文将聚焦于图像Rich Mode;隐写检测特征的选取.
目前,研究者们在隐写检测特征的选取和降维方面已开展了一些研究.典型的有基于PCA(Principal Component Analysis)的隐写检测特征选取方法0(简记为PCAUsed方法)和基于Fishes准则的隐写检测特征选取方法□图(简记为Fishe准ased方法).其中,PCAUsed方法年的主要思想是:通过线性
变换将原始的特征变换成-组线性无关的新的特征分量,对变换后的这组特征征行排序,根据经验选取前若干个特征(这些被选取的特征被称为主成分),最后依据主成分对隐写图像进行分类检测. PCA-based方法能够降低特征的维数并在一定程度上保持了某些特征对隐写图像的检测准确率,然而大量实验结果表明利用PCA-based方法对非线性隐写检测特征降维后,约简后的特征对隐写图像的检测正确率不高.Eisher-based方法口年能在降低这些隐写检测特征维数的同时还能使检测正确率高于PCA方法的检测正确率.其主要思想是:首先基于Fishes准则度量特征分量的可分性W卩Fscom值),然后根据每个特征分量的Fo e值,计算出使得特征子集的Fo e值最大的特征分量,最后根据选取得到的这些特征分量进行隐写检测.该方法计算简单且对多种隐写检测特征都有较好的效果给口对于SPAA(Subtractive Pixe;Adjacency Matrix,和CC-PEV(Cartesian Calibrated featurs extracted by PEVf)特征都既保持了检测正确率又降低了特征维数,提高了检测效率.然而,Tisher-based方法未能有效删除冲突的部分特征分量以及Fscore值较大却是冗余的特征分量,导致特征维数依然较高.在前期工作中,我们提出了Steganalysism方法年,基于决策粗糙集a正域约简对Rich Model隐写检测特征进行降维,该方法能够较好地降低高维Rich M。方1隐写检测特征的维数.然而,在在一步的研究中我们发现,被Fisher-based方法和Steganalysism 方法作为“无用”特征分量删除掉的特征中,有很多特征分量在嵌入秘密信息前后具有相同的均值,而事实上,它们中的一些特征分量对于检测隐写图像具有重要作用,删除这些特征分量会降低对隐写图像的检测正确率.
针对上述问题,本文提出了一种基于“权重类间距离与类内聚离差异”准则和决策粗糙集a U域约简的Rich M。方1隐写检测特征选取方法(简记为W2ID-1方法)会利“权重类间距离与类内距离差异”准则度量均值相等的特征分量的可分性,并改进了决策粗糙集a U域约简,提出了针对Rich Model 隐写特征的选取方法,在进一步降低隐写检测特征维数并提高检测正确率的同时,达到提高检测效率和减少对经验参数依赖的目的.
本文第2节简要介绍Fisher-based方法的优点并分析其原理;第0节阐述本文提出的基于W2ID 准则的Rich Model隐写检测特征可分性度量算法;第4节给出基于W2ID准则的Rich Model隐写检测特征选取方法;第5节给出实验结果;第6节对全文文行总结.
I Fisher-based方法法理简介与分析
文献[11]将Fisher准则作为启发函数,提出了一种基于Fisher准则的隐写检测特征选取方法(简记为Fisher-based方法),用于隐写检测特征降维.该方法对CF(特征函数)矩、共生矩阵等多种传统隐写检测特征的选取具有良好效果,但是在特征分量可分性的度量和冗余与冲突特征分量的删除方面还存在不足.本节对Fisher-based方法原理进行简单介绍其指出该方法在对Rich Model特征进行选取时存在的缺陷.
2・1Fisher-based方法的原理简介
Fisher-based方法的基础是Fisher准贝!J.特征分量的Fisher值越大给则寺征分量对不同类别图像的可区分性就越好16.设有两类图像集Xc和Xu进中分别提取相应的特征集设为严和FU特征集中每个元素(特征)的维数均为N从更2维特征分量f c的Fisher值为
F狊化值维)矩?n+(p c n—m-C/维会(s节这z)+s〔这维)
(6)其中其+这)—m-C jn分别表示Xc和Xs在九上
4期马媛媛等:基于W2ID 准则的Rich  Model 隐写检测特征选取方法727
的均值,S+ ()和S —(犳犻分别表示Xc 和Xs 在九上 的标准差.
共青团中央委员会基于欧式距离度量特征集合的差异,文献[11]
又将Fisher 准则扩展用于度量多维特征分量的可分 性.特征集合可分性的度量方法如下:设||FC  || =
F AN 文• ||表示集合•中元素的个数,于是
Fscore  =―犖
(+((和犿(犻——⑵
i  ~1
i  ~1
其中文( + ()-(_(() ^ nJ 丫((()—犿())7
是两个特征集合的欧式距离,两类样本特征集合的
犖 ( 犖
方差分别为为工Qg  ())和犖》())•两
1 — (
三个代表论文1 — (个特征集合的可分性值表示为Fscore. Fscore 值越大,
其对应特征集合的可分性就越好.
Fisher-based 方法选取特征分量的主要过程如
下:对给定的图像特征集合,首先基于式 ⑴度量集 合中每个特征分量的Fscore 值;其次,根据Fscore
值;对特征分量进行降序排序;然后,按照排序后特 征分量的顺序,从第一维开始,依次向候选特征集合 中添加一维特征分量,并计算和记录此时候选特征
集合的犉犮e 值,直到得到原始特征集合的Fscore
值;最后,将Fscore 值最大时的候选特征集合中的 元素作为最终选取的特征.
2.2 Fisher-based 方法的性能分析
由上述Fisher-based 的原理可知其具有计算简
单、无需限定隐写检测特征的类型、可有效降低隐写 检测特征维数等优点.然而,Fisher-based 方法在
Rich  Model 特征选取时可能存在两方面不足.维族网站
(1) Fisher-based  方法不适宜度量 Rich  Model
特集分量的分分性由式⑴可知Fishe 准ased 方法在度量隐写检测 特征分量兀的可分性时,若载体图像集合和隐写图像
集合在上的类间距离为0 ,即犿 ⑴)一(1—⑴)=
0时,有Fscore ⑴)N  事实上,经过大量的统计,我
们发现图像Rich  Model 隐写检测特征中往往存在
大量满足Fscore 值上~0的特征分量.图1给出了
Bossbase-(. 01图像库10000幅图像及隐写图像(隐
写算法:SI-UNIDARD )的Rich  Model 特征对应的
Fscore 值.具体做法:从该原始图像组和SI-UND  WARD 隐写图像组中每幅图像提取Rich  Model 隐
写检测特征文卩35 263维的J  + SRM 特征和 图000
维的GFR 特征,分别计算并统计两种隐写检测特征
中满足(⑴⑴)一——(隐))7 <图一且s*⑴)+
S 一⑴)>0. 002的特征分量的个数.图1中横轴表示
统计的特征分量个数,纵轴表示每个被统计特征分量 对应的(隐+⑴)一犿⑴上2值和S*⑴)+sL  (犳) 值.图1⑴〜(隐分别表示嵌入率N  0和0. 8bpac
(bite  per  nonzero  RC  DCT  coefficient )的 J  + SRM
和GFR 特征的统计结果即O ”表示该特征分量对应
的(! ⑴)—一—⑴上2值即X ”表示该特征分量对 应的sS ⑴)+sL (⑴值.
我们由图1可知,当嵌入率= 0.0时即+ SRM 隐
写检测特征中有近4000个特征分量的(⑴+犳)—
+—⑴上2近似等于零而s2⑴)+s 2⑴)却较大的
现象,约占35263维J  + SRR 特征的10 3%;类似
地,GFR 隐写检测特征中有近9000个特征分量的 (⑴(⑴—+—(⑴)2近似等于零而S*隐)+s 「⑴)
却较大的现象,约占可000维GFR 特征的53.0%. 这一现象表明Rich  Model 隐写检测特征中有相当
比例的特征分量满足在载体和隐写图像集合的类间 距离近似等于零.遗憾的是,Fisher-based 方法计算 的此类特征分量的可分性值为0,从而将这类特征
分量作为冗余特征删除.而模式识别经典理论认为:
两个类别中样本数据分布方差的较大差异也有助于 样本的分类可.
0.40
0.35
0.300.25
马 0.20 10.15
0.100.05
0_0*050
1000 2000 3000 4000feature  number
■gw
(a) 0.1 J+SRM 0.07
-0.01
feature  number (b) 0.8 J+SRM
0.05
纳维斯托克斯方程
0.040.030.02
0.01
00.06
0-
-
0.005^-0.040
0.035
0.030
0.0250.020
0.0150.010
0.005;
-(D -ai+aL
0 2000 4000 6000 8000 10 000 ' 0 500 1000 1500 2000 2500
feature  number  feature  number
(c) 0.1 GFR  (d) 0.8 GFR
图1 J  + SRM 和GFR 特征中满足均值相等方差且较大的特征分量的分布图(嵌入率=00和0.8
724计算机学报2026年
(24—sherUsed方法无法删除一些冗余和冲突的特征分量
对特征分量/',和九,当FscoreW,f,)=FscoreW,f,)时,若删除/上存冲任意一个均不影响对图像的分类结果给0或力中其中一个被称为冗余特征分量,两者中删除一个,能够降低特征维数.一个好的特征选取方法应当尽可能地剔除冗余特征分量.
此外,当Fscore这[分Fscore值中,但但,将图像判断为载体图像而儿将图像判断为隐写图像时使兀或力被称为冲突的特征分量.删除冲突分量中错误的那个特征分量,显然能提高对隐写图像的检测正确率,这也是特征选取方法追求的目标.
Fisher-based方法选取认为Fscore最大的那个特征(分量)最适合于分类.然而,事实上这个观点存在疏漏.分析可知Fisher-based方法在隐写检测特征选取过程中可能存在以下三点问题:
题1:有用特征分量可能被误删除.由Fisher-td方法选取特征分量的主要过程可知,若添加某个特征分量后Fo e值达到最大值,则排在该分量后面的特征分量都作为冗余特征删除掉.但如前文所述,Rich Mode;特征中可能存在大量Fscore值较小但可分性较好的特征分量,删除此类特征分量会导致对隐写图像检测正确率的下降.
问题2:冗余特征分量可能被误保留.由Fisher-td方法选取特征分量的主要过程可知,在候选特征集合Fscore值达到最大之前,所有的特征分量都会被添加进来,即使是冗余的特征分量.但如前文所述,Rich Mode;特征中可能存在大量Fscore值较大但冗余的特征分量,添加此类特征分量会导致不能最大限度地降低特征维数.
问题3:冲突特征分量可能被误选取.与问题2相似,即使添加冲突特征分量时,对隐写图像的检测正确率有所下降,但只要后续添加进来的特征分量,能够使候选特征集合的Fscore值达到最大,则该冲突特征分量依然会添加进最终选取特征集合中.冲突特征分量的加加会导致选取后特征对隐写图像的检测正确率下降.
因此,我们需要到更适合隐写检测特征分量可分性度量准则,并在此基础上设计新的Rich Model隐写检测特征选取方法.
3基于W2ID准则的特征可分性度量
在对Rich Mode;隐写检测特征的选取中,可分性准则作为启发式函数,其基于可分性准则得到的特征分量的度量结果为隐写检测特征约简提供依据,故可分性准则的优劣直接关系到对Rich M。方1隐写检测特征进行选取后特征的维数和对隐写图像检测正确率的高低.为此,在正式给出针对Rich Model特征的选取方法之前,本节先阐述用于度量特征或特征分量的准则们在先提出基于类间和类内距离差滑精病
异的特征可分性准则(2ID准则),并在此基础上提出加权的节D准则(W2ID准则),用以衡量隐写检测特征分量的可分性.
3.12号准则和W2号准则
模式识别的经典理论表明:载体图像集合与隐写图像集合在特征分量上的类内距离差异较大时,该特征分量的可分性也较好年、如图2所示,图中白三角和黑矩形分别表示载体图像集合和隐写图像集合中的图像,白和黑圆形分别表示某一特征分量在载体图像集合和隐写图像集合中的均值.从图中可知,该特征分量在两类集合的类间距离近似为零,而其在隐写图像集合中分布较集中、在载体图像集合中分布较分散,即类内距离差异较大.此时载体图像集合和隐写图像集合较易被区分开.
15
10
5
7\
-10
-^15
图2类内距离差异与分类效果的示例图
A A
为此,我们考虑本用标准差的比值来度量两类图像的类内距离差异.当载体/隐写图像集合的所有图像在第上特征分量中勺标准差远大于载密/载体图像集合的所有图像在中勺标准差时当e.然分上s—(中《1W s—分分隐分分图只要/■,在载体图像集合和隐写图像集合中的标准差出现较大差异时,函数A中)+0.4X(S+(这上隐―(/,))+(S—(中上中+分))))都能提供较大值.即

本文发布于:2024-09-22 03:36:57,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/229512.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:特征   隐写   分量   检测   图像   方法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议