基于DWT-DCT-SVD的音频盲水印算法

著录项
  • CN201110404129.5
  • 20111206
  • CN102496367A
  • 20120613
  • 北京邮电大学
  • 杨榆;雷敏;郭玉翠;贾晓芸;朱宪花
  • G10L19/00
  • G10L19/00

  • 北京市海淀区西土城路10号
  • 北京(11)
摘要
随着互联网应用的普及,大量的音频信息以各种形式在网络上快速的交流和传播。为防止音频的盗版、复制等非法操作,本发明提出了一种结合离散小波变换、离散余弦变换和奇异值分解的音频盲水印算法,以实现对音频信息的版权保护。本发明先对原始音频进行分段,每段的长度为1600个样点,再对每段音频进行一维二级DWT变换,取出DWT变换后的近似分量cA2,对近似分量cA2进行一维DCT变换,将DCT变换后前1/4系数取出,转化为10*10的矩阵,并对此矩阵进行SVD变换,得到S矩阵,在S矩阵中嵌入水印信息。实验表明本发明具有较好的透明性,同时对MP3压缩、重采样、重量化、加噪、低通滤波和裁剪替换等常规音频信号处理攻击具有较强的鲁棒性。
权利要求

1.基于DWT‑DCT‑SVD的音频盲水印算法,其特征在于:结合离散小波变换(DWT)、离散余弦变换(DCT) 和奇异值分解(SVD),将原始音频数据分段后进行一维二级小波变换(DWT),再将DWT变换后的 近似分量进行余弦变换(DCT),然后把DCT变换后的前四分之一系数进行奇异值分解(SVD),在变 换后的S矩阵中嵌入水印信息。因为S矩阵具有较强的稳定性,将S矩阵的S(1,1)和S(2,2)取出来,利 用 的奇偶性嵌入水印信息。水印嵌入在DWT变换后的近似分量中,因此本发 明具有较好的鲁棒性。同时S矩阵具有较好稳定性,各种常见的音频信号处理不会对S的值产生较大 影响,因此本发明能抵抗各种常见音频常规信号处理攻击。S矩阵还有一个重要特点就是调整S矩阵 的值不会影响到音频信号质量,因此本发明具有较好的透明性。

2.如权利要求1所说的基于DWT‑DCT‑SVD的音频盲水印算法的的水印提取算法,其特征在于:对含水 印的音频信息进行一维二级DWT变换,然后将变换后得到的小波近似分量cA2进行DCT变换,取出 DCT变换后的系数前四分之一组成长度为100的向量Yi1,再将向量Yi1转化为10*10的矩阵jsi,对 矩阵jsi进行SVD变换,得到一个10*10的对角阵Sw,然后将每一个对角矩阵Sw的第一个值Sw(1,1) 和第二个值Sw(2,2)取出来进行对比以判断以得到一位水印信息,若Sw(1,1)/(Sw(2,2)*Δ)接近偶 数,则水印信息为0,若w(1,1)/(Sw(2,2)*Δ)接近奇数,则水印信息为1,最后得到提取的水印信息W, 将W变为2维图像矩阵,得到水印图像。

说明书
技术领域

技术领域  本发明提出一种基于DWT‑DCT‑SVD的音频盲水印算法,该算法具有较好的透明性,且算 法的效率较高。属于数字水印领域。

背景技术  随着互联网应用的普及,越来越多的数字化多媒体内容信息纷纷以各种形式在网络上快速 的交流和传播。如何对数字化多媒体内容进行有效的管理和保护,成为信息安全领域的研究热点。信息隐 藏可以在载体中嵌入难以被感知的秘密信息以保护数字内容的版权或用于保密通信,可以很好的解决上述 问题。信息隐藏不同于传统的数据加密,数据加密隐藏信息的内容,让第三方看不懂;信息隐藏不但隐藏 了信息的内容,而且隐藏了信息的存在性,让第三方看不见。隐写术与数字水印是信息隐藏的两个重要研 究分支,采用的原理都是将一定量的信息嵌入到载体数据中,但由于应用环境和应用场合的不同,对具体 的性能要求不同。

数字水印是通过对载体进行难以被感知的改动,从而嵌入与载体有关的信息,嵌入的信息不一定是秘 密的,也有可能是可见。数字水印的目的是保护数字内容的所有权。音频水印嵌入的信息可以是音频版权 保护信息、作品序列号、艺术家和歌曲名字等,用于音频的版权保护、盗版追踪和拥有者识别等。

(这里参考雷老师的大论文内容再增加一点吧)目前的音频水印算法主要分为时域算法和变换域算法. 在时域上,大部分水印算法不能抵抗一些常见的攻击,如Ko等人提出的回声隐藏算法等[5]。在变换域中, 一般都是将水印信号或音频载体信号进行离散小波变换、离散余弦变化或奇异值分解,然后在变换域中嵌 入水印信号,但这种方法一般都不能实现水印盲提取,不利于实际应用[6‑7]。但目前也有一些半盲水印[8] 和盲水印。2010年,Vivekananda Bhat K等提出一种利用SVD变换和抖动调制量化的音频水印方案[6], 该算法中未提及嵌入水印后的音频信号的SNR值。文献[9‑10]都给出一些音频水印算法,但它们对某些攻 击的鲁棒性不好,如文献[9]对低通滤波和重采样攻击的误码率超过10%。文献[10]对MP3压缩攻击的误码 率达到24%。

发明内容  针对以上问题,本发明提出了一种基于DWT‑DCT‑SVD的音频盲水印算法,该算法具有较 好的透明性和较强的鲁棒性,且算法的效率较高。

本发明包括两个主要算法,水印嵌入算法、水印提取算法。

在水印嵌入算法中,对原始音频进行分段,每段的长度为1600个样点。对每段音频进行一维二级DWT
变换,取出DWT变换后的近似分量cA2,对近似分量cA2进行一维DCT变换,将DCT变换后前1/4系
数取出,转化为10*10的矩阵,并对此矩阵进行SVD变换,得到S矩阵,在S矩阵中嵌入水印信息。因
为S矩阵具有较强的稳定性,将S矩阵的S(1,1)和S(2,2)取出来,利用的奇偶性嵌
入水印信息。

在水印提取算法中,对含水印的音频信息进行一维二级DWT变换,然后将变换后得到的小波近似分 量cA2进行DCT变换,取出DCT变换后的系数前四分之一组成长度为100的向量Yi1,再将向量Yi1转 化为10*10的矩阵jsi,对矩阵jsi进行SVD变换,得到一个10*10的对角阵Sw,然后将每一个对角矩阵 Sw的第一个值Sw(1,1)和第二个值Sw(2,2)取出来进行对比以判断以得到一位水印信息,若Sw(1,1)/ (Sw(2,2)*Δ)接近偶数,则水印信息为0,若w(1,1)/(Sw(2,2)*Δ)接近奇数,则水印信息为1,最后得到 提取的水印信息W,将W变为2维图像矩阵,得到水印图像。

本发明是一个盲水印算法,水印提取时不需要原始音频文件的参与。但嵌入水印时分段的长度大小需 要作为密钥传递给提取方以完成水印信息的提取。

本发明具有易于实现、执行效率高等优点,在实践中具有较高的理论与应用价值。

附图说明下面结合附图和具体实施方式,对本发明做进一步的详细说明。

图1是本发明提出的音频水印嵌入算法流程图。

图2是本发明提出的音频水印提取算法流程图。

图3、4、5是本发明提出的音频水印嵌入算法,分别在选取男女生对话、流行音乐和古典音乐为原始 音频载体时,得到的透明性实验验证结果。

假设原始音频信号为A={a(i),0≤i≤Length}。二值水印图像为 W={w(i,j),0≤i<M,0≤j<M},其中w(i,j)∈{0,1}代表二值水印图像的第i行、第j列像素值。

本发明以32*32的二值图像作为水印信息。在实际使用时,水印信息的大小可以随意改变。

图1表示了本发明提出的音频水印嵌入算法,具体步骤如下:

步骤一:水印图像预处理:选择二值图像作为水印图像,其大小为M1*M。因为载体是一维的音频文 件,为了能将二维的二值图像作为水印信息嵌入载体中,需要对二值图像进行降维处理,把二维图像转化 为一维向量,通过w={w(i)=w(m1,m2),0≤m1≤M1,0≤m2≤M2,i=m1×M2+m2}降维操作,水印w 中的像素w(m1,m2)由向量w中的元素w(i)表示。

步骤二:将原始音频分段,每段的长度为1600样点,对每个分段进行一维二级DWT变换,取出DWT 变换后的近似分量cA2,cA2的长度为400。

步骤三:对近似分量cA2进行DCT变换,取出变换后的系数前四分之一组成长度为100的向量Yi1, 并将这个向量转化为10*10的矩阵jsi

步骤四:对每个10*10的矩阵jsi进行SVD变换,得到一个10*10的对角阵S。

步骤五:将每个对角矩阵S的第一个值S(1,1)取出来,对其进行水印嵌入,嵌入方法为:

当是偶数,若嵌入的水印是1,则
若嵌入的水印是0,则当
是奇数,若嵌入的水印是1,则若嵌入
的水印是0,则

步骤六:对嵌入水印后的Sw矩阵进行SVD反变换,得到矩阵S’。

步骤七:将S’变成一维向量,替换步骤三中得到的矩阵Yi的前四分之一值得到新的Yi’,对Yi’进行一 维IDCT变换,得到含水印的Calw。

步骤八:用含水印的Calw代替步骤二得到近似分量,和步骤二得到的二级细节分量利一级细节分量进 行一维二级逆小波变换,得到嵌入水印后的音频分段。

步骤九:所有分段进行水印嵌入后,得到含水印音频文件。

图2表示了本发明提出的水印提取算法,具体步骤如下:

步骤一:读取嵌入水印后的含水印音频文件,得到含水印音频数据Yw。

步骤二:将含水印音频分段,每段的长度为1600样点,对每个分段进行一维二级DWT变换,得到近 似分量cA2。

步骤三:将cA2进行DCT变换,取出DCT变换后的系数前四分之一组成长度为100的向量Yi1,并将 这个向量转化为10*10的矩阵jsi。

步骤四:对每个10*10的矩阵jsi进行SVD变换,得到一个10*10的对角阵Sw。

步骤五:将每个对角矩阵Sw的第一个值Sw(1,1)和第二个值Sw(2,2)取出来进行比较以得到一位 水印信息,判别公式:若Sw(1,1)/(Sw(2,2)*Δ)接近偶数,则水印信息为0,若Sw(1,1)/(Sw(2,2)*Δ)接近 奇数,则水印信息为1。

步骤六:所有分段进行以上步骤后,得到提取的水印信息W,将W变为2维图像矩阵,得到水印图像。

图3、4、5分别示意实验样本Speech、Classic和Pop的载体音频与未受攻击的嵌入水印后的音频的时 域波形图。从图中可以看出,在选取的3种音频中嵌入水印前后的波形图几乎看不出有多大差别,说明本 发明具有很好的透明性。

本发明试验中对加载水印音频进行以下顽健性测试:(1)无攻击,(2)添加20dB的高斯噪声,(3)以 0.5倍的采样率做非整数倍下采样,(4)以11.025kHZ为截止频率的低通滤波,(5)8bit重新量化,(6)在 64kbit/s的比特率下进行MP3压缩,(7)、在32kbit/s的比特率下进行MP3压缩,(8)在128kbit/s的比特 率下进行MP3压缩,(9)替换。

表1给出了本发明在100%的嵌入率下,三种不同类型的加载水印音频对上述攻击方式的误码率和相关 系数。

表1不同音频类型在音频攻击后的比较表


表2给出了本发明提出的算法和现有算法在加载水印音频对一些常见攻击方式的误码率。是按照三种 音频的平均值来计算。

表2不同算法在音频攻击后的误码率比较表


实验表明本发明提出的基于合DWT、DCT和SVD的音频盲水印方法,具有较好的透明性,且算法的 效率较高,并且对于MP3压缩、重量化、重采样、低通滤波、高斯加噪、裁剪替换等常见音频信号处理 攻击具有很强的鲁棒性。

本文发布于:2024-09-23 03:29:43,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/73843.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议