稀疏表示建模的字典设计

稀疏表示建模的字典设计
摘要:70 YEARS OF CHINA
数据的稀疏和冗余表示建模可以将信号描述为预先规定的字典中的少数原子的线性组合。其中,字典的选取对于信号的建模是至关重要的。通常可采用两种方法选取一个合适的字典:i)基于数据的数学模型建立稀疏字典,ii)选择在训练集上有最佳表现的学习字典。在此论文中,我们将描述这两种范例的演变。作为第一种方法的例证,我们将涉及小波、小波包、轮廓波以及曲线波等分析方法。所有方法都致力于为信号与图像设计能建立有效字典1-D和2-D的数学模型。字典学习采用了另一种路线,将字典与一系列需表示的示例相关联。
1.引言
自然信号的数字化采样过程将它表示为一系列空间或时间中的脉冲函数的和。这种表示虽然在显示或重放时提供了方便,却不利于我们进行分析。
信号处理技术通常需要更有意义的表示方法,以抓住需识别信号的有用特征—用于识别时,表示方法应该突出被处理信号的特征;用于降噪时,表示方法应该有效地分离信号和噪声;用于压缩时,表示方法应该只用很少的系数来捕捉大部分的信号。有趣的是,在很多案例中这些看似不同的目标达到了一致,都以简化作为核心要求。
信号的表示牵涉到字典的选取。字典是一组用于分解信号的基本信号或原子。每个信号都可以被独一无二地表示为字典原子的线性组合。在最简单的实例中,字典是正交的,且表示系数可以用信号和原子的内积来计算;在不正交的时,系数是信号和字典的逆的内积,这种字典也被表述为双正交基字典。
许多年来,正交基与双正交基字典由于它们在数学上的简易性而占有主导地位。然而,这些字典的弱点,也即它们有限的表达能力,最终覆盖了其简易性的优势。这促进了更新的过完备字典的发展。过完备字典的原子多于信号的维度,因此能表示更宽范围的信号现象。
为了减小失去正交基变换提供的优良性能带来的损失,过完备字典的发展是谨慎的。很多字典形成了紧框架,确保了将信号表示为原子的线性组合的表示过程仍能被确定为信号和字典的内积。另一种方法称为最优基算法。
它使用一个特定的字典结构,使字典可以成为这样的原子集合--从中可以高效地选取正交子字典。
有关通用过完备字典的研究主要开始于过去的十年中,且仍在紧张地进行中。这样的字典在信号的表示定义中引进了一种有趣的不确定性。我们设字典,其中的列构成了字典的原子,且。用字典表示一个的信号有两种途径,一种是分析途径,信号用它自身与原子的乘积来表示,
,                            (1)
另一种是综合途径,信号被表示为原子的线性组合,
.                            (2) 这两种定义在完备情况时是完全一致的,这时分析字典和综合字典是双正交
的。然而在通常情况下,这两种字典是显著不同的。
分析字典方法提出了另一个有趣的问题:当D过完备时,满足(2)的表示的族实际上是无限大的,它的自由度与D的零空间的维数相同。这允许我们参考价值函数,来寻信息量最大的信号表示方法:
满足  .                  (3)
实用的的选取提高了表示的稀疏性,意味着我们希望选取的系数能快速衰减。问题(3)常被称为稀疏编码。我们可以通过在鲁棒补偿函数中选择,我们将这种函数宽松地定义为对大系数宽容而对小的非零系数极其不利的函数。相关的例子有Huber函数以及各种成本函数,其中0
这三种问题,尤其是(3)问题,在过去的几年中都被广泛地研究。这也反过来促进了新的使用通用过完备变换的信号处理算法的发展。然而,在从理论到实践的过程中,要面对为给定任务选择合适字典的挑战。早前的工作利用了传统的字典,如傅里叶字典和小波字典。它们用于处理1维信号简单实用。然而,这些字典不足以表示更复杂的自然高维信号数据。所以人们开始寻新的改进字典。
在不断上升的需求下,各种字典被研究出来。这些字典从两种来源中产生。一种是数据的数学模型,另一种是一组数据的实现。第一种字典以分析公式和快速的隐式实现为其特征。第二种字典实现了增强的灵活性以及适应特定信号数据的能力。最近,对于居于两种字典之间的字典的研究逐渐兴起。
这种新的字典集合了前两种字典的优点。这种结构刚刚开始出现,相关的研究还在进行中。
在这篇论文中,我们将介绍指导现代字典设计的基本概念。在第二部分中,我们将以历史的观点,追溯字典设计方法学从19世纪60年代到19世纪90年代的演变,主要介绍概念上的进展。在第三部分和第四部分我们会综述分析字典与训练字典的先进技术。我们会在第五部分作总结并得出结论。
2.变换设计的历史
A.信号变换:线性时代
能源与可持续发展信号变换随着信号处理的实施而出现。在19世纪60年代,早期信号处理的研究者们重点关注了线性时不变运算符,它们是操作模拟与数字信号的简易且直观的工具。在这种环境下,傅里叶变换自然地作为对角线化这些运算符的基础而出现了,并立即成为了分析和设计这些运算符的主要工具。随着1965年Cooley和Tukey将快速傅里叶变换引入,这种变换获得极大的推广。
傅里叶基在全局频率组成方面描述一个信号。它将信号描述为正交波形的结合。
信号通过投影到K最低频率的原子上的方法来近似到这个基上。这种方法具有很强的平滑和降噪效果。因此傅里叶基能高效地描述一致平滑信号。
然而,定位能力的不足使它表示断点时较困难,在所有频率上产生大数值的系数。因此傅里叶变换通常产生在实际应用中过于平滑的结果。
对于有限信号,傅里叶变换隐式地信号的周期延拓,这在信号的边界处导致了不连续性。离散余弦变换(DCT)是假定信号反对称延拓的结果,这会导致连续的边界,因此产生一个更有效的近似。DCT由于有产生非复杂系数这
个额外的优点,在实际应用中通常是首选。
开放式数控系统在傅里叶基上的信号近似很快被认为是线性近似的特定实例:假设在上有一个基,信号通过投影到一个确定的子集,即的基元素上进行线性近似。
,                    (4)
其中通常是双正交基(在标准正交的情况下)。这个过程是
一个未完成的的线性变换。且在正确选择了基的情况下,可以实现压缩,即仅用很少系数捕捉信号的有效部分的能力。事实上,压缩的概念将被稀疏代替,虽然这两者是密切相关的。
压缩优化是更有效的表示方法持续发展的主要推动力。在19世纪70年代和80年代,一个新的极具吸引力的压缩资源被发现:数据本身。关注集中于在前半个世纪被发展出来的一组统计工具。它们被称为Karhunen-Lo ève变换(KLT),或主分量分析(PCA)。KLT是一种线性变换,它可以适用于表示服从已知的确定分布的信号。适用过程适合低维的子空间中,最小化逼近误差的数据。具体地,给定数据协方差矩阵Σ(已知的或经验上的),KLT 原子是Σ的本征值分解的前K个特征向量,
从统计学的观点来看,这个过程把数据当作服从低维高斯分布来建模,因此对于高斯数据最有效。
与傅里叶变换相比,KLT在表示效率上更优。然而,这个优势是用非结构性和明显更复杂的转换换来的。我们将会看到,这种在效率与自适应性之间的折衷在现代字典设计方法学中仍扮演着重要的角。
B.非线性变革与现代字典设计元素
19世纪80年代,统计学的研究领域出现的新的有力方法,即稳健统计。
稳健统计提倡将稀疏作为大范围的复原与分析任务的关键。这种理念来源于经典物理学,发展于近年的信息论,在指导现象描述上提升了简易性与简明性。在这种理念的影响下,80年代与90年代以搜寻
更稀疏的表示和更高效的变换为特征。
增强稀疏性需要偏离线性模式,朝更灵活的非线性规划发展。在非线性的实例中,每个信号都可以使用同一字典中一组不同的原子,以此实现最佳近似。因此,近似过程变为
其中是分别适用于每个信号的索引集。
非线性观点为设计更新,更有效的变换铺平了道路。在这个过程中,许多指导现代字典设计的基本概念形成了。我们将沿着历史的时间线,回溯许多最重要的现代字典设计概念的出现。大部分概念是在20世纪的最后20年间形成的。
张晞定位:为了实现稀疏性,变换需要更好的定位。受到集中支撑的原子能基于本地信号的特征提供更灵活的表示,并限制不规则的效应。观察发现这种效应是大系数的主要来源。本着这种精神,一种首先被采用的结构是短时傅里叶变换(STFT),它作为傅里叶变换的自然延伸出现。在STFT中,傅里叶变换被局部(可能重叠)地应用于信号的某些部分,从而展示出信号的时
间-频率(或空间-频率)描述。JPEG图像压缩算法就是STFT的一个例子。
在19世纪80年代与90年代,STFT被广泛地研究与推广,被更多地称作Gabor变换,为表示对在1946年最先建议时间-频率分解Dennis Gabor 的敬意。Gabor的工作在19世纪80年代被Bastiaans和Janssen各自独立地重新发现,他们当时在研究扩展的基本性质。
一种1维的Gabor字典由一组被加窗的波形构成。
其中是一个定位在0处的低通窗口函数,且α和β控制变换的时间和频率分解。这种变换的很多数学基础都由Daubechies,Grossman和Meyer在19世纪80年代提出。他们从框架理论的角度研究该变换。Feichtinger和Grochenig也是Gabor变换数学基础的建立者,他们提出了广义的理论观点。离散形式变换的研究及其数值实现紧接着在19世纪90年代早期开始进行。Wexler,Raz, Qian和Chen对该研究做出了重要贡献。
在更高的维度下,更复杂的Gabor结构被研究出来。这些结构通过改变正弦波的朝向增加了方向性。这种结构在Daugman的工作中得到了大力支持。他在视觉皮质的简单细胞接受域中发现了方向性的类Gabor模式。这些结果在Daugman,Porat和Zeevi的工作的引导下促进了图像处理任务中变换的调度。现在,Gabor变换的实际应用主要在于分析和探测方面,表现为一些方向滤波器的集合。
多分辨率:19世纪80年代最重大的概念上的进展是多尺度分析的出现。人们注意到自然信号,尤其是图像信号,在各种不同规模下均呈现出有意义的结构,并且可以通过多分辨率重建被极有效地分析和描述。一种最简单与最著名的多尺度结构是在1984年由Burt和Adelson提出的拉普拉斯金字塔。拉普拉斯金字塔将一幅图像由一系列不同的图像表示,其中每一幅都有不同的大小和大致不同的频带。
然而,在19世纪80年代的后半期,信号处理领域因为一种新的有力工具而格外兴奋。这种工具叫做小波分析。1984年,在一份具有开创性的工作中,Grossman和Morlet提出了在一个单一基本函数的基础上进行一系列翻译和扩张,并在这样形成的序列的基础上进行信号扩张,具有如下形式:
这个简单的想法使信号处理与谐波分析领域着迷。在Meyer, Daubechies, Mallat及其他人的一系列极有影响力的工作下,广泛的小波理论成型了。该理论在连续与离散域上均被阐述,都有完整的数学框架。1985年Meyer 的工作带来了重大突破。他发现不像Gabor变换(且与普遍的观念相反),小波变换可以在被设计为正交的的情况下保持稳定性。小波在最初的成功都可以大部分可归结于这一极具吸引力的特质。
让信号处理领域尤其感兴趣的是Mallat与他的同事们的工作。他们确立小波分解为多分辨率扩展,并
五洲国际码头
提出了计算它的有效算法。在Mallat的描述中,一个多尺度的小波基底根据一对局部化函数,即尺度函数和母小波建立。尺度函数是一个低频信号,且伴随着它的翻译,贯穿信号的粗略近似过程。母小波是一个高频信号,伴随它的各种尺度和翻译贯穿信号的细节。在正交的情况下,在各个尺度上的正交基底函数被精确地采样,精细地贯穿了
精细的层级带来的新的细节。
在信号是有有限间断点的分段光滑1维信号时,小波基底中的非线性近似被证明是最优的。这在当时是惊人的发现,人们了解到这不需要提前检测不连续点即完成。不幸地是,小波变换在更高的维度失去了其最优性。高维变换只是一维变换的简单可分离延伸,其原子在不同大小的矩形域上被支撑。这种可分离性使变换简单实用。然而,作为结果的字典只对有奇异点的信号有效,而大部分自然信号都表现出拉长的边缘奇异性。基于小波变换的JPEG2000图像压缩标准确实在边缘处有着振铃(平滑)的人为特性。
自适应性:回到19世纪90年代,进一步加强稀疏性与描述愈发复杂现象的需求,使正交基底近似的极限逐渐显现。这种近似的弱点主要与少且固定的字典中的原子数目相关联。这是为了满足正交性,正交性又是最优表示建立的基础。因此获得更强稀疏性的一种选择是让变换原子自主地适应信号内容。
这些结构中最先被提出的一种是小波包变换,由Coifman, Meyer和Wickerhauser在1992年提出。这种
变换实在小波变换成功的基础上发明的。增强了变换的自适应性,使其对于特定信号性质能有精确的调谐。Coifman 及其他人的主要发现是小波变换强制执行一个特定的时间-频率结构,其中高频原子有很少的支撑而低频原子有大量的支撑。这种选择的确与现实中自然界的信号有很深的联系。然而,对于特定信号,更好的分区是可行的。小波包字典基本上统一了所有的二值时频原子。这些原子可以从一对特定的尺度函数与母小波中得到,所以不同频率的原子可以进入时间支持的阵列。在这个大集合外,小波包变换能为给出的任何信号有效地选取一个最优的正交子字典,标准小波基只是指数数值的选项中的一种。这个过程因此被作者们命名为最优基搜寻。国外农业网站

本文发布于:2024-09-22 07:40:05,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/494574.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:字典   信号   变换   表示   原子   正交   方法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议