骨导气导结合的语音增强算法

骨导气导结合的语音增强算法
满娟;吴鸣;杨军
【摘 要】通过对骨导气导信号的对比和研究,提出了一种骨导气导结合的语音增强算法.它充分利用了骨导信号屏蔽环境噪声的高信噪比特性,将骨导信息以概率模式引入到改进后的维纳滤波算法中,并针对高噪声环境下语音信息被噪声严重破坏的情况,将骨导信号通过能量对比得到的权系数修正替换到原气导信号,实现了较好的语音增强效果.
【期刊名称】《电声技术》
【年(卷),期】2011(035)006
【总页数】5页(P42-46)
【关键词】骨导;气导;语音增强;维纳滤波
【作 者】满娟;吴鸣;杨军
河南省化学工业学校
【作者单位】中国科学院,声学研究所,噪声与振动重点实验室,北京,100190;中国科学院,声学研究所,噪声与振动重点实验室,北京,100190;中国科学院,声学研究所,噪声与振动重点实验室,北京,100190
【正文语种】中 文
【中图分类】TN912.35
1 引言
环境噪声的存在会对语音通信造成诸多困扰和不便,语音增强一直是通信技术中的研究热点之一。传统的语音增强技术基于人们普遍熟悉的气导信号,运用各种方法寻求更好的噪声消除效果,例如谱减法[1]、维纳滤波法[2-3]及各种多通道传声器语音增强算法[4],在取得很大发展的同时,也受到了一定的限制。话务系统
维纳滤波算法是语音增强领域的经典算法,其主要原理为利用平稳随机过程的相关特性和频谱特性对混有噪声的信号进行滤波,通过最小均方误差准则实现语音增强[2]。在此基础上出现了很多改进算法,Israel Cohen等人引入了概率模型对增益函数G(k,l)进行修正(Op
timally-Modified Log-Spectral Amplitude,OM-LSA),通过计算语音存在的概率调整相应的G(k,l),实现对语音点和非语音点不同的噪声消除增益[5-6]。传统的单通道语音增强算法对噪声的估计都基于含噪信号本身,在信噪比很低的情况下,噪声的估计和判别会受到一定的影响,有时甚至无法获得理想的效果。搜狐数码
近年来,利用骨导传播声音的方式被人们所关注,并因其对环境噪声出众的屏蔽性,广泛应用于医学、军事、通信等领域,为语音增强技术开辟了新的思路和广阔的空间[7-8]。对骨导信号的研究发现,由于骨导信号直接通过与说话者的接触拾取振动并依靠固体传播,因而可以很好地屏蔽掉高环境噪声而得到较纯净的语音信号。但是,相对于气导信号,骨导信号表现出低频成分厚重、高频衰落严重的特性,这也使得骨导信号理解度较低,无法直接应用于语音通信[8]。针对这些特点,可以从始终具有高信噪比的骨导信号中得到较准确的噪声判别信息,甚至直接利用其纯净的低频语音部分,与气导信号相结合,实现语音增强的目的。
笔者在维纳滤波语音增强算法基础上,将骨导信息以概率判定模式引入到噪声谱估计中,并针对高噪声环境下语音信息被噪声严重干扰和破坏的情况,以骨导信号的功率谱为主体重现低频信息,与传统维纳滤波算法相比,具有更好的语音增强效果。
2 算法的基本原理
由于骨导信号能够不受环境噪声的影响,始终保持较高的信噪比,因此可以利用骨导信号每一频率点的能量进行语音点和非语音点的判定,将该点存在语音的概率引入到对噪声谱的估计和噪声消除增益函数中去。对于高噪声环境下,骨导信号包含了很纯净的低频信息,可以直接利用这部分信息,作为语音增强信号的低频部分,高频部分则依然采用骨导概率模型的语音增强算法处理。
整个算法的基本原理流程如图1所示。
图1 骨导气导结合的语音增强算法原理框图
首先对原始气导信号进行初步的信噪比判定,当其大于阈值SNRthre时,认为信噪比适中,可以直接采用骨导概率模型算法进行语音增强,否则将采用骨导低频替代算法处理低频部分。在骨导概率模型算法中,根据骨导信号的频谱能量进行每一频率点的语音存在概率判定,由于骨导信号和气导信号的同时性,该概率必然与气导信号各频率点存在语音的概率一致。将此概率引入到气导信号的频谱中,将一般维纳滤波算法中的噪声估计和增益
函数计算分为语音点和非语音点,每一点数据的计算都根据该点的语音存在概率进行加权处理(具体公式参见第3节),以得到更准确的语音增强结果。当原始信号信噪比小于阈值SNRthre时,认为信噪比过低,应采用骨导低频替代算法进行语音增强。将输入语音按频率划分为高频段和低频段,由于骨导信号主要包含清晰的低频信息,高频部分缺失严重,因此高频段仍按骨导概率模型算法处理。对低频段信息分别计算骨导和气导的平均能量谱并求出两者的对应权系数,将骨导信号的频谱根据此权系数进行能量修正,使其映射到气导信号上替代原信号并能保持与气导高频段信号的基本匹配(具体公式参见第4节),完成低频段信号的处理。将其与骨导概率模型算法处理后的高频段信息组合起来,成为最终的语音增强结果输出。
3 骨导概率模型的语音增强算法
3.1 维纳滤波语音增强算法及其概率模型算法
维纳滤波算法是语音增强领域的经典算法,利用平稳随机过程的相关特性和频谱特性对混有噪声的信号进行滤波,通过最小均方误差准则实现语音增强[2]。
设原信号为x(n),增强后语音信号为y(n),则有
式中,k为频率点;l表示帧数;X(k,l)和Y(k,l)表示原始信号和增强后信号的频谱。
语音增强的增益函数G(k,l)表示为
先验信噪比为
后验信噪比为
式中,α为平滑系数;λd(k,l)为估计噪声谱。
egd在此基础上,Israel Cohen等人提出了一种引入概率模型对增益函数G(k,l)进行修正的语音增强算法(OM-LSA)[5]。通过对信号的频谱分析计算每一频率点语音存在的概率,实现更好的语音增强效果。
该算法对传统维纳滤波法从两个方面进行了改进。一是根据语音存在的概率实现噪声谱的估计和更新
式中,αd为平滑系数;p1(k,l)表示噪声估计时当前点存在语音的概率,可根据当前频率点平滑能量和分段最低能量对比估计[5]。
另一点改进在于根据语音存在的概率对增益函数G(k,l)进行调整,使其对应于语音点和非语音点有不同的增益函数GH1(k,l)和Gmin
式中,Gmin表示语音不存在时的增益函数,一般被设定为一个阈值常数。p2(k,l)表示语音估计时当前点存在语音的概率,可根据先验信噪比估计[6]。
互联网情报3.2 骨导概率模型的语音增强算法
引入概率模型后,算法的核心为对当前频率点上语音存在概率的估计。对该概率值的估计方式有很多种,对于单通道气导信号,在较低信噪比情况下实现估计要运用大量经验参数和复杂的数学计算。由于得到的骨导信号是极其纯净的,基本屏蔽外界噪声,信噪比很高,对语音存在概率的估计就可以在骨导频谱上进行,复杂运算不再必要,估计过程更加简洁准确。由这种高信噪比的骨导信号可以认为获得了较精确的语音存在概率p(k,l),并将其替代式(5)和式(6)中的p1(k,l)和p2(k,l)。
同时产生的两路信号,x1(n)为气导信号,x2(n)为骨导信号。对两路信号分别进行傅里叶变换,相应频谱为X1(k,l)和X2(k,l)。
利用骨导信号的频谱对第l帧第k点语音存在的概率p(k,l)进行判别。设定门限值Xthre和判别函数I(k,l)。当该点的频谱能量大于门限值时,认为该点存在语音,I(k,l)为1;当该点的频谱能量小于门限值时,认为该点不存在语音,I(k,l)为0。
对概率p(k,l)进行更新
对噪声谱的估计依据概率p(k,l)进行更新
式中,αp和αd是更新平滑系数,0<αp,αd<1。
总的增益函数为
4 高噪声环境下的骨导低频替代语音增强算法
在信噪比很低的情况下,噪声对语音信号产生了大量干扰和破坏,语音段的噪声难以完全消除干净。而得到的骨导信号则是基本忽略环境噪声、具有极高信噪比的纯净信号(如图2所示),因此,将骨导信号通过一定变换替代高噪声环境下的气导信号,从而实现语音增强的目的。由于骨导信号主要为低频成分,高频缺失严重,因此骨导信号对气导信号的替代主要在低频部分进行,高频段的降噪仍然采用第3节讨论的骨导概率模型语音增强算法。
如图2所示,同一噪声环境下,气导信号已经完全被噪声淹没,而骨导信号几乎不受噪声影响,语音段与非语音段有清晰的分界。
同时产生的两路信号,x1(n)为气导信号,x2(n)为骨导信号。对两路信号分别进行傅里叶变换,相应频谱为X1(k,l)和X2(k,l)。
对骨导频谱X2(k,l)计算每1/3倍频程内所有频率点能量的平均值
式中,m表示第m 个1/3倍频程;j表示该频段内的所有频率点。
从气导信号的功率谱X1(k,l)中减去当前估计的噪声谱λd(k,l),作为对纯净气导语音信号能量的粗略估计:
对功率谱同样计算每1/3倍频程内所有频率点功率的平均值
设定判定阈值Fthre,计算频率判定函数
当F(m,l)>Fthre时,认为当前频率段内骨导信号占优势地位,可以用来替代气导信号。

本文发布于:2024-09-24 09:21:51,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/477329.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:语音   信号   增强   骨导   噪声   算法   气导
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议