一种基于麦克风阵列的广义旁瓣对消器及后置滤波算法



1.本发明属于信号处理技术领域,涉及一种基于麦克风阵列的广义旁瓣对消器及后置滤波算法。


背景技术:



2.由于各种平稳及非平稳噪声的干扰,语音信号所包含的有效信息会被稀释,因此为了使传递的信息更容易辨别,需要对音频信号进行语音增强处理。语音增强是一种从带噪语音信号中提取目标信号,抑制噪声干扰的技术,在语音信号处理的各个领域都有着广泛的应用。语音增强主要分为单通道语音增强和多通道语音增强:单通道语音增强技术通常对噪声进行谱估计,然后从音频中减去估计的噪声信号来得到期望语音信号,如谱减法等,单通道语音增强很大程度上依赖于噪声信号的平稳性;多通道语音增强技术不仅能利用语音信号的非平稳特性,还可以根据不同信号的空间特征来实现更出的语音增强效果。
3.通常人们的交流会受到环境噪声和混响的干扰,在这种情况下音频信号可以看作期望语音信号、伪平稳噪声信号以及干扰语音信号相互叠加而成,其中伪平稳信号可以利用广义旁瓣对消器有效地滤除,根据波束形成器输出与参考噪声信号的功率比值可以出瞬态信号的有效特征,而干扰语音信号同样有着非平稳的特性,难以与期望语音信号进行区分。因此仅仅依赖广义旁瓣对消器无法获得纯净语音信号,还需借助后置滤波器来判断某一瞬态属于期望信号还是干扰信号,从而减少音频信号中的非平稳噪声成分。
4.中国发明专利申请cn113362846a,公开了一种基于广义旁瓣相消结构的语音增强方法。该发明用线性约束最小方差波束形成器代替广义旁瓣对消器中的固定波束形成器;通过阻塞矩阵得到参考噪声信号,利用维纳滤波器去掉非相干噪声。
5.对比此方法,本发明采用广义旁瓣对消器加后置滤波的方式,由广义旁瓣对消器获得期望信号分量与参考噪声分量,根据功率谱密度计算先验信号缺失概率与后验信号存在概率,通过伪平稳噪声信号功率谱密度的变化率来控制其递归,最后利用最优修正的对数谱幅度增益函数计算纯净信号。
6.2018年,王贤祥在《麦克风阵列广义旁瓣消除及后置滤波算法研究》一文中提出了一种基于麦克风阵列的广义旁瓣及后置滤波的算法,通过广义旁瓣对消器得到期望信号分量与参考噪声分量,计算后验信号存在概率并对其进行平滑处理,从而估计背景伪平稳噪声的功率谱密度。
7.对比此方法,本发明通过广义旁瓣对消器得到其输出信号和参考噪声信号后,计算后验信号存在概率并对其平滑处理,计算噪声功率谱密度的变化率并得到全局似然,从而得到噪声功率谱密度的平滑参数和估计参数,实现对噪声功率谱密度的平滑递归。
8.2021年,杨钦雲在《基于麦克风阵列的语音增强及后置滤波技术研究》一文中提出了一种后置滤波增强算法,通过判断某一方向的语音信号能量是否超过阈值来判断语音信号的存在与否,再利用广义旁瓣对消器输出的期望信号分量与参考噪声信号分量的功率比
来估计伪平稳噪声的功率谱密度。
9.对比此方法,本发明没有固定的语音增强角度,通过期望信号及参考噪声信号的功率谱密度计算瞬态波束参考比,得到后验信号存在概率来确定期望语音,同时设定方向角的失配来保证其主瓣优势;由期望信号的功率谱密度与后验信号存在概率共同决定伪平稳噪声的平滑参数,进而平滑递归伪平稳噪声信号的功率谱密度。


技术实现要素:



10.本发明的目的是通过广义旁瓣对消器获得期望信号分量和参考噪声信号分量后,通过后置滤波进一步抑制噪声干扰。针对广义旁瓣对消器在非相干或扩散噪声场中降噪能力不足的情况,通过后置滤波的方式对噪声进一步抑制,实现平稳噪声和非平稳噪声共同干扰下的语音信号增强。
11.本发明的技术方案:一种基于麦克风阵列的广义旁瓣对消器及后置滤波算法,包括步骤如下:
12.步骤1:从录制缓冲区提取数据,除首段数据外的其余段每次提取一段长度的数据,且长度为窗口长度n的整数倍;对首段数据扩充一个窗口提取;
13.步骤2:通过麦克风阵列采集音频信号z(t),并设x(t)为期望语音信号,ds(t)为伪平稳噪声信号,d
t
(t)为干扰语音信号,i表示传感器的索引,则音频信号表示为:
14.zi(t)=xi(t)+d
is
(t)+d
it
(t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
15.利用hanning窗函数将音频信号z(t)在时间上划分为重叠帧,重叠率为50%,窗长为n;以fs为采样率对音频信号进行离散傅里叶变换处理,得到各频段的中心频率f(k)和频域信号z(n,k):
[0016][0017]
z(n,k)=x(n,k)+ds(n,k)+d
t
(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0018]
其中,k表示频段索引且k∈[1,n],n表示帧索引,
[0019][0020][0021][0022][0023]
其中,m表示传感器的数量,[
·
]
t
表示转置变换;
[0024]
步骤3:广义旁瓣对消器中的上支路是一个固定波束形成器,通过期望信号到达各麦克风的相对时延进行相位补偿,并对各麦克风采集信号的功率谱密度进行求和平均得到固定波束形成的输出信号y
fbf
(n,k)。为了令各传感器采集的信号对齐准确,设θ1表示z(n,k)到达麦克风时相对于坐标原点的角度,θ2表示麦克风对波达方向估计的误差,估计期望语音信号x(n,k)到达麦克风阵列的角度:
[0025][0026]
其中,l为传感器间的距离,c为声音在空气中的传播速率;
[0027]
根据δk建立固定波束形成器的权重向量w(k),并根据w(k)的延迟模型构建一个延迟相减向量b(k);w(k)和b(k)表示为如下形式:
[0028][0029][0030]
其中,k
bf
=(-1)
i-1
,[
·
]h表示共轭转置;
[0031]
音频信号z(n,k)分别经过w(k)和b(k)得到y
fbf
(n,k)和u(n,k),最后经自适应噪声对消器滤波后得到广义旁瓣对消器的输出信号y(n,k):
[0032]
u(n,k)=bh(k)z(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0033]
y(n,k)=y
fbf
(n,k)-h
*
(n,k)u(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)
[0034]
其中,y
fbf
(n,k)=wh(k)z(n,k),h(n,k)为自适应滤波器的权值系数,(
·
)
*
表示复数的共轭;
[0035]
步骤4:在求解h(n,k)的权值系数时,传统的思想相对直观,即不断调整系数,使得输出信号的功率达到最小,从而逼近h(n,k)的最优解。但传统方法需要进行大量的计算和迭代,因此可以令表示伪平稳噪声信号的功率谱密度,通过求解如下无约束优化问题,使伪平稳噪声功率谱密度达到最小:
[0036][0037]
即可得到h(n,k)的维纳-霍夫解:
[0038][0039]
通过直接计算最优解的方式,不仅减少了计算复杂度,还能够使自适应噪声对消器的输出快速收敛,有利于提高降噪效果。由于求解过程需要利用而与噪声的空间相干函数γs(n,k)相关,同时在扩散噪声场中,γs(n,k)可以用sinc函数表示,即:
[0040][0041]
此时,h(n,k)可以用γs(n,k)来表示,即:
[0042][0043]
其中,表示取复数的虚部,表示取复数的实部;
[0044]
步骤5:由于波达方向的估计误差、混响以及强噪声的干扰,此时的y(n,k)既包含了纯净语音分量,又带有未完全消除的噪声分量;同时期望信号x(n,k)也会一定程度上泄露到u(n,k)中,因此需要进行后置滤波来进一步滤除y(n,k)中的噪声分量;后置滤波主要依靠噪声功率谱密度估计来实现噪声分量的去除,而能否准确判断当前音频信号是否包含期望语音决定了噪声估计的准确性,因此在对噪声功率谱密度进行估计之前,需要检测语音信号是否活跃;设b为一个归一化的频率平滑汉宁窗向量,y
mat
(n,k)和u
mat
(n,k)分别为y(n,k)和u(n,k)的频率对齐向量,且长度与b相同,计算y(n,k)和u(n,k)的平滑功率谱密度:
[0045][0046][0047]
其中,αs为时间平滑参数;根据改进的最小控制递归平均法,在语音信号不活跃时估计背景伪平稳噪声的功率谱密度my(n,k)和mu(n,k),并分别计算出y(n,k)和u(n,k)的局部非平稳性:
[0048][0049][0050]
λ0为局部非平稳性阈值,在没有瞬态信号的情况下,信号的局部非平稳性波动大约为1,而在包含瞬态信号时,局部非平稳性将超过λ0;因此在后置滤波过程中需要检测并计算y(n,k)和u(n,k)的瞬态功率,当λu(n,k)超过λ0但λy(n,k)并无太大波动时,可以认为当前音频信号是需要舍弃的干扰信号;而当λy(n,k)超过λ0时,则说明当前音频信号包含期望语音信号,需要对其进行保留与增强;为了进一步判断某一瞬态信号是否为期望语音,定义了一个瞬态波束参考比ω(n,k)来得到局部非平稳性的相对比值;ω(n,k)由下式得出:
[0051][0052]
步骤6:为判断瞬态信号是否存在,设ω
low
和ω
high
为ω(n,k)的阈值,当ω(n,k)小于ω
low
时,可以认为检测的瞬态信号是干扰的,而当ω(n,k)大于ω
high
时,则认为瞬态信号中可能存在期望语音;因此定义一个表示信号存在可能性的函数ψ(n,k)来适应瞬态波束参考比的不确定性,这也有利于提高区分期望信号和干扰信号的准确度;根据局部非平稳性和瞬态波束参考比,由下式计算先验信号存在可能性:
[0053][0054]
在得到所有频段的先验信号存在可能性后,为了避免对期望信号是否存在产生误判,通过计算一个全局似然防止局部偏差带来的干扰;设f(k
l
)到f(kr)是我们感兴趣的频率区间,计算频段k
l
到kr中ψ(n,k)的一个全局似然:
[0055][0056]
步骤7:得到先验信号存在可能性的全局似然后,进一步根据y(n,k)相对于my(n,k)的后验信噪比γs(n,k)计算先验信号缺失概率q(n,k);γs(n,k)由下式得出:
[0057]
γs(n,k)=|y(n,k)|2/my(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(24)设ψ0为的阈值,γ0为γs(n,k)的阈值,计算先验信号缺失概率q(n,k):
[0058][0059]
步骤8:为了准确得到信号的存在概率,并根据当前信号存在概率调整增益函数,从而使包含更多期望语音分量的信号得到更强的增益;设p(n,k)表示后验信号存在概率,并根据p(n,k)来计算最优修正的对数谱幅度增益函数g(n,k);设α为平衡降噪和信号失真的加权因子,为对数谱幅度的增益函数,通过下式估计输入信号z(n,k)相对于伪平稳噪声信号功率谱密度的先验信噪比:
[0060][0061]
同时令λd(n,k)表示伪平稳噪声信号的功率谱密度,计算y(n,k)相对于λd(n,k)的后验信噪比:
[0062]
γ(n,k)=|y(n,k)|2/λd(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(27)
[0063]
根据ξ(n,k)和γ(n,k)得到y(n,k)相对于x(n,k)的信噪强度:
[0064][0065]
并由先验信号存在概率q(n,k)、x(n,k)相对于λd(n,k)的先验信噪比ξ(n,k)和信噪强度v(n,k)计算后验信号存在概率:
[0066][0067]
步骤9:为了提高对信号存在概率计算的准确性,对p(n,k)进行平滑处理;设α
p
为p(n,k)的平滑参数,并通过递归得到平滑的后验信号存在概率:
[0068]
p

(n,k)=α
p
p

(n-1,k)+(1-α
p
)p(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(30)
[0069]
设置噪声功率谱密度的变化率l(n,k),通过l(n,k)来判断背景噪声是否发生突变;设p0为p

(n,k)的阈值,γ1为γ(n,k)阈值,γ
high
和γ
low
分别为γ(n,k)的上下限,计算噪声功率谱密度的变化率:
[0070][0071]
通过下式得到频段k
l
到kr中l(n,k)的一个全局似然,从而避免局部误差导致对噪声变化情况的误判:
[0072][0073]
步骤10:的大小反映了噪声的总体变化情况,因此由对平滑参数进行控制:
[0074]
[0075]
其中,表示α
l
(n)的约束下限,β
l
表示的权重系数;根据α
l
(n)和p

(n,k)计算噪声功率谱密度的估计参数:
[0076]
αd(n,k)=α
l
(n)+[1-α
l
(n)]p

(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(34)
[0077]
αd(n,k)越接近1,越可以认为λd(n,k)的变化不大,且y(n,k)中包含期望语音分量,因此λd(n+1,k)应当与λd(n,k)更接近;αd(n,k)越接近0,则应认为λd(n,k)发生了突变,或者y(n,k)中不含期望语音分量,应将λd(n+1,k)向y(n,k)的功率谱密度迅速靠拢;因此通过下式对λd(n+1,k)进行平滑递归估计:
[0078]
λd(n+1,k)=αd(n,k)λd(n,k)+[1-αd(n,k)]|y(n,k)|2ꢀꢀꢀꢀꢀꢀꢀ
(35)
[0079]
步骤11:根据式(26)和式(28)得到的ξ(n,k)和v(n,k)计算信号存在时的对数谱幅度增益函数:
[0080][0081]
当p

(n,k)接近1时,认为y(n,k)只包含期望语音分量,此时对y(n,k)的增益应当更大,因此设g
min
表示信号缺失时对数谱幅度增益函数的约束下限,根据p

(n,k)和g
min
对进行调整,得到最优修正的对数谱幅度增益函数:
[0082][0083]
最后由g(n,k)和y(n,k)计算出纯净信号:
[0084]
x
pure
(n,k)=g(n,k)y(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(38)。
[0085]
本发明的有益效果在于:利用广义旁瓣对消器获取期望信号分量与参考噪声分量,提高了对信号功率谱密度的估计精度。利用信号的功率谱密度计算局部非平稳性和瞬态波束参考比,得到先验信号缺失概率和后验信号存在概率,具有更高的准确性。通过噪声功率谱密度的变化率计算其平滑参数和估计参数,进而平滑递归噪声功率谱密度,提高了跟踪性能和鲁棒性。
附图说明
[0086]
图1是本发明的流程示意图。
[0087]
图2是本发明的瞬态波束参考比计算流程图。
[0088]
图3(a)是本发明的先验信号缺失概率计算流程图。
[0089]
图3(b)是本发明的后验信号存在概率计算流程图。
[0090]
图4是本发明的纯净信号计算流程图。
具体实施方式
[0091]
下面结合附图和具体实施方式对本发明进行详细说明。
[0092]
结合图1,基于麦克风阵列的广义旁瓣对消器及后置滤波算法,主要包括以下部分:
[0093]
1.瞬态波束参考比计算,
[0094]
步骤1:本发明从录制缓冲区提取数据时,每次提取一段长度的数据,对首段数据
扩容一个窗口提取,对后续段的数据正常提取;
[0095]
步骤2:经过分帧、加窗及短时傅里叶变换后,由广义旁瓣对消器得到期望信号分量y(n,k)和参考噪声分量u(n,k),计算平滑功率谱密度sy(n,k)和su(n,k),并根据改进的最小控制递归平均法估计背景伪平稳噪声的功率谱密度my(n,k)和mu(n,k);
[0096]
步骤3:计算信号的局部非平稳性λy(n,k)和λu(n,k)及瞬态波束参考比ω(n,k)。
[0097]
2.先验信号缺失概率与后验信号存在概率计算,
[0098]
步骤1:计算先验信号存在可能性ψ(n,k),令γs(n,k)表示y(n,k)相对于my(n,k)的后验信噪比,根据ψ(n,k)与γs(n,k)计算先验信号缺失概率q(n,k);
[0099]
步骤2:令λd(n,k)表示广义旁瓣对消器输出端伪平稳噪声信号的功率谱密度,ξ(n,k)表示输入信号相对于λd(n,k)的先验信噪比,γ(n,k)表示y(n,k)相对于λd(n,k)的后验信噪比,计算期望信号相对于输入信号的信噪强度v(n,k),得到后验信号存在概率p(n,k)。
[0100]
3.纯净信号计算,
[0101]
步骤1:对p(n,k)进行平滑处理得到p

(n,k),并利用γ(n,k)和p

(n,k)计算噪声功率谱密度的变化率l(n,k)并得到其全局似然
[0102]
步骤2:计算噪声功率谱密度的平滑参数α
l
(n)和估计参数αd(n),从而对λd(n,k)进行平滑递归;
[0103]
步骤3:根据ξ(n,k)和v(n,k)计算信号存在时的对数谱幅度增益函数g
h1
(n,k),并根据g
h1
(n,k)和p

(n,k)计算最优修正的对数谱幅度增益函数g(n,k);
[0104]
步骤4:由g(n,k)和y(n,k)计算纯净信号x
pure
(n,k)。
[0105]
结合图2,本发明的瞬态波束参考比计算方法,主要包括以下步骤:
[0106]
步骤1:设窗口长度为n,从录制缓冲区提取数据时,每次提取一段长度的数据,并且长度为n的整数倍;此外对首段数据扩容一个窗口的长度提取,对后续段的数据正常提取。
[0107]
步骤2:设x(t)为期望语音信号,ds(t)为伪平稳噪声信号,d
t
(t)为干扰语音信号,i表示传感器的索引,则音频信号可表示为:
[0108]
zi(t)=xi(t)+d
is
(t)+d
it
(t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0109]
以fs为采样率进行分帧、加窗和离散傅里叶变换处理,得到各频段的中心频率f(k)和频域信号z(n,k):
[0110][0111]
z(n,k)=x(n,k)+ds(n,k)+d
t
(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0112]
其中k表示频段索引,n表示帧索引,且
[0113][0114][0115][0116]
[0117]
其中m表示传感器的数量,[
·
]
t
表示矩阵的转置。
[0118]
步骤3:给定源方向的失配θ1和相位估计误差θ2,计算期望信号到达角的不确定度:
[0119][0120]
其中l为传感器间的距离,c为声音在空气中的传播速率,得到固定波束形成器的权重向量w和阻塞向量b:
[0121][0122][0123]
其中k
bf
=(-1)
i-1
,[
·
]h表示矩阵的共轭转置,计算参考噪声信号u(n,k)及输出信号y(n,k):
[0124]
u(n,k)=bh(k)z(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0125]
y(n,k)=wh(k)z(n,k)-h
*
(n,k)u(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)
[0126]
其中h(n,k)为滤波器的权值,(
·
)
*
表示复数的共轭。
[0127]
步骤4:令表示伪平稳噪声信号的功率谱密度,求解如下无约束优化问题,使伪平稳噪声功率谱密度达到最小:
[0128][0129]
得到h(n,k)的维纳-霍夫解:
[0130][0131]
假设伪平稳噪声的声场是均匀的,则与噪声的空间相干函数γs(n,k)相关,在扩散噪声场中,γs(n,k)可通过sinc函数近似表示,即:
[0132][0133]
在这种情况下,h(n,k)可为:
[0134][0135]
其中表示取复数的虚部,表示取复数的实部。
[0136]
步骤5:设b为一个归一化的频率平滑汉宁窗向量,y
mat
(n,k)和u
mat
(n,k)分别为y(n,k)和u(n,k)的频率对齐向量,且长度与b相同;设αs为时间平滑参数,计算y(n,k)和u(n,k)的平滑功率谱密度:
[0137][0138][0139]
根据改进的最小控制递归平均法(improved minima controlled recursive aver-aging,imcra)估计背景伪平稳噪声的功率谱密度my(n,k)和mu(n,k),分别计算出期望信号分量和参考噪声分量的局部非平稳性:
[0140][0141][0142]
计算瞬态波束参考比:
[0143][0144]
结合图3(a)和图3(b),本发明的先验信号缺失概率与后验信号存在概率计算方法,主要包括以下步骤:
[0145]
步骤1:设λ0为判断信号是否存在的局部非平稳性阈值,ω
low
和ω
high
为ω(n,k)的阈值,计算先验信号存在可能性:
[0146][0147]
计算频段f(k
l
)到f(kr)中期望信号先验存在可能性的一个全局似然:
[0148][0149]
步骤2:计算y(n,k)相对于my(n,k)的后验信噪比:
[0150]
γs(n,k)=|y(n,k)|2/my(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(24)
[0151]
当先验信号存在可能性的全局似然较低时,可以得出结论,认为该帧中不存在期望信号,因此设ψ0为的阈值,γ0为γs(n,k)的阈值,计算先验信号缺失概率:
[0152][0153]
步骤3:设α为平衡降噪和信号失真的加权因子,为对数谱幅度增益函数,计算输入信号相对于伪平稳噪声信号的先验信噪比:
[0154][0155]
令λd(n,k)表示伪平稳噪声信号的功率谱密度,计算y(n,k)相对于λd(n,k)的后验信噪比:
[0156]
γ(n,k)=|y(n,k)|2/λd(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(27)
[0157]
根据ξ(n,k)和γ(n,k)得到期望信号相对于输入信号的信噪强度:
[0158][0159]
计算后验信号存在概率:
[0160][0161]
结合图4,本发明的纯净信号计算方法,主要包括以下步骤:
[0162]
步骤1:设α
p
为p(n,k)的平滑参数,通过递归得到平滑的后验信号存在概率:
[0163]
p

(n,k)=α
p
p

(n-1,k)+(1-α
p
)p(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(30)
[0164]
设p0为p

(n,k)的阈值,γ1为γ(n,k)阈值,γ
high
和γ
low
分别为γ(n,k)的上下限,计算噪声功率谱密度的变化率:
[0165][0166]
得到频段f(k
l
)到f(kr)中噪声功率谱密度的变化率的一个全局似然:
[0167][0168]
步骤2:计算噪声功率谱密度的平滑参数:
[0169][0170]
其中表示α
l
(n)的约束下限,β
l
表示的加权因子,根据α
l
(n)和p

(n,k)计算噪声功率谱密度的估计参数:
[0171]
αd(n,k)=α
l
(n)+[1-α
l
(n)]p

(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(34)
[0172]
得到伪平稳噪声信号功率谱密度的平滑递归估计:
[0173]
λd(n+1,k)=αd(n,k)λd(n,k)+[1-αd(n,k)]|y(n,k)|2ꢀꢀꢀꢀꢀꢀꢀ
(35)
[0174]
步骤3:根据ξ(n,k)和v(n,k)计算信号存在时的对数谱幅度增益函数:
[0175][0176]
设g
min
表示信号缺失时对数谱幅度增益函数的约束下限,根据p

(n,k)和g
min
对进行调整,得到最优修正的对数谱幅度增益函数:
[0177][0178]
由g(n,k)和y(n,k)计算出纯净信号:
[0179]
x
pure
(n,k)=g(n,k)y(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(38)。

技术特征:


1.一种基于麦克风阵列的广义旁瓣对消器及后置滤波算法,其特征在于,包括步骤如下:步骤1:从录制缓冲区提取数据,除首段数据外的其余段每次提取一段长度的数据,且长度为窗口长度n的整数倍;对首段数据扩充一个窗口提取;步骤2:通过麦克风阵列采集音频信号z(t),并设x(t)为期望语音信号,d
s
(t)为伪平稳噪声信号,d
t
(t)为干扰语音信号,i表示传感器的索引,则音频信号表示为:z
i
(t)=x
i
(t)+d
is
(t)+d
it
(t)
ꢀꢀꢀꢀꢀꢀꢀ
(1)利用窗函数将音频信号z(t)在时间上划分为重叠帧,窗长为n;以f
s
为采样率对音频信号进行离散傅里叶变换处理,得到各频段的中心频率f(k)和频域信号z(n,k):z(n,k)=x(n,k)+d
s
(n,k)+d
t
(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中,k表示频段索引且k∈[1,n],n表示帧索引;段索引且k∈[1,n],n表示帧索引;段索引且k∈[1,n],n表示帧索引;段索引且k∈[1,n],n表示帧索引;其中,m表示传感器的数量,[
·
]
t
表示转置变换;步骤3:广义旁瓣对消器中的上支路是一个固定波束形成器,通过期望语音信号到达各麦克风的相对时延进行相位补偿,并对各麦克风采集信号的功率谱密度进行求和平均得到固定波束形成的输出信号y
fbf
(n,k);设θ1表示z(n,k)到达麦克风时相对于坐标原点的角度,θ2表示麦克风对波达方向估计的误差,估计期望语音信号x(n,k)到达麦克风阵列的角度:其中,l为传感器间的距离,c为声音在空气中的传播速率;根据δ
k
建立固定波束形成器的权重向量w(k),并根据w(k)的延迟模型构建一个延迟相减向量b(k);w(k)和b(k)表示为如下形式:减向量b(k);w(k)和b(k)表示为如下形式:其中,k
bf
=(-1)
i-1
,[
·
]
h
表示共轭转置;音频信号z(n,k)分别经过w(k)和b(k)得到y
fbf
(n,k)和u(n,k),经自适应噪声对消器滤波后得到广义旁瓣对消器的输出信号y(n,k):u(n,k)=b
h
(k)z(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(11)y(n,k)=y
fbf
(n,k)-h
*
(n,k)u(n,k)
ꢀꢀꢀ
(12)其中,y
fbf
(n,k)=w
h
(k)z(n,k),h(n,k)为自适应滤波器的权值系数,(
·
)
*
表示复数的
共轭;步骤4:令表示伪平稳噪声信号的功率谱密度,通过求解如下无约束优化问题,使伪平稳噪声功率谱密度达到最小:得到h(n,k)的维纳-霍夫解:霍夫解:与噪声的空间相干函数γ
s
(n,k)相关,在扩散噪声场中,γ
s
(n,k)用sinc函数表示γ
s
(n,k),即:用γ
s
(n,k)来表示h(n,k),即:其中,表示取复数的虚部,表示取复数的实部;步骤5:由于波达方向的估计误差、混响以及强噪声的干扰,y(n,k)既包含了纯净语音分量,又带有未完全消除的噪声分量;期望信号x(n,k)部分泄露到u(n,k)中,采用后置滤波来进一步滤除y(n,k)中的噪声分量;后置滤波中,估计噪声功率谱密度之前,检测语音信号是否活跃;设b为一个归一化的频率平滑汉宁窗向量,y
mat
(n,k)和u
mat
(n,k)分别为y(n,k)和u(n,k)的频率对齐向量,且长度与b相同,计算y(n,k)和u(n,k)的平滑功率谱密度:滑功率谱密度:其中,α
s
为时间平滑参数;在语音信号不活跃时,根据改进的最小控制递归平均法,估计背景伪平稳噪声的功率谱密度my(n,k)和mu(n,k),并分别计算出y(n,k)和u(n,k)的局部非平稳性:谱密度my(n,k)和mu(n,k),并分别计算出y(n,k)和u(n,k)的局部非平稳性:λ0为局部非平稳性阈值;包含瞬态信号时,局部非平稳性超过λ0;检测并计算y(n,k)和u(n,k)的瞬态功率;当λ
u
(n,k)超过λ0但λ
y
(n,k)无波动时,当前音频信号为舍弃的干扰信号;当λ
y
(n,k)超过λ0时,当前音频信号包含期望语音信号,对其进行保留与增强;为了进一步判断某一瞬态信号是否为期望语音,定义一个瞬态波束参考比ω(n,k)得到局部非平稳性的相对比值;ω(n,k)由下式得出:
步骤6:为判断瞬态信号是否存在,设ω
low
和ω
high
为ω(n,k)的阈值,当ω(n,k)小于ω
low
时,认为检测的瞬态信号是干扰的,而当ω(n,k)大于ω
high
时,则认为瞬态信号中有存在期望语音可能性;定义一个表示信号存在可能性的函数ψ(n,k)来适应瞬态波束参考比的不确定性,根据局部非平稳性和瞬态波束参考比,计算先验信号存在可能性:得到所有频段的先验信号存在可能性后,计算一个全局似然防止局部偏差带来的干扰;设f(k
l
)到f(k
r
)是所需频率区间,计算频段k
l
到k
r
中ψ(n,k)的一个全局似然:步骤7:得到先验信号存在可能性的全局似然后,进一步根据y(n,k)相对于my(n,k)的后验信噪比γ
s
(n,k)计算先验信号缺失概率q(n,k);γ
s
(n,k)由下式得出:γ
s
(n,k)=|y(n,k)|2/my(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(24)设ψ0为的阈值,γ0为γ
s
(n,k)的阈值,计算先验信号缺失概率q(n,k):步骤8:为了准确得到信号的存在概率,并根据当前信号存在概率调整增益函数,从而使包含更多期望语音分量的信号得到强增益;设p(n,k)表示后验信号存在概率,并根据p(n,k)来计算最优修正的对数谱幅度增益函数g(n,k);设α为平衡降噪和信号失真的加权因子,为对数谱幅度的增益函数,通过下式估计输入信号z(n,k)相对于伪平稳噪声信号功率谱密度的先验信噪比:同时令λ
d
(n,k)表示伪平稳噪声信号的功率谱密度,计算y(n,k)相对于λ
d
(n,k)的后验信噪比:γ(n,k)=|y(n,k)|2/λ
d
(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(27)根据ξ(n,k)和γ(n,k)得到y(n,k)相对于x(n,k)的信噪强度:并由先验信号存在概率q(n,k)、x(n,k)相对于λ
d
(n,k)的先验信噪比ξ(n,k)和信噪强度v(n,k)计算后验信号存在概率:步骤9:对p(n,k)进行平滑处理以提高信号存在概率计算的准确性;设α
p
为p(n,k)的平滑参数,并通过递归得到平滑的后验信号存在概率:
p

(n,k)=α
p
p

(n-1,k)+(1-α
p
)p(n,k)
ꢀꢀꢀꢀ
(30)设置噪声功率谱密度的变化率l(n,k),通过l(n,k)来判断背景噪声是否发生突变;设p0为p

(n,k)的阈值,γ1为γ(n,k)阈值,γ
high
和γ
low
分别为γ(n,k)的上下限,计算噪声功率谱密度的变化率:通过下式得到频段k
l
到k
r
中l(n,k)的一个全局似然,避免局部误差导致对噪声变化情况的误判:步骤10:的大小反映了噪声的总体变化情况,因此由对平滑参数进行控制:其中,表示α
l
(n)的约束下限,β
l
表示的权重系数;根据α
l
(n)和p

(n,k)计算噪声功率谱密度的估计参数:α
d
(n,k)=α
l
(n)+[1-α
l
(n)]p

(n,k)
ꢀꢀꢀꢀꢀ
(34)λ
d
(n+1,k)=α
d
(n,k)λ
d
(n,k)+[1-α
d
(n,k)]|y(n,k)|2ꢀꢀ
(35)步骤11:根据式(26)和式(28)得到的ξ(n,k)和v(n,k)计算信号存在时的对数谱幅度增益函数:根据p

(n,k)和g
min
对g
h1
(n,k)进行调整,得到最优修正的对数谱幅度增益函数:最后由g(n,k)和y(n,k)计算出纯净信号:x
pure
(n,k)=g(n,k)y(n,k)
ꢀꢀꢀꢀꢀꢀꢀ
(38)。2.根据权利要求1所述的基于麦克风阵列的广义旁瓣对消器及后置滤波算法,其特征在于,所述步骤2中重叠帧的重叠率为50%。

技术总结


本发明属于信号处理技术领域,提出一种基于麦克风阵列的广义旁瓣对消器及后置滤波算法。利用麦克风阵列获取音频数据并进行分帧、加窗及短时傅里叶变换,由广义旁瓣对消器得到期望信号分量和参考噪声分量;根据改进的最小控制递归平均法计算背景伪平稳噪声的功率谱密度,得到信号的局部非平稳性及瞬态波束参考比;根据期望信号相对于背景伪平稳噪声的后验信噪比计算先验信号缺失概率;根据先验信号缺失概率和期望信号相对于输入信号的强度得到后验信号存在概率;计算噪声功率谱密度的变化率并得到其全局似然,对噪声功率谱密度进行平滑递归;计算信号存在时的对数谱幅度增益函数并进行最优修正,从而计算纯净信号。从而计算纯净信号。从而计算纯净信号。


技术研发人员:

刘全利 栗世钊 王伟

受保护的技术使用者:

大连理工大学

技术研发日:

2022.03.15

技术公布日:

2022/6/30

本文发布于:2024-09-20 16:37:49,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/7038.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:信号   噪声   功率   密度
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议