一种基于声源分离的有源噪声控制方法

1.本发明涉及有源噪声控制领域，提出了一种基于声源分离的有源噪声控制方法。

背景技术：

2.噪声污染是环境污染中一个特别突出的问题。噪声控制方法可以分为无源噪声控制和有源噪声控制(active noise control，anc)。无源噪声控制主要是依靠不同的隔音材料或者吸声结构来隔绝、吸收噪声能量。无源噪声控制的优势主要在于对中、高频的噪声具有很强的降噪效果，但是对低频噪声的控制性能大打折扣。针对低频噪声，人们提出了anc，根据声波的相消性干涉原理，自适应地实现对初级噪声的控制。
3.anc系统中常用的是前馈控制系统，需要在噪声源附近布置参考传感器获取参考信号。当存在多个声源时，参考传声器同时拾取多个噪声信号，包括主噪声信号和其它干扰信号。例如，主噪声信号受到脉冲噪声或语音的干扰，后者并不是初级噪声的主要来源。在传统方法中，并没有对参考信号进行处理，而是直接将其作为系统的输入参与到算法的迭代中，使其降噪量受到一定限制。

技术实现要素：

4.针对现有技术存在的问题，本发明提出一种基于声源分离的有源噪声控制方法，在多声源同时发声的情况下，首先利用时域分离网络对参考信号进行分离，然后将主噪声信号作为参考信号输入到控制系统中，与传统方法相比能过获得更大的降噪量。分离网络可以作为anc系统的前端模块，无需占用系统资源。
5.本发明的技术方案为：
6.一种基于声源分离的有源噪声控制方法，包括以下步骤：
7.步骤1：建立并训练端到端时域声源分离系统；
8.步骤2：利用参考传感器拾取多个噪声源发出的混合参考信号x(n)，
9.步骤3：利用步骤1建立的时域声源分离系统对所述混合参考信号x(n)进行分离，得到来自主噪声源s1(n)的信号x1(n)，作为控制滤波器的输入，获得次级信号y(n)，有
[0010][0011]
式中w(n)为控制滤波器的权系数；
[0012]
步骤4：次级信号驱动次级声源产生抵消信号y'(n)，利用抵消信号y'(n)以及所述多个噪声源的初级声场在误差传感器处的声压叠加后形成误差信号e(n)；
[0013]
步骤5：利用主噪声源s1(n)的信号x1(n)、次级通路传递函数h(n)以及误差信号e(n)对控制滤波器权系数进行迭代：
[0014]
w(n+1)＝w(n)-μr(n)e(n)
[0015]
式中μ为步长参数，r(n)＝x1(n)*h(n)。
[0016]
进一步的，采用基于深度学习的网络构建所述时域声源分离系统；所述时域声源分离系统编码器-分离器-解码器的框架进行搭建；其中编码器通过一维卷积层实现，分离
(n)的信号成分x1(n)，然后将x1(n)代替x(n)进入控制系统参与运算。
[0036]
近年来，基于深度学习的网络在声源分离的任务中表现优良，有些网络甚至具备了与人耳相当的性能。这些网络将分离任务描述为监督学习问题，从任务优化的角度来开发统计模型。因此，本发明中采用基于深度学习的网络构建时域声源分离系统。
[0037]
在anc开始之前，先对分离网络进行训练，首先建立训练数据集，在训练数据集中应该包含多种噪声源；从训练数据集中随机选择两个不同声源种类，并以随机信噪比进行混合获得混合声源；搭建端到端时域声源分离系统，依据编码器-分离器-解码器的框架创建时域分离网络；其中编码器通过一维卷积层实现；分离器用于估计声源的掩蔽矩阵；解码器为一维反卷积层；来自分离器的每个声源的掩蔽矩阵与来自编码器的混合声的二维表达相乘，之后能够通过解码器合成分离声源的时域信号；利用得到的混合声源数据对时域分离网络进行训练，获得端到端时域声源分离系统。网络框架如图2所示。
[0038]
分离网络具有多种评估指标，其主要依据网络估计出来的信号和原有信号之间的差距来衡量网络的性能。网络的输入为混合声的时域信号x，由真实信号t1和t2构成，
[0039]
x＝t1+t2ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)网络的输出为x1和x2，分别表示对两个声源的估计。估计出的信号x可以分解为，
[0040]
x＝t+e
interf
+e
noise
+e
artif
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0041]
其中t表示原信号(允许存在线性增益)。估计出的信号x还包含三类失真：来自其他声源的干扰(e
interf
)、传感器采样带来的通道噪声(e
noise
)和其他原因(如算法)引入的失真(e
artif
)。
[0042]
分离系统最常用的指标为尺度不变的信号干扰比(scale-invariant source-to-distortion ratio，si-sdr)，
[0043][0044]
待训练完成后，利用以下步骤进行基于声源分离的有源噪声控制，在算法中没有设置结束标准，而是通过人为控制：
[0045]
首先，利用参考传感器拾取噪声源发出的混合参考信号x(n)，这里x(n)来自噪声源s1(n)和噪声源s2(n)；
[0046]
其次，利用建立并训练后的时域声源分离系统对所述混合参考信号x(n)进行分离，得到来自主噪声源s1(n)的信号x1(n)，作为控制滤波器的输入，获得次级信号y(n)，有
[0047][0048]
式中w(n)为控制滤波器的权系数；
[0049]
之后，次级信号驱动次级声源产生抵消信号y'(n)，利用抵消信号y'(n)以及噪声源的初级声场在误差传感器处的声压d1(n)和d2(n)叠加后形成误差信号e(n)；
[0050]
在有源噪声控制过程中，利用主噪声源s1(n)的信号x1(n)、次级通路传递函数h(n)以及误差信号e(n)对控制滤波器权系数进行迭代：
[0051]
w(n+1)＝w(n)-μr(n)e(n)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0052]
式中μ为步长参数，r(n)＝x1(n)*h(n)。从而实现更好的降噪效果。
[0053]
下面结合具体实施例描述本发明，所述实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。
[0054]
(1)首先训练卷积时域音频分离网络(convolutional time-domain audio separation network，convtasnet)。训练数据集分别为来自librispeech数据集的语音、来自musan数据集的无人声音乐以及来自bbc音效数据集的环境声。基于上述单声源数据集，我们通过随机选择两个声源片段并将它们以-5db和+5db之间的随机能量比混合来创建混合声片段。为避免混淆，不允许混合来自同一位说话人、同一首音乐和同一个环境声源(例如同一辆车)的片段。随机混合生成了一个大型的重叠声事件数据集，包含6种不同类型的混合声(语音+语音、音乐+音乐、环境声+环境声、语音+音乐、语音+环境声、音乐+环境声)。这里的混合声数据集限定为180,000个片段(150小时)，其中70％用于训练(105小时)，20％用于交叉验证(30小时)，10％用于测试(15小时)。系统采样率设为8000hz。
[0055]
(2)利用上述数据集训练和评估网络，数据集迭代次数为100次。网络基于pytorch的asteroid工具箱实现。使用adam优化器进行训练，初始学习率为0.001。如果验证集的性能在3个连续epoch中没有提高，则学习率减半。训练集及验证集si-sdr随迭代次数的变化如图4所示。
[0056]
(3)仿真中使用的传递函数为在普通房间中实测的传递函数，通路p1(z)和p2(z)的频率响应如图5所示。次级通路频率响应如图6所示。
[0057]
(4)选择交通噪声作为主要噪声源，语音信号作为干扰噪声源。分别利用传统方法和本发明提出的方法对误差传声器处的初级声场进行控制。控制滤波器长度选为2048。通过试错的方式对每种方法选择最优步长参数。传统方法步长参数为2.4621，本发明提出的方法步长参数选为7.4057。为了评估每种方法的降噪性能，定义平均降噪量(average noise reduction,anr)为
[0058][0059]
式中e(n)＝[e(n),e(n-1),...,e(n-n+1)]，d(n)＝[d(n),d(n-1),...,d(n-n+1)]，在仿真中令n＝10000。则anr越小，代表其降噪量越大，降噪效果越好。
[0060]
两种方法的anr如图7所示。由图中可以看出，本发明提出的方法取得比传统方法更好的降噪效果。
[0061]
尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

技术特征：

1.一种基于声源分离的有源噪声控制方法，其特征在于：包括以下步骤：步骤1：建立并训练端到端时域声源分离系统；步骤2：利用参考传感器拾取多个噪声源发出的混合参考信号x(n)，步骤3：利用步骤1建立的时域声源分离系统对所述混合参考信号x(n)进行分离，得到来自主噪声源s1(n)的信号x1(n)，作为控制滤波器的输入，获得次级信号y(n)，有式中w(n)为控制滤波器的权系数；步骤4：次级信号驱动次级声源产生抵消信号y'(n)，利用抵消信号y'(n)以及所述多个噪声源的初级声场在误差传感器处的声压叠加后形成误差信号e(n)；步骤5：利用主噪声源s1(n)的信号x1(n)、次级通路传递函数h(n)以及误差信号e(n)对控制滤波器权系数进行迭代：w(n+1)＝w(n)-μr(n)e(n)式中μ为步长参数，r(n)＝x1(n)*h(n)。2.根据权利要求1所述一种基于声源分离的有源噪声控制方法，其特征在于：采用基于深度学习的网络构建所述时域声源分离系统；所述时域声源分离系统编码器-分离器-解码器的框架进行搭建；其中编码器通过一维卷积层实现，分离器用于估计声源的掩蔽矩阵，解码器为一维反卷积层；来自分离器的每个声源的掩蔽矩阵与来自编码器的混合声的二维表达相乘，之后通过解码器合成分离后各个声源的时域信号。3.根据权利要求2所述一种基于声源分离的有源噪声控制方法，其特征在于：所述时域声源分离系统的训练过程为：首先建立训练数据集，在所述训练数据集中包含多种噪声源；从所述训练数据集中随机选择两个不同声源种类，并以随机信噪比进行混合获得混合声源；利用得到的混合声源数据对时域分离网络进行训练，获得端到端时域声源分离系统。4.根据权利要求3所述一种基于声源分离的有源噪声控制方法，其特征在于：在所述时域声源分离系统训练过程中，采用尺度不变的信号干扰比作为时域声源分离系统的评估指标。

技术总结

本发明提出一种基于声源分离的有源噪声控制方法，在多声源同时发声的情况下，首先利用时域分离网络对参考信号进行分离，然后将主噪声信号作为参考信号输入到控制系统中，与传统方法相比能过获得更大的降噪量。分离网络可以作为ANC系统的前端模块，无需占用系统资源。无需占用系统资源。无需占用系统资源。

技术研发人员：

陈克安王磊

受保护的技术使用者：

西北工业大学

技术研发日：

2022.06.15

技术公布日：

2022/9/30

本文发布于:2024-09-24 10:25:54，感谢您对本站的认可！

本文链接：https://www.17tex.com/tex/2/81635.html

上一篇：一种房建施工隔离线提醒设备

下一篇：热词增强的语音识别方法以及装置、存储介质、电子装置与流程

标签：声源信号时域噪声

留言与评论（共有 0 条评论）