基于分布式麦克风阵列的声源定位算法

基于分布式麦克风阵列的声源定位算法
蔡卫平;黄印君;陆泽橼
【摘 要】为了提高相位变换加权的可控响应功率SRP-PHAT(Steered Response Power-Phase Transform)声源定位算法的性能,提出一种基于分布式麦克风阵列的改进算法。根据分布式麦克风阵列的特点,使用麦克风对接收信号的广义互相关GCC-PHAT(Gener-alized Cross-Correlation with Phase Transform weighting)函数的最大值来评价接收信号的质量。在传统SRP-PHAT算法的基础上,以该最大值为权重乘以每对麦克风接收信号的GCC-PHAT函数。该算法质量较高的麦克风对接收信号赋予了较大的权重,因而能提高定位性能。仿真结果表明,在信噪比低于10 dB,混响时间大于300 ms的条件下,改进算法的定位成功率比传统算法提高了2%~4%。%To improve the performance of the steered response power-phase transform (SRP-PHAT)which is a popular sound source localisation algorithm,an improved SRP-PHAT algorithm based on distributed microphone arrays is presented.According to the characteristic of the distributed arrays,the quality of the received signal is evaluated by the peak value of the generalised cross-correlation with phase transf全桥整流
orm weighting (GCC-PHAT)of the received signal of microphone pair.Based on traditional SRP-PHAT algorithm,this peak value is used as the weight to multiply the GCC-PHAT function of the signals each pair of microphones received.In proposed algorithm,the received signals of microphone pair with higher quality are given bigger weights,so that are able to improve their localisation performance.Simulation results show that the improved algorithm facilitates 2%~4%increase in non-anomaly rate compared with the conventional algorithm under the conditions of SNR lower than 10 dB and reverberation time greater than 300 ms.
【期刊名称】《计算机应用与软件》
【年(卷),期】2014(000)005
【总页数】4页(P132-135)
汽轮机凝汽器
【关键词】分布式麦克风阵列;声源定位;SRP-PHAT
【作 者】蔡卫平;黄印君;陆泽橼
【作者单位】九江职业技术学院电气工程学院 江西 九江332007;九江职业技术学院电气工程学院 江西 九江332007;中国科学院合肥智能机械研究所 安徽 合肥230031
【正文语种】中 文
【中图分类】TP391.4
0 引言
基于麦克风阵列的声源定位技术可广泛用于视频会议、语音增强、智能机器人等领域[1,2]。近年来,该项技术逐渐推广至声源监控、人机接口、智能家居等领域[3,4]。如声源监控通常用于安保系统,在特定空间内确定声源的位置。为了达到较高的声源定位精度,该类系统一般采用阵元间距较大,阵元个数较多的分布式麦克风阵列。
基于麦克风阵列的声源定位方法很多,相位变换加权的可控响应功率SRP-PHAT声源定位算法[5]在混响环境中有较强的鲁棒性,可实现真实环境中的声源定位,因此该算法得到了广泛应用。SRP-PHAT对阵型没有特定要求,因此也适用于分布式阵列,事实上很多基于分布式阵列的定位系统采用了该算法[6]。SRP-PHAT算法的基本原理是在假想声源位
置计算所有麦克风对接收信号的相位变换加权的广义互相关GCC-PHAT函数之和,在整个声源空间寻使SRP值最大的点即为声源位置估计。SRP-PHAT对混响有较强的鲁棒性,但是在低信噪比SNR(Signal-to-Noise Ratio)环境中其定位性能较差。为了提高SRP-PHAT的定位精度,研究人员提出了多种改进的算法[7,8]。传统SRP-PHAT算法平等对待每一个麦克风,也就是说每个麦克风提供的声源位置信息都是同等重要的,这在小型阵列中是符合实际情况的。然而,在大型阵列中,声源与各阵元的距离相差很大,离声源较近的阵元接收信号的信噪比较高,直达信号相对于混响的强度,称之为信混比SRR(Signal-to-Reverberation Ratio),也较强,在定位算法中如果对这些阵元的接收信号给予较大的权重,则有可能提高定位性能。据此,文献[9]提出加权SRP-PHAT算法,在传统算法的基础上给每个麦克风接收信号乘以一个权重,该权重考虑了声源与阵元的距离、声源和麦克风的指向性。文献[9]的算法能有效提高定位性能,但该算法需要测量声源的指向性函数,还需要知道每个麦克风的指向性,在布阵时除了要知道每个阵元的位置外,还要知道其指向,这给实际应用带来困难。文献[10]利用了混响来提高定位精度,该类算法需要知道假想声源点到阵元之间的房间冲激响应,而这样的先验知识很难获取。
根据分布式阵列的特点,本文提出一种改进的SRP-PHAT算法。首先计算每对麦克风接收
信号的GCC-PHAT函数,并求其最大值,然后将这些最大值归一化,作为相应麦克风对接收信号的权重,最后在假想声源位置处将乘以了该权重的所有麦克风对的GCC-PHAT函数值相加,在声源空间中搜索其和的最大值即得到声源位置估计。研究表明麦克风对的GCC-PHAT函数的最大值越大则该对麦克风的接收信号越可靠,也就是接收信号质量越高[11]。本文采用麦克风对的GCC-PHAT函数的最大值作为该对麦克风的权重,实际上是对接收信号质量高的阵元赋予较大的权重,由于该权重计算量很小,因此本文的算法易于实现而且能有效提高定位性能。
uwb人员定位1 信号模型
用于说话人定位的麦克风阵列通常在室内环境下使用,麦克风的接收信号中除了声源直达信号外还有背景噪声和反射声。一个有M个阵元的麦克风阵列,第m个麦克风的接收信号可表示为:
其中s(n)为声源,hm(n)为声源到第m个麦克风的房间冲激响应,“*”表示线性卷积,bm(n)是第m个麦克风的噪声,假定各麦克风的噪声不相关,噪声与信号也不相关。
2 SRP-PHAT算法
塑料保鲜盒SRP-PHAT根据麦克风阵列接收的一帧信号来估计声源位置,我们仍然用xm(n)表示第m个麦克风接收的一帧数据,则SRP-PHAT的函数表达式为:
其中q为假想声源直角坐标矢量,[τlm(q)]为第l个和第m个麦克风的接收信号的GCC-PHAT函数,其表达式为:
其中Xm(k)是xm(n)的FFT,“*”表示取共轭,K为FFT点数,ω是模拟角频率,τlm(q)表示假想声源到第l个和第m个麦克风的到达时间差TDOA(Time Difference of Arrival)。以rl,rm分别表示第l个基元和第m个基元的直角坐标矢量,c为空气中的声速(约为342 m/s),则:
其中‖·‖表示求该矢量的2-范数。真实声源位置的估计可表示为:
乐器架其中,Q为预先设定的搜索空间。
3 改进的SRP-PHAT算法
声源定位算法中,麦克风接收信号的信噪比和信混比是影响定位性能的重要因素,这二者越高,则表明接收信号质量越高,相应的定位精度就越高。如前文所述,传统SRP算法平
等对待每一个麦克风,这一点从式(2)可以看出。小型阵列中每个麦克风的接收信号质量差别很小,平等对待每个麦克风是合理的。在分布式阵列中,每个麦克风的接收信号质量差别较大,如果对接收信号质量较好的麦克风给予较大的权重,则有可能提高定位性能。然而,声源与每一个麦克风的距离、指向均是未知的,仅根据单个阵元的接收信号来判断其质量的好坏是非常困难的。
文献[11]指出麦克风对的GCC-PHAT函数的最大值可表征该对麦克风接收信号的质量。为便于描述,我们用表示第l个和第m个麦克风的接收信号的GCC-PHAT函数的最大值。在两步法声源定位中,首先要估计声源到每一对麦克风的时延,然后根据这些时延估计和阵列几何计算出声源的位置。GCC-PHAT是常用的时延估计方法,由于混响和噪声的影响,有些麦克风对的时延估计误差很大,这将导致较大的定位误差。如果能将误差较大的时延估计剔除掉,则可以保证较高的定位精度。但要出误差较大的时延估计并非易事,有些研究人员对此进行了深入研究,这一问题已经超出了本文的研究范围,本文不作讨论。文献[11]的研究结果表明,R越大,该对麦克风的接收信号质量就越高,相应的时延估计也就越可靠,反之,越不可靠,因此如果一对麦克风的明显偏小则其对应的时延估计误差就比较大,应该将其剔除掉。SRP-PHAT属于直接法定位,但仍可借用文献[11]的结论,
根据来判断一对麦克风接收信号的质量。
基于以上思想,我们提出改进的SRP-PHAT算法,其表达式如下:罗口袜
其中,[τlm(q)]的含义与式(2)中的相同,wlm为归一化权重,如下式:
其中,。由式(6)可见,每对麦克风的GCCPHAT函数都乘以相应的权重wlm,接收信号质量越高该值越大,这就达到了加权的目的,从而可提高定位性能。根据式(3),可用FFT计算R^ lm(τ),进而由式(7)得到wlm。真实声源位置估计仍如式(5)所示。

本文发布于:2024-09-24 14:29:54,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/325959.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:声源   信号   定位   算法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议