基于传声器阵列的改进的PHAT-GCC语音定位算法

基于传声器阵列的改进的PHAT-GCC语音定位算法
彭迎标;杨尊先;林志贤;郭太良
【摘 要】通过对相位转换-广义互相关(PHAT-GCC)算法的基本原理进行深入研究,通过监控信噪比,信噪比加权,相干函数等手段提出一种改进的PHAT-GCC算法,以便实现在有噪声环境下进行准确定位.实验结果证明,该算法有效提高了其定位的准确度.
【期刊名称】《电声技术》
催化剂12.1
【年(卷),期】2013(037)002
【总页数】4页(P62-65)
【关键词】视频贴片广告传声器阵列;语音定位;时延估计
【作 者】彭迎标;杨尊先;林志贤;郭太良
【作者单位】福州大学场致发射国家地方联合工程实验室,福建福州350002;福州大学场致发
射国家地方联合工程实验室,福建福州350002;福州大学场致发射国家地方联合工程实验室,福建福州350002;福州大学场致发射国家地方联合工程实验室,福建福州350002
【正文语种】中 文
【中图分类】TN912
1 引言
目前,基于传声器阵列的声源定位方法主要分为三类:第一类算法是基于波束形成的定位技术,由于该算法的自身特征,该方法对初始点的选择非常敏感,因此,该算法不太适用于实时处理系统。第二类算法是基于高分辨率谱估计的定位技术,该方法存在运算量大的缺点,并且不适用于近场信号。第三类算法是基于到达时间差的定位技术,该算法原理简单,且计算量小,所以在实际系统中应用较多。
基于到达时间差的定位算法主要分为两个步骤。第一步为时延估计(Time Delay Estimation,TDE),用于计算被测声源到达不同传声器的时间差(Time Differences Of Arrival,TDOA)。第二步为定位估计,根据所得到的TDOA及传声器阵列中传声器间的几
药用淀粉何位置关系来计算声源的位置[1]。
目前已经出现了多种时间差估计算法,如基本互相关法、广义互相关法、最小均方自适应滤波法、互功率谱相位法等。其中 Knapp等人提出的PHAT-GCC(相位变换加权广义互相关)算法是较常用的一种。该算法能抑制旁瓣并且锐化互相关函数的主峰,从而提高时延估计的精度,是实际系统中应用最多的一种算法[2]。但该算法也有一定的缺点,当外部环境噪声较大或者语音信号的信噪比突然发生变化的时候,该算法的定位精度明显下降。本文针对PHAT-GCC算法这一缺点,对该算法中的加权函数做了相应的改进,得到一种改进型PHAT-GCC算法,经过验证,改进型PHAT-GCC算法在定位精度上较传统PHAT-GCC算法有明显的提高。
2 PHAT-GCC算法
PHAT-GCC算法的结构流程如图1所示。
对传声器1和传声器2(取自传声器阵列中任意两个)拾取到的语音信号,要进行语音信号预处理[3]。首先,使用FIR带通滤波器滤除200~4 000 Hz以外的噪声信号;其次,用半重
叠汉明窗对预滤波之后的信号进行加窗处理,得到待处理的输入信号,记作x1(n)和x2(n);然后进行FFT变换可得X1(k)和X2(k),即可求得x1(n)和x2(n)的互功率谱为
刘若仪图1 PHAT-GCC算法结构流程图
为了尽可能地抑制混响和噪声对定位算法的影响,提高时延估计精度,需要对拾取信号的互功率谱做进一步处理[4],如式(2)所示,用 φ( ω)对 12(ω)进行加权,得到加权后的函数,这正是GCC时延估计的出发点。
对于相位转换-广义互相关(PHAT-GCC)方法,加权函数 φPHAT(ω)=1/|12(ω)|,相当于白化输入信号。此时,估计的两通道相关函数为
从式(3)可以看出,在噪声背景完全不相关的情况下,PHAT-GCC方法能有效的抑制伪峰值,增强延迟处的峰值。因此,在一定环境下,特别是在高信噪比环境中,PHAT-GCC方法的时延估计性能很好,唯一的缺点是,在信号能量较小时,权函数分母会趋于零,进而增大定位误差[5]。然而,在实际环境中,噪声之间会产生相关噪声,并且定位系统所处的外部环境不是固定不变的,这些都是不能忽略的因素。针对这些情况,本文提出了一
种改进型PHAT-GCC算法,通过更改算法结构,使得广义互相关函数的峰值更加尖锐,得到时延估计更精确,进而定位更加准确。
3 改进型PHAT-GCC算法
改进型PHAT-GCC算法使用端点检测[6]模块来实时监控语音信号的信噪比,通过信噪比来决定加权函数参数,进而得到更精确的定位。改进型PHAT-GCC算法的结构流程图如图2所示。
图2 改进型PHAT-GCC算法结构流程图
自熟粉丝机3.1 监控信噪比
本文提出了通过端点检测模块来监控语音信号信噪比的变化的方法,端点检测原理流程如图3所示。在端点检测模块中,如果检测到当前帧为语音信号,则按照图2中的步骤继续进行运算,对当前信号进行定位,否则,不进行运算,这在一定程度上减少了系统算法的运算量。
当前信号帧信噪比 SNR( K)的确定分两种情况:
如果当前帧为语音帧,则需要两个步骤得到当前帧 SNR( K),第一步是得到当前帧的先验信噪比SNR,如式(4)所示
式(4)中PS(K)为当前语音帧的短时能量,PN(L)为接收过的信号帧中距离当前语音信号帧最近的非语音信号帧的短时能量。
图3 端点检测原理流程图
第二步,平滑信噪比
式中:SNR( K)为求得的当前语音信号帧的信噪比;SNR( K-1)为前一帧信号的信噪比;α为最佳平滑因子,经过实验验证,α一般取0.7为最佳。
如果当前帧为非语音信号,则
3.2 信噪比加权
在较高信噪比的环境下,PHAT-GCC方法有较好的性能,但是,在某些特定的环境中,加性噪声对算法的影响不可忽略[7]。为了解决这个问题,本算法将加权函数改为
当语音信号的信噪比发生改变的时候,为了得到精确的定位效果,ρ通过跟随SNR的变化而变化以改变加权函数。ρ的值是通过在房间内多次实验检测估计出来,这个值依赖于空间环境的信噪比SNR,通过多次实验发现,信噪比SNR与ρ有对应关系,不同的信噪比取不同的ρ值,信噪比越高,ρ的值越大。通过实验测试得出,SNR与ρ的对应关系如表1所示。
表1 信噪比SNR与参数ρ的对应关系?
就这样,通过实时监控语音信号信噪比的改变,跟随更改ρ的值来改变加权函数,以保证定位精度。
3.3 相干函数的应用
这里还存在一个问题,如果使用基本的PHATGCC加权函数,当语音信号能量很小的时候,权函数的分母趋近于零,这使得权函数趋近于无穷大,带来大的定位误差,为了减轻这种情况的产生,引进相干函数的概念。相干函数表示为
相干函数有以下特性:
(1)相干函数等于零,表示输出函数和输入函数不相干。
(2)相干函数等于1,表示输出函数和输入函数完全相干。
(3)若相干函数的值在0~1之间则表示有如下三种可能:①测试环境中有噪声干扰;②输出函数是输入函数和其它输入的综合输出;③输入函数和输出函数的系统是非线性的。
所以,更改加权函数为
当信号相干性差时,则加给的分量也小,这样不但减小了由于分母趋近于零造成的误差,而且不会对12(w)所表征的互功率谱产生干扰。
4 实验与结果分析
实验环境为长5 m,宽3 m的房间,如图4所示,在房间中间放置传声器阵列采集声音,并且把房间按照每30°划分一个方向,共分成12个区域,在每个区域内进行实验验证,每个区域取样50组信号,共进行600组实验。
图4 实验室模型图
本文对PHAT-GCC和改进型PHAT-GCC两种声源定位算法进行验证,共分3次进行验证
对比,分别为在固定信噪比环境下验证对比、在不同信噪比环境下验证对比和在变化信噪比环境下验证对比。根据声源定位系统测定的语音角度和实际角度之间的误差作为衡量声源定位算法性能的标准。表2为ρ=0.75(信噪比为15 dB),α=0.7时PHAT-GCC算法和改进型PHAT-GCC 算法在误差角度分别为3°,5°,10°,15°时的正确组数,测试环境为固定信噪比的声源。
表2 固定信噪比、不同误差角度下定位结果对比?
为了验证改进的PHAT-GCC算法的稳定性,在不同信噪比的环境中采集数据,选定信噪比分别为10 dB,20 dB,30 dB,其中ρ分别为对应不同信噪比的值,在每个方向上进行50次实验,在每个信噪比环境中采集到600组数据,实验结果如表3所示。
表3 不同信噪比、不同误差角度下定位结果对比
雨污分流器由于现实中的工作环境比实验环境要恶劣、更加不可预测,所以,需要考虑在不固定信噪比环境中,改进型PHAT-GCC算法的可靠性,为了模拟现实的工作环境,选用同一声源信号在不同信噪比之间做切换,对比PHAT-GCC算法,实验结果如表4所示。

本文发布于:2024-09-23 15:20:24,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/163400.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:算法   函数   信号   定位   语音   进行   环境   加权
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议