基于声响特征的爆炸位源信息快速识别方法与装置



1.本发明属于爆炸灾害防护技术领域,涉及一种基于声响特征的爆炸位源信息快速识别方法与装置。


背景技术:



2.爆炸冲击问题由于其突发性、高危险性和大范围毁伤性等特点,对地区安全造成巨大威胁。当爆炸发生时,能快速准确地获取爆源信息,对于降低爆炸灾害大范围扩散,提升抗灾能力具有重要意义。
3.当前,对于爆炸冲击常用的监测手段主要是在现场布置压力传感器、加速度传感器或速度传感器测量爆炸产生的超压、加速度以及速度,之后按照爆炸相似原理,推算出当量,距离等位源信息。但是由于起爆炸瞬间会在一定的范围内营造出高温高压环境,不仅会对临近爆源的传感器会造成大量的摧毁,更是造成监测数据获取不充分,影响对爆炸信息的判断,因此此类监测方法的使用成本较高,经济性较差,在实际现场监测条件下难以大范围地使用。
4.爆炸声响是伴随爆炸产生的,一种极易获取的爆炸信号。与爆炸的超压、加速度等需要专门传感器进行测量的方式相比,爆炸声响信号在测量手段上较为便利,弱化了采样设备的制约,在监测操作上具有良好的便利性。加强对于爆炸声响信号测量方法的开发,具有明显的经济价值。
5.当前,生物语音识别已经被广泛地用于各类实践中,诸如:语音识别,智能语音等技术,这为将爆炸声响信号应用于防护工程领域提供了重要的契机。如何借鉴生物语音识别技术,实现在现场环境下爆炸声源的精确定位,具有重要的研究价值。
6.机器学习是人工智能的一个新兴分支,它从已知实例中自动发现规律,建立对未知实例的预测模型,与传统回归方法相比较,更适用于复杂高度非线性的回归问题。人工神经网络与支持向量机是当今代表性的机器学习方法。但人工神经网络和支持向量机均存在一些公开问题,例如,人工神经网络存在着最优网络拓扑结构与最优超参数不易确定、存在过(欠)学习风险、小样本推广能力差等问题;支持向量机的核函数及合理超参数没有可行的理论求解方法,很难保证预测的可靠性。
7.信息向量机(informative vector machine,ivm)是一种新的机器学习方法,由neil于2002年提出。该方法采用基于信息熵理论的方法,从大量的训练样本中优选出部分的最具信息性的样本组成有效集,通过对有效集的学习可以达到与原训练样本集相同的学习效果,同时结合稀疏化核矩阵表示,从而大大简化学习的时间复杂度和空间复杂度。另外,ivm通过假定密度筛选与最小化kl散度(相对信息熵)实现了对非高斯分布噪声模型后验分布的近似逼近。ivm具有优异的回归性能,其超参数可自适应获取,对高度非线性回归问题具有较强的适用性。
8.因此本专利将语音识别中短时能量特征(se)、梅尔倒谱系数特征(mfcc)、爆炸声谱hog纹理特征、爆炸声谱颜矩cm特征、与ivm机器识别技术结合引入到爆炸位源的识别
定位技术中,提出了一种新的基于声响特征的爆炸位源信息快速识别方法及装置,根据现场监测的爆炸声响信号实现对爆炸位源信息的精确识别,为爆炸防灾和提前预警提供了一条新的经济性道路。


技术实现要素:



9.技术方案:针对当前爆源监测技术的不足,本发明提出了一种基于声响特征的爆炸位源信息快速识别方法,该方法包括如下步骤:
10.步骤s1:测定现场传播介质参数,作为后续步骤区分不同环境下声音信号的环境标签;
11.步骤s2:采集环境噪声;
12.步骤s3:将不同爆源所对应的爆炸声响信号进行收集,组成原始声音信号数据库i;
13.步骤s4:将原始数据库i中的爆炸声响信号进行规整、并根据步骤s2中采集的环境噪声进行去噪预处理,提取不同爆源信号的短时能量特征(se)、倒谱特征系数(mfcc)、反映爆炸声谱纹理特征的hog特征、反映爆炸声谱颜分布特征的颜矩(cm)特征以获得四类融合特征,并建立信息向量机(ivm)模型的训练样本数据库d;
14.步骤s5:将训练数据库d中的四类融合特征训练信息向量机(ivm)模型;
15.步骤s6:实时监测爆炸声音信号,对所测爆炸声信号进行规整,并根据步骤s2中采集的环境噪声进行去噪预处理;
16.步骤s7:提取现场爆炸声响信号短时能量特征(se)、修正的倒谱特征系数(mfcc)、爆炸声谱纹理特征的hog特征、爆炸声谱颜分布特征的颜矩(cm)特征,将四类融合特征输入已训练的ivm模型中,预测确定爆炸位源信息;
17.步骤s8:将ivm预测结果准确的预测样本作为新的训练样本更新原训练数据库d中,重新训练ivm,再对所监测的爆炸声音进行预测。
18.进一步的,步骤s3中,原始声音信号数据库i中所收集的声音信号数据为原始数字信号,数字信号的横坐标为时刻值,纵坐标为声音分贝幅值,原始声音信号数据库i包括以下的原始声音样本:(1)不同比例埋深的爆源所对应的爆炸声音信号;(2)在距离爆芯不同比例距离的监测点所监测到的声音信号。
19.进一步的,步骤s4中,根据步骤s3中所收集的数字信号,进行声音信号四类特征的提取,四类融合特征的提取方法如下:
20.从原始数字信号中提取反映声音能量信息的短时能量特征(se)和反映声音信号能量特征规律的mfcc特征;将爆炸的原声声响信号绘制成时间-频率-幅值的三维爆炸声谱图,提取反映声谱纹理分布的hog纹理特征和声谱在不同频率带分布幅值大小的颜矩特征(cm);
21.构建的训练样本数据库d如下:
22.d=[x,y],其中,输入特征矩阵x为训练样本的输入值,输出矩阵y为训练样本的输出值,输入特征矩阵x=[x1,x2,x3,x4]由四个特征向量组成,包括x1={爆炸声响的短视能量特征(se)}、x2={梅尔倒谱特征系数(mfcc)}、x3={反映爆炸声谱纹理特征的hog特征}、x4={反映爆炸声谱颜分布特征的颜矩(cm)特征},输出特征矩阵y=[y1,y2]由两个特征
向量组成,包括:y1={不同爆炸声响特征随对应的爆源比例埋深};y2={不同监测点的爆炸声响特征距离爆源的比例距离}。
[0023]
进一步的,所述步骤s5包括:将训练数据库d中的爆炸声响信号的四类爆炸声响特征作为输入,输出矩阵y作为输出训练ivm模型,在训练过程中利用随机采样的方法将训练样本库中的数据中随机分成训练集和测试集,通过随机训练多次获得最终的ivm模型。
[0024]
进一步的,所述步骤s8还包括:将与真实爆炸位源信息相比,预测误差小于预设阈值的新的预测样本,作为新的训练样本加入到训练样本集合中,扩宽训练样本集合。
[0025]
此外,本发明还提出一种基于声响特征的爆炸位源信息识别装置,该装置包括:
[0026]
介质参数采集模块:测定现场传播介质参数,作为后续步骤区分不同环境下声音信号的环境标签,并以此对声音信号进行分类;
[0027]
环境噪声采集模块:采集环境噪声;
[0028]
原始声音信号数据库构建模块:将不同爆源所对应的爆炸声响信号进行收集,组成原始声音信号数据库i;
[0029]
训练样本数据库构建模块:将原始数据库i中的爆炸声响信号进行规整、并根据步骤s2中采集的环境噪声进行去噪预处理,提取不同爆源信号的短时能量特征(se)、倒谱特征系数(mfcc)、反映爆炸声谱纹理特征的hog特征、反映爆炸声谱颜分布特征的颜矩(cm)特征以获得四类融合特征,并建立信息向量机(ivm)模型的训练样本数据库d;
[0030]
模型训练模块:将训练数据库d中的四类融合特征训练信息向量机(ivm)模型;
[0031]
实时数据监测模块:实时监测爆炸声音信号,对所测爆炸声信号进行规整、并根据步骤s2中采集的环境噪声进行去噪预处理;
[0032]
爆炸位置预测模块:提取现场爆炸声响信号短时能量特征(se)、修正的倒谱特征系数(mfcc)、爆炸声谱纹理特征的hog特征、爆炸声谱颜分布特征的颜矩(cm)特征,将四类融合特征输入已训练的ivm模型中,预测确定爆炸位源信息;
[0033]
训练样本添加模块:将ivm预测结果准确的预测样本作为新的训练样本更新原训练数据库d中,重新训练ivm,再对所监测的爆炸声音进行预测。
[0034]
进一步的,原始声音信号数据库构建模块构建的原始声音信号数据库i包括以下的原始声音样本:(1)不同比例埋深的爆源所对应的爆炸声音信号;(2)在距离爆芯不同比例距离下所监测到的声音信号。
[0035]
进一步的,训练样本数据库构建模块中的四类融合特征的提取方法如下:
[0036]
特征提取对象为步骤s3中记录的时间-幅值原始数字信号:
[0037]
从原始数字信号中提取反映声音能量信息的短时能量特征(se)和反映声音信号能量特征规律的mfcc特征;将爆炸的原声声响信号绘制成时间-频率-幅值的三维爆炸声谱图,提取反映声谱纹理分布的hog纹理特征和声谱在不同频率带分布幅值大小的颜矩特征(cm);
[0038]
构建的训练样本数据库d如下:
[0039]
d=[x,y],其中,输入特征矩阵x为训练样本的输入值,输出矩阵y为训练样本的输出值,输入特征矩阵x=[x1,x2,x3,x4]由四个特征向量组成,包括x1={爆炸声响的短视能量特征(se)}、x2={梅尔倒谱特征系数(mfcc)}、x3={反映爆炸声谱纹理特征的hog特征}、x4={反映爆炸声谱颜分布特征的颜矩(cm)特征},输出特征矩阵y=[y1,y2]由两个特征
向量组成,包括:y1={不同爆炸声响特征随对应的爆源比例埋深};y2={不同监测点的爆炸声响特征距离爆源的比例距离}。
[0040]
进一步的,模型训练模块的训练方法如下:
[0041]
将训练数据库d中的爆炸声响信号的四类爆炸声响特征作为输入,输出矩阵y作为输出训练ivm模型,在训练过程中利用随机采样的方法将训练样本库中的数据中随机分成训练集和测试集,通过随机训练多次获得最终的ivm模型。
[0042]
进一步的,训练样本添加模块添加样本的方法为:将与真实爆炸位源信息相比,预测误差小于预设阈值的新的预测样本,作为新的训练样本加入到训练样本集合中,扩宽训练样本集合。
[0043]
对上述各个步骤进行进一步的说明:
[0044]
步骤s1,由于声音传播受到了周围传播介质特性的影响,不同环境下的声音信号特征也有较大差别。因此,在进行声音信号的收集、识别前,首先按照同样的环境条件对所收集信号进行分类,作为后续步骤区分声音信号的环境标签。如果后续待识别声音信号环境变化时,需要重新按照本发明流程重新记录新环境下的爆炸声音信号。根据爆炸声响传播特点,步骤s1中所测定的环境传播介质参数,包括:温度,传播介质密度、压强等相关自然参数,作为后续步骤区分不同环境下声音信号的环境标签。
[0045]
步骤s2,在现场环境下,过多的噪声会对监测所得的爆炸声响信号造成过多的干扰,造成识别结果的错误,为了有针对性地对收集到的噪声信号进行去噪处理,因此收集现场环境中诸多可能出现的噪声,作为后续步骤中去噪的基础信息。
[0046]
步骤s3,为了保证训练ivm模型时具备充足的样本数据,构建原始声音信号数据库i。在该步骤中,为了区别不同环境中所监测到的爆炸声音信号,首先将原始信号数据库i的声音信号中按照步骤s1中不同的传播环境介质进行标记、区分。除了不同声音信号的环境标签,数据库i中的信号数据还包括以下的原始声音样本:(1)不同比例埋深的爆源所对应的爆炸声音信号;(2)在距离爆芯不同比例距离下所监测到的声音信号。在原始声音信号数据库i中,所收集的声音信号数据为原始数字信号,数字信号的横坐标为时刻值,纵坐标为声音分贝幅值。
[0047]
步骤s4,首先,基于步骤s2中已获得现场环境噪声,对现场爆炸原声响信号进行去噪处理。接着,提取信号数据库i中的信号四类信号特征,包括:爆炸声响信号的短时能量特征(se)、梅尔倒谱特征系数(mfcc)、反映爆炸声谱纹理特征的hog特征、反映爆炸声谱颜分布特征的颜矩(cm)特征,并构建信息向量机(ivm)模型所需要的的训练样本数据库d;
[0048]
下面对上述的四种特征进行简要的说明。
[0049]
短时能量特征(se),是一种能反应声音能量随时间变化特征的音频特征参数,从听觉上就是俗称的声音响度,具有简单、方便,区分声响特征明显的特点。短时能量的定义公式为:
[0050][0051]
式中,n为窗函数的长度。窗口采用直角窗,
[0052]
[0053]
一般常用的语音系数特征通常对语音信号特征的描述是利用傅里叶变换将语音信号从时域空间映射至频域空间,而且对于所有频率的侧重程度相同。但是在实际生活中,人耳听觉相当于一个滤波器的作用,对于不同频率特征的信号的“过滤”程度不同,换句话说:不同音调的声音信号在人耳听觉中引起的敏感度也不同,高音调的信号更会易于人耳的响应,并且会导致低音调的声音选择性“忽略”,即为“掩蔽效应”。例如当对于一个音调较高的声音信号和一个音调较低声音同时传至人耳中,人耳会首先拾取音调较高的声音,同时会“忽略”音调较低的声音信号。为了能够描述这种现象,更好的对人耳接收信号的能力进行模拟,有关研究者提出了mfcc的概念,人们为了模仿人耳对不同音调的拾取能力,按照不同的音调频率设置了多个带宽值,在每个带宽值区间内,同样有从疏到密的滤波器,通过将接受到的声音信号通过这数个滤波器,并且计算每个滤波器输出信号的能量,将信号的能量合并成一个指标作为声音信号的特征,即为mfcc特征。在频域空间中不同频率的声音信号,反映至人耳听觉梅尔谱系数mfcc具有如下的关系:
[0054][0055]
式中:f是实际信号的频率,单位为hz;
[0056]
与mfcc特征相似,声谱也是将声音在时域空间和频域空间的一种联合表达形式。声音在时域空间的表达形式为时间-幅值的波形文件,通过对当波形进行分帧、加窗,短时傅里叶变化后,将一维的声音信号的变化反映在三维空间中,即为声音信号的时域-频域-幅值信号分布图,这样的图形俗称为声谱。不同声源的声音信号具有不同的声谱图形,为了能对不同的声谱图形加以区分,通常从声谱条带的纹理特征和条带颜深浅聚集入手,声谱带上颜的深浅程度即为声信号能量的大小,谱带从上至下的幅值表示能量越来越大,条纹带的密集程度反映出此刻声音信号的数量聚集度,颜深浅反映出信号幅值的高低程度。以上分析看出,对于任何每一个声音信号,声纹图形的纹理特征都是独一无二的,这为声纹图形的识别提供了分类基础。
[0057]
图谱的hog纹理特征,又称为方向梯度直方图特征,是在计算机视觉领域一种重要的识别特征,常用用来进行物体的特征检测。对于图像h(x,y),图像中任一像素点(x,y)的梯度定义为:
[0058]gx
(x,y)=h(x+1,y)-h(x-1,y)
[0059]gy
(x,y)=h(x,y+1)-h(x,y-1)
[0060]
式中:g
x
(x,y)、gy(x,y)、h(x,y)分别表示输入像素点(x,y)处的水平方向梯度、垂直方向梯度和像素值。
[0061]
任一像素点(x,y)处的梯度幅值和梯度方向分别为:
[0062][0063][0064]
当对整张图像进行hog特征的提取时,首先将图像分为不同的细胞单元,分别提取每个细胞单元内的hog特征,然后将所有单元组合成大块的n维hog特征向量。
[0065]
图谱的颜矩反映图形红、绿、蓝分布的特征,是一种能方便表示图形颜分布特
征的颜特征。该特征通过计算图形的一阶、二阶和三阶颜特征,如下:
[0066][0067][0068][0069]
其中,p
i,j
表示彩图像第j个像素的第i个颜分量,n表示图像中的像素个数。
[0070]
步骤s5,按照步骤s1中不同环境下的爆炸声响信号特征训练ivm模型,所输入的训练集合d=[x,y],其中,矩阵x为训练样本的输入值,矩阵y为训练样本的输出值。输入特征矩阵x=[x1,x2,x3,x4]由四个特征向量组成,包括x1={爆炸声响的短视能量特征(se)}、x2={梅尔倒谱特征系数(mfcc)}、x3={反映爆炸声谱纹理特征的hog特征}、x4={反映爆炸声谱颜分布特征的颜矩(cm)特征},因此大特征向量x是四类特征融合后的特征向量;输出特征矩阵y=[y1,y2]由两个特征向量组成,包括:y1={不同爆炸声响特征随对应的爆源比例埋深};y2={不同监测点的爆炸声响特征距离爆源的比例距离}。训练完成即形成了在不同环境下所对应的爆炸声源识别的ivm模型。
[0071]
下面对ivm模型进行简要的说明。
[0072]
ivm模型基于贝叶斯统计学习理论及核方法,结合了假定密度逼近adf和基于信息熵理论的样本选择方法,利用adp递归近似每次增选一个信息向量样本之后的后验分布,并获取近似似然分布,确保算法的可跟踪性和易处理性,同时,在该递归近似过程中,利用基于信息熵理论的样本选择方法筛选最具信息性的样本,以求替代对原训练样本集的学习,并且采用递归更新记录中间变量的方法巧妙回避协方差矩阵k(核矩阵)的重复处理,实现显著降低算法时间及空间复杂度的目的。下面对ivm二分类模型学习及预测过程的部分关键步骤进行简要说明。
[0073]
ivm回归代理模型在学习过程中,维持了两个样本索引集i与j,其中i是有效集,j是待选集,初始时,j={1,2,...,n},且在任意时刻,i∪j={1,2,...,n}(假定要从初始n训练样本中,筛选d个信息向量),信息向量是以一种连续的、类似在线学习的方式获取:首先,应用adf近似具有i个信息向量,即ii时的后验分布及似然分布:
[0074][0075]
式中:p表示概率分布,q表示近似分布,μ表示高斯分布均值,σ为协方差矩阵m表示似然替代变量,β表示噪声分布方差,为有效训练样本的输入向量,θ表示协方差函数超参数。之后,依照如下方法选择i+1个信息向量:
[0076][0077]
上式表示:选择当前待选集j中能够最大化减小后验分布信息熵的一个样本j,作
为第i+1个信息向量。循环执行上述过程,直至完成d个信息向量的选择(即i=id)。此时,可得
[0078][0079]
式中b表示噪声分布方差,k或σ表示高斯分布协方差矩阵。在ivm代理模型中,协方差函数超参数θ的最优解正是通过最大化边缘似然p(yi|x
i,:
,θ)而自适应获取的。具体的,通过取负对数-log(p(yi|x
i,:
,θ)),将最大化问题转化为最小化问题,进而利用共轭梯度下降法实现最优超参数的自适应获取。
[0080]
通过上述过程,实现了以有效集i替代原始样本数据集的学习,之后的回归过程同贝叶斯回归学习过程中的做法一致,代入对应的变量、向量或矩阵,即得ivm后验概率分布:
[0081][0082]
步骤s6:在利用训练样本数据库d中的训练样本完成ivm的训练后,对实时监测所得到待预测的新声音信号预测样本进行识别。对于所得到的新的待预测样本,同样按照步骤s1~s4中的流程进行预处理。与原始训练样本n的预处理方式类似,首先根据步骤s1,对当前环境下待预测声音信号测定环境介质参数,打上环境参数标签,并按照同一环境进行分类。之后对处于同一环境下的预测声音信号,根据步骤s2,按照同样环境下的噪声进行信号规整、去噪预处理,形成新的预测样本的原生声音信号库t。与原始训练数据库i中所收集的声音信号数据相同,待预测的原生声音信号库t中的信号同样为时间-幅值的原始数字信号。
[0083]
步骤s7:经预处理后的待预测声响信号,按照步骤s4中的特征提取流程,依次提取待预测信号的短时能量特征(se)、修正的倒谱特征系数(mfcc)、爆炸声谱纹理特征的hog特征、爆炸声谱颜分布特征的颜矩(cm)特征,四类融合特征,构建待预测的数据库s。根据待预测数据库s中每个预测样本在步骤s1所测的环境条件,输入在步骤s5中已经训练完成的同样环境条件下相应ivm模型中,确定爆炸位源信息。
[0084]
步骤s8:根据步骤s7中ivm模型的识别结果,将识别结果良好的样本,作为新的训练样本更新原训练数据库d中,在下一次识别之前,重新训练ivm,预测结果良好的定义为:当预测结果与真实爆源位置信息误差小于10%,即可以认为是识别结果良好,并将新的训练样本加入到训练集合d中。
[0085]
有益效果:与现有技术相比,本发明的技术方案具有以下有益技术效果:
[0086]
不同位源的爆炸声响特征具有明显的特征区别,利用爆炸声响的短时能量特征、mfcc特征、爆炸声谱hog纹理特征,爆炸声谱颜矩特征,结合ivm机器学习识别方法的理论,实现了对不同爆源位置点的自动识别。
[0087]
本文利用廉价的爆炸声响特征信号建立了现场的爆源信息的快速识别方法,与传统的监测方法相比,降低了现场的爆源信息识别的复杂程度,为更高效、更经济地识别爆源位置信息提供了一条新的途径。
[0088]
本发明中的智能化装置平台实现了从声音获取、训练、建模、参数修改、预测、反馈
信息一体化的过程,使整个参数获取流程更加智能化,及时地信息参数修正和属性的设置,提高了模型的适应性和高效性。
附图说明
[0089]
图1为本发明方法的流程图;
[0090]
图2为本发明实施案例1中的监测点布置及测点序号图;
[0091]
图3为本发明实施装置处理进程图。
具体实施方式
[0092]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0093]
实施例1
[0094]
本发明提出一种基于声响特征的爆炸位源信息快速识别方法,发明方法的流程如图1所示,其具体包括以下步骤:
[0095]
本发明实施例1针对某现场化爆试验测试场地,场地大小为1000m
×
1000m,主要的监测信号类型为爆炸声响信号。现场爆炸声响监测点布置以及监测点序号如图2所示,在水平0
°
测带方向的声音监测点数量为5个,在90
°
方向的监测点布置数量5个。
[0096]
步骤s1,现场传播介质影响参数的测量,见表1。
[0097]
表1现场传播介质影响参数
[0098][0099]
在接下来的,步骤s3中所构成的原始声音信号数据库i、步骤s4中所构成的训练特征数据库d、步骤s5中对ivm模型进行训练和步骤s7对新的预测样本的识别都需要符合在步骤s1所测定的环境条件。
[0100]
步骤s2,采集环境噪声;现场噪声是后期滤噪的样本基础,通过收集了现场环境中具有代表性的现场声音噪声,包括鸟鸣声,施工声、机器振动声等,以此为噪声基础样本,对后期待分析的爆炸声音信号进行去噪;
[0101]
步骤s3,为了提供必要的训练样本,在进行实际的预测之前,在现场环境下开展不同比例埋深的爆炸试验,获取训练集。在现场开展已知位源点的20次试炮,将现场10个监测点所监测到的不同比例埋深、距离爆源不同比例距离的爆炸声响信号构成组成原始声音信号数据库i,不同声音信号所包含的爆源信息包括:(1)不同比例埋深的爆源所对应的爆炸声音信号;(2)在距离爆芯不同比例距离的监测点所得的声音信号,因此ivm的识别结果同样也能包括两项位置信息;
[0102]
步骤s4:首先,基于步骤s2已获得现场环境噪声,本案例中选用小波去噪的技术处
理方式,对现场爆炸原声响信号进行规整、去噪等预处理。接着,提取信号的短时能量特征(se)、修正的倒谱特征系数(mfcc)、反映爆炸声谱纹理特征的hog特征、反映爆炸声谱颜分布特征的颜矩(cm)特征,共四类融合特征,并建立训练特征数据库d;
[0103]
步骤s4-1,首先对训练样本库d中的爆炸声音信号进行预处理,预处理内容包括对两项内容,首先,基于噪声样本,使用小波去噪算法对爆炸的声响信号进行去噪;
[0104]
步骤s4-2,使用动态规整算法(dtw),对不同时长的爆炸声响信号,进行同样时长的规整,削弱信号时长的影响,使训练样本库中的所有信号具有相同的时间长度。
[0105]
步骤s4-3,提取预处理后的爆炸声响进行短视能量特征(se),作为特征向量一x1,
[0106]
步骤s4-4,mfcc特征的提取,作为特征二x2;
[0107]
步骤s4-4,将声音时域的数字信号通过短时傅里叶变化转换成时频域的三维图;
[0108]
步骤s4-5,提取三维图形信号的纹理分布的hog特征,作为特征三x3;
[0109]
步骤s4-6,提取三维图形信号的颜分布的颜矩cm特征,作为特征四x4;
[0110]
步骤s4-6,将上述的四种特征融合后,作为融合特征x=[x1,x2,x3,x4];
[0111]
步骤s5,将融合特征x训练ivm模型,获取训练后的ivm模型,并在ivm的训练中,训练过程中利用随机抽样的方法将训练样本库中的数据中随机分成训练集和测试集,在本工程实例中,随机10次抽样,分配训练集和测试,对ivm模型进行了随机验证;
[0112]
步骤s6:在完成对ivm的训练后,即可对现场所监测得到的新的未知爆炸声响信号进行识别,在对现场声音信号进行识别之前,利用预处理方法对新的爆炸声信号进行动态规整、滤噪;
[0113]
步骤s7:将已经预处理的新的现场爆炸点的爆炸声信号,提取其se、mfcc、hog、cm四类特征所组成的融合特征,做成预测样本z,输入进前述步骤s5中已训练的ivm模型中,根据ivm计算结果确定未知爆源的位置信息,未知爆源点比例埋深的预测结果见下表2,未知爆源到图2中

号监测点的比例距离预测结果如下表3所示;
[0114]
步骤s8:在本实例中,为了能进一步地扩充训练样本,可以将实测结果与预测结果进行比对,计算误差较小的标准是实测结果与预测结果的误差小于5%。将于真实结果误差较小的预测样本作为新的训练样本更新原训练数据库d,重新训练ivm,对之后所监测的爆炸声音进行预测。
[0115]
表2爆源比例埋深预测结果
[0116][0117]
表3爆源到

号监测点比例距离识别结果
[0118][0119]
实施例2
[0120]
此外,本发明还提出一种基于声响特征的爆炸位源信息识别装置,该装置包括如下模块:
[0121]
介质参数采集模块:测定现场传播介质参数,作为后续步骤区分不同环境下声音信号的环境标签,并以此对声音信号进行分类;
[0122]
环境噪声采集模块:采集环境噪声;
[0123]
原始声音信号数据库构建模块:将不同爆源所对应的爆炸声响信号进行收集,组成原始声音信号数据库i;
[0124]
训练样本数据库构建模块:将原始数据库i中的爆炸声响信号进行规整、并根据步骤s2中采集的环境噪声进行去噪预处理,提取不同爆源信号的短时能量特征(se)、倒谱特征系数(mfcc)、反映爆炸声谱纹理特征的hog特征、反映爆炸声谱颜分布特征的颜矩(cm)特征以获得四类融合特征,并建立信息向量机(ivm)模型的训练样本数据库d;
[0125]
模型训练模块:将训练数据库d中的四类融合特征训练信息向量机(ivm)模型;
[0126]
实时数据监测模块:实时监测爆炸声音信号,对所测爆炸声信号进行规整、并根据步骤s2中采集的环境噪声进行去噪预处理;
[0127]
爆炸位置预测模块:提取现场爆炸声响信号短时能量特征(se)、修正的倒谱特征系数(mfcc)、爆炸声谱纹理特征的hog特征、爆炸声谱颜分布特征的颜矩(cm)特征,将四类融合特征输入已训练的ivm模型中,预测确定爆炸位源信息;
[0128]
训练样本添加模块:将ivm预测结果准确的预测样本作为新的训练样本更新原训练数据库d中,重新训练ivm,再对所监测的爆炸声音进行预测。
[0129]
原始声音信号数据库构建模块构建的原始声音信号数据库i包括以下的原始声音样本:(1)不同比例埋深的爆源所对应的爆炸声音信号;(2)在距离爆芯不同比例距离下所监测到的声音信号。
[0130]
训练样本数据库构建模块中的四类融合特征的提取方法如下:
[0131]
特征提取对象为步骤s3中记录的时间-幅值原始数字信号:
[0132]
从原始数字信号中提取反映声音能量信息的短时能量特征(se)和反映声音信号能量特征规律的mfcc特征;将爆炸的原声声响信号绘制成时间-频率-幅值的三维爆炸声谱图,提取反映声谱纹理分布的hog纹理特征和声谱在不同频率带分布幅值大小的颜矩特
征(cm);
[0133]
构建的训练样本数据库d如下:
[0134]
d=[x,y],其中,输入特征矩阵x为训练样本的输入值,输出矩阵y为训练样本的输出值,输入特征矩阵x=[x1,x2,x3,x4]由四个特征向量组成,包括x1={爆炸声响的短视能量特征(se)}、x2={梅尔倒谱特征系数(mfcc)}、x3={反映爆炸声谱纹理特征的hog特征}、x4={反映爆炸声谱颜分布特征的颜矩(cm)特征},输出特征矩阵y=[y1,y2]由两个特征向量组成,包括:y1={不同爆炸声响特征随对应的爆源比例埋深};y2={不同监测点的爆炸声响特征距离爆源的比例距离}。
[0135]
模型训练模块的训练方法如下:
[0136]
将训练数据库d中的爆炸声响信号的四类爆炸声响特征作为输入,输出矩阵y作为输出训练ivm模型,在训练过程中利用随机采样的方法将训练样本库中的数据中随机分成训练集和测试集,通过随机训练多次获得最终的ivm模型。
[0137]
训练样本添加模块添加样本的方法为:将与真实爆炸位源信息相比,预测误差小于预设阈值的新的预测样本,作为新的训练样本加入到训练样本集合中,扩宽训练样本集合。
[0138]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

技术特征:


1.一种基于声响特征的爆炸位源信息快速识别方法,其特征在于,该方法包括如下步骤:步骤s1:测定现场传播介质参数,作为后续步骤区分不同环境下声音信号的环境标签;步骤s2:采集环境噪声;步骤s3:将不同爆源所对应的爆炸声响信号进行收集,组成原始声音信号数据库i;步骤s4:将原始数据库i中的爆炸声响信号进行时间尺度规整、并根据步骤s2中采集的环境噪声进行去噪预处理,提取不同爆源信号的短时能量特征(se)、倒谱特征系数(mfcc)、反映爆炸声谱纹理特征的hog特征、反映爆炸声谱颜分布特征的颜矩(cm)特征以获得四类融合特征,并建立信息向量机(ivm)模型的训练样本数据库d;步骤s5:将训练数据库d中的四类融合特征训练信息向量机(ivm)模型;步骤s6:实时监测爆炸声音信号,对所测爆炸声信号进行规整,并根据步骤s2中采集的环境噪声进行去噪预处理;步骤s7:提取现场爆炸声响信号短时能量特征(se)、修正的倒谱特征系数(mfcc)、爆炸声谱纹理特征的hog特征、爆炸声谱颜分布特征的颜矩(cm)特征,将四类融合特征输入已训练的ivm模型中,预测确定爆炸位源信息;步骤s8:将ivm预测结果准确的预测样本作为新的训练样本更新原训练数据库d中,重新训练ivm,再对所监测的爆炸声音进行预测。2.根据权利要求1中基于声响特征的爆炸位源信息快速识别方法,其特征在于,步骤s3中,原始声音信号数据库i中所收集的声音信号数据为原始数字信号,数字信号的横坐标为时刻值,纵坐标为声音分贝幅值,原始声音信号数据库i包括以下的原始声音样本:(1)不同比例埋深的爆源所对应的爆炸声音信号;(2)在距离爆芯不同比例距离的监测点所监测到的声音信号。3.根据权利要求1中基于声响特征的爆炸位源信息快速识别方法,其特征在于,步骤s4中,根据步骤s3中所收集的数字信号,进行声音信号四类特征的提取,四类融合特征的提取方法如下:从原始数字信号中提取反映声音能量信息的短时能量特征(se)和反映声音信号能量特征规律的mfcc特征;将爆炸的原声声响信号绘制成时间-频率-幅值的三维爆炸声谱图,提取反映声谱纹理分布的hog纹理特征和声谱在不同频率带分布幅值大小的颜矩特征(cm);构建的训练样本数据库d如下:d=[x,y],其中,输入特征矩阵x为训练样本的输入值,输出矩阵y为训练样本的输出值,输入特征矩阵x=[x1,x2,x3,x4]由四个特征向量组成,包括x1={爆炸声响的短视能量特征(se)}、x2={梅尔倒谱特征系数(mfcc)}、x3={反映爆炸声谱纹理特征的hog特征}、x4={反映爆炸声谱颜分布特征的颜矩(cm)特征},输出特征矩阵y=[y1,y2]由两个特征向量组成,包括:y1={不同爆炸声响特征随对应的爆源比例埋深};y2={不同监测点的爆炸声响特征距离爆源的比例距离}。4.根据权利要求3中基于声响特征的爆炸位源信息快速识别方法,其特征在于,所述步骤s5包括:将训练数据库d中的爆炸声响信号的四类爆炸声响特征作为输入,输出矩阵y作为输出训练ivm模型,在训练过程中利用随机采样的方法将训练样本库中的数据中随机分
成训练集和测试集,通过随机训练多次获得最终的ivm模型。5.根据权利要求1中基于声响特征的爆炸位源信息快速识别方法,其特征在于,所述步骤s8还包括:将与真实爆炸位源信息相比,预测误差小于预设阈值的新的预测样本,作为新的训练样本加入到训练样本集合中,扩宽训练样本集合。6.一种基于声响特征的爆炸位源信息识别装置,其特征在于,该装置包括:介质参数采集模块:测定现场传播介质参数,作为后续步骤区分不同环境下声音信号的环境标签,并以此对声音信号进行分类;环境噪声采集模块:采集环境噪声;原始声音信号数据库构建模块:将不同爆源所对应的爆炸声响信号进行收集,组成原始声音信号数据库i;训练样本数据库构建模块:将原始数据库i中的爆炸声响信号进行规整、并根据步骤s2中采集的环境噪声进行去噪预处理,提取不同爆源信号的短时能量特征(se)、倒谱特征系数(mfcc)、反映爆炸声谱纹理特征的hog特征、反映爆炸声谱颜分布特征的颜矩(cm)特征以获得四类融合特征,并建立信息向量机(ivm)模型的训练样本数据库d;模型训练模块:将训练数据库d中的四类融合特征训练信息向量机(ivm)模型;实时数据监测模块:实时监测爆炸声音信号,对所测爆炸声信号进行规整、并根据步骤s2中采集的环境噪声进行去噪预处理;爆炸位置预测模块:提取现场爆炸声响信号短时能量特征(se)、修正的倒谱特征系数(mfcc)、爆炸声谱纹理特征的hog特征、爆炸声谱颜分布特征的颜矩(cm)特征,将四类融合特征输入已训练的ivm模型中,预测确定爆炸位源信息;训练样本添加模块:将ivm预测结果准确的预测样本作为新的训练样本更新原训练数据库d中,重新训练ivm,再对所监测的爆炸声音进行预测。7.根据权利要求6中的一种基于声响特征的爆炸位源信息识别装置,其特征在于,原始声音信号数据库构建模块构建的原始声音信号数据库i包括以下的原始声音样本:(1)不同比例埋深的爆源所对应的爆炸声音信号;(2)在距离爆芯不同比例距离下所监测到的声音信号。8.根据权利要求6中的一种基于声响特征的爆炸位源信息识别装置,其特征在于,训练样本数据库构建模块中的四类融合特征的提取方法如下:特征提取对象为步骤s3中记录的时间-幅值原始数字信号:从原始数字信号中提取反映声音能量信息的短时能量特征(se)和反映声音信号能量特征规律的mfcc特征;将爆炸的原声声响信号绘制成时间-频率-幅值的三维爆炸声谱图,提取反映声谱纹理分布的hog纹理特征和声谱在不同频率带分布幅值大小的颜矩特征(cm);构建的训练样本数据库d如下:d=[x,y],其中,输入特征矩阵x为训练样本的输入值,输出矩阵y为训练样本的输出值,输入特征矩阵x=[x1,x2,x3,x4]由四个特征向量组成,包括x1={爆炸声响的短视能量特征(se)}、x2={梅尔倒谱特征系数(mfcc)}、x3={反映爆炸声谱纹理特征的hog特征}、x4={反映爆炸声谱颜分布特征的颜矩(cm)特征},输出特征矩阵y=[y1,y2]由两个特征向量组成,包括:y1={不同爆炸声响特征随对应的爆源比例埋深};y2={不同监测点的爆炸声
响特征距离爆源的比例距离}。9.根据权利要求8中的一种基于声响特征的爆炸位源信息识别装置,其特征在于,模型训练模块的训练方法如下:将训练数据库d中的爆炸声响信号的四类爆炸声响特征作为输入,输出矩阵y作为输出训练ivm模型,在训练过程中利用随机采样的方法将训练样本库中的数据中随机分成训练集和测试集,通过随机训练多次获得最终的ivm模型。10.根据权利要求6中的一种基于声响特征的爆炸位源信息识别装置,其特征在于,训练样本添加模块添加样本的方法为:将与真实爆炸位源信息相比,预测误差小于预设阈值的新的预测样本,作为新的训练样本加入到训练样本集合中,扩宽训练样本集合。

技术总结


本发明公开了一种基于声响特征的爆炸位源信息快速识别方法,该方法包括:S1:测定现场传播介质参数;S2:采集环境噪声;S3:将不同爆源所对应的爆炸声响信号进行收集组成原始声音信号数据库I;S4:将数据库I中信号预处理后提取短时能量特征、倒谱系数特征、爆炸声谱纹理HOG特征、爆炸声谱颜矩特征,并建立训练特征数据库D;S5:利用训练数据库D中的四类融合特征训练信息向量机模型;S6:现场实测爆炸声音信号,对信号进行预处理;S7:提取现场预处理后信号四类融合特征,输入已训练的IVM模型中,确定爆炸位源信息;S8:将IVM预测结果准确的预测样本作为新的训练样本动态更新原训练数据库D中,重新训练IVM。重新训练IVM。重新训练IVM。


技术研发人员:

黄杰 宗周红 陈振健 李佳奇 夏梦涛 李奕晖 陈烨婧

受保护的技术使用者:

东南大学

技术研发日:

2022.08.10

技术公布日:

2022/11/22

本文发布于:2024-09-20 06:53:32,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/98.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:特征   信号   声谱   样本
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议