一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别方法及系统与流程



1.本发明涉及油气储运管道线路沿线声纹识别第三方施工机械的技术领域,特别是涉及一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别方法及系统。


背景技术:



[0002][0003]
现有技术中都是通过视频监控技术的形式,通过设置几个点位转动摄像头停留一定时间进行监视,同时需要调度人员在监控室长时间轮巡盯屏监视,发现异常现象安排人员去处理。但是,这一方式有可能导致漏报,首先是摄像头监视节点的背面无法进行有效监视,其次是人员无法24h监视屏幕,然后是轮巡摄像头较多,并不能实时全天候的监视每一个摄像头。因此,如何提供一种施工的机械声纹识别方法是本领域技术人员急需解决的技术问题。
[0004]
基于深度学习的声纹识别技术经过多年的发展,取得了非常大的进步。声纹是日常生活中最重要的交流方式,平时我们也会通过声纹来辨识一些东西、事件等。可以通过语音知道电话的另一边是谁,通过声纹感知车辆在后方逐渐靠近。且声纹信号的采集简单,声信号的传播距离也较远。在军事等国防领域,声纹识别被用于前方敌军、空中战斗机的侦查识别,在工业上用于机械设备运行状态异常的检测,因此,利用接触式传感器拾取声纹,这一识别技术在识别施工机械方面具有一定的应用前景,可以很好地识别施工机具的声音进行安全监控。


技术实现要素:



[0005]
本发明的目的是提供一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别方法及系统,本发明通过采用接触式传感器采集机械施工现场的声音,通过卷积神经网络实现声纹识别施工机械,由于施工机械的声纹在土壤中传播没有那么远,采用接触式传感器将土壤中的声音拾取,可过滤掉环境其它噪音,更好地识别施工机械。
[0006]
本发明改进了现有技术中,通过设置几个点位转动摄像头停留一定时间进行监视导致漏报,无法进行有效地监视的问题,本发明通过基于深度学习的声纹识别技术,基于预设dfcnn神经网络模型对声纹图谱的特征信息进行识别,极大地提高了识别结果的准确性,此外,通过系统全自动化控制运行,可以节省大量的人工劳动力。
[0007]
本发明改进了现有技术中,由于施工机械的声纹在土壤中传播没有那么远,导致监测提取不准确,影响识别结果的问题,本发明通过采用接触式传感器将土壤中的声音拾取,可过滤掉环境其它噪音,进而更好地识别施工机械。
[0008]
为了实现上述目的,本发明提供了如下的技术方案:
[0009]
一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别方法,包括:
[0010]
步骤s1:通过所述接触式拾音传感器采集机械施工现场的声纹数据,并得到所述
声纹数据所对应的声纹图谱;
[0011]
步骤s2:对所述声纹图谱进行预处理,去除所述声纹图谱的噪声;
[0012]
步骤s3:通过傅里叶变换提取所述声纹图谱的特征信息;
[0013]
步骤s4:通过预设dfcnn神经网络模型对所述声纹图谱的特征信息进行识别。
[0014]
在本技术的一些实施例中,所述预设dfcnn神经网络模型通过以下方法获得,包括:
[0015]
步骤s1:通过所述接触式拾音传感器采集机械施工现场的声纹数据;
[0016]
步骤s2:对采集到的所述声纹数据进行数据划分,并得到划分后的数据集,将所述数据集转换成声纹特征图谱进行目标框的标注;
[0017]
步骤s3:对所述声纹特征图谱进行预处理,去除所述声纹特征图谱的噪声,以提高清晰度;
[0018]
步骤s4:通过傅里叶变换提取所述声纹特征图谱的特征信息;
[0019]
步骤s5:通过dfcnn模型对所述声纹特征图谱的特征信息进行模型训练,并得到所述预设dfcnn神经网络模型;
[0020]
步骤s6:通过所述步骤s2中的所述数据集对所述预设dfcnn神经网络模型进行模型评估。
[0021]
在本技术的一些实施例中,所述dfcnn模型包括4个卷积层、4 个池化层、1个全连接层,中间层激活函数使用relu,最后一层使用 softmax,每个卷积层后使用批量归一化加速训练,所述dfcnn模型通过对采集到的所述声纹数据的每帧数据信息进行傅里叶变换,并将所述声纹数据转化成图像数据作为输入,将时间和频率做为所述图像数据的两个维度,然后使用3*3的卷积核对所述图像数据进行卷积,所述卷积层输出32特征,使用最大池化maxpooling提取最大参数,所述池化层输出64特征,并通过一次cnn_cell,将所述图像数据的维度减半,使得特征值变为128,并接入所述全连接层。
[0022]
在本技术的一些实施例中,设置所述卷积层的卷积核的大小为 (3,3),提取32个特征并扩充padding为1,将卷积步长设置为1,当经过一次卷积层后,所述图像数据的尺寸为 (n+2p-f+1)*(n+2p-f+1)=(n,n);
[0023]
所述池化层通过使用maxpooling方法,将pool_size的大小设置为(2,2),提取所述pool_size中最大的数字,当所述图像数据经过所述池化层后,所述图像数据的维度减半;
[0024]
将所述全连接层的每个神经元与所述全连接层相连接的前一个池化层的所有神经元进行连接,其中,每个所述神经元的激励函数使用relu函数,并将最后一层的输出值被传递到sotfmax逻辑回归进行分类。
[0025]
在本技术的一些实施例中,所述步骤s4中还包括:
[0026]
通过所述预设dfcnn神经网络模型对所述声纹图谱的特征信息进行识别时,当识别到施工机械声纹时,立即报警;
[0027]
其中,所述施工机械声纹包括挖掘机、夯土机以及穿越机的声纹数据。
[0028]
为了实现上述目的,本发明还相应地提供了一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别系统,包括:
[0029]
接触式拾音传感器,所述接触式拾音传感器用于采集机械施工现场的声纹数据;
[0030]
声纹数据处理单元,所述数据处理单元用于对所述声纹数据进行处理,并得到所述声纹数据所对应的声纹图谱;
[0031]
声纹图谱预处理单元,所述声纹图谱预处理单元用于对所述声纹图谱进行预处理,去除所述声纹图谱的噪声;
[0032]
声纹图谱处理单元,所述声纹图谱处理单元用于通过傅里叶变换提取所述声纹图谱的特征信息;
[0033]
数据信息识别单元,所述数据信息识别单元用于通过预设dfcnn 神经网络模型对所述声纹图谱的特征信息进行识别。
[0034]
在本技术的一些实施例中,所述预设dfcnn神经网络模型包括:
[0035]
采集模块,所述采集模块用于通过所述接触式拾音传感器采集机械施工现场的声纹数据;
[0036]
分类模块,所述分类模块用于对采集到的所述声纹数据进行数据划分,并得到划分后的数据集,所述分类模块还用于将所述数据集转换成声纹特征图谱进行目标框的标注;
[0037]
预处理模块,所述预处理模块用于对所述声纹特征图谱进行预处理,去除所述声纹特征图谱的噪声,以提高清晰度;
[0038]
提取模块,所述提取模块用于通过傅里叶变换提取所述声纹特征图谱的特征信息;
[0039]
训练模块,所述训练模块用于通过dfcnn模型对所述声纹特征图谱的特征信息进行模型训练,并得到所述预设dfcnn神经网络模型;
[0040]
评估模块,所述评估模块用于通过所述数据集对所述预设dfcnn 神经网络模型进行模型评估。
[0041]
在本技术的一些实施例中,所述dfcnn模型包括4个卷积层、4 个池化层、1个全连接层,中间层激活函数使用relu,最后一层使用 softmax,每个卷积层后使用批量归一化加速训练,所述dfcnn模型用于通过对采集到的所述声纹数据的每帧数据信息进行傅里叶变换,并将所述声纹数据转化成图像数据作为输入,将时间和频率做为所述图像数据的两个维度,然后使用3*3的卷积核对所述图像数据进行卷积,所述卷积层输出32特征,使用最大池化maxpooling提取最大参数,所述池化层输出64特征,并通过一次cnn_cell,将所述图像数据的维度减半,使得特征值变为128,并接入所述全连接层。
[0042]
在本技术的一些实施例中,所述卷积层的卷积核的大小为(3,3),提取32个特征并扩充padding为1,将卷积步长设置为1,当经过一次卷积层后,所述图像数据的尺寸为(n+2p-f+1)*(n+2p-f+1)=(n,n);
[0043]
所述池化层用于通过使用maxpooling方法,将pool_size的大小设置为(2,2),提取所述pool_size中最大的数字,当所述图像数据经过所述池化层后,所述图像数据的维度减半;
[0044]
所述全连接层的每个神经元与所述全连接层相连接的前一个池化层的所有神经元进行连接,其中,每个所述神经元的激励函数使用 relu函数,并将最后一层的输出值被传递到sotfmax逻辑回归进行分类。
[0045]
在本技术的一些实施例中,所述数据信息识别单元中还包括:
[0046]
报警单元,所述报警单元用于当所述数据信息识别单元通过所述预设dfcnn神经网络模型对所述声纹图谱的特征信息进行识别时,当识别到施工机械声纹时,立即报警;
[0047]
其中,所述施工机械声纹包括挖掘机、夯土机以及穿越机的声纹数据。
[0048]
本发明提供了一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别方法及系统,与现有技术相比,其有益效果在于:
[0049]
本发明通过采用接触式拾音传感器采集施工机械声音信号样本,采用傅里叶变换提取施工机械声纹的频谱特征,标记后训练dfcnn模型,形成训练好的多分类器,然后对声纹进行智能实时检测,基于dfcnn 智能识别施工机械声纹的算法,可以有效实现对于其它声纹的过滤,当识别到施工机械声纹后实时报警,进而降低管道第三方破坏的安全风险。本发明实施后可以在全国的油气管道现场实现施工机械的智能识别,对第三方施工机械进行自动识别报警,实现智能化安全管控。
附图说明
[0050]
图1是本发明的基于接触式拾音传感器的卷积神经网络施工的机械声纹识别方法的流程图;
[0051]
图2是本发明的预设dfcnn神经网络模型获得方法的流程图;
[0052]
图3是本发明的基于接触式拾音传感器的卷积神经网络施工的机械声纹识别系统的功能框图。
具体实施方式
[0053]
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
[0054]
在本技术的描述中,需要理解的是,术语“中心”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本技术的限制。
[0055]
术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。
[0056]
在本技术的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内侧的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本技术中的具体含义。
[0057]
现有技术中对施工的机械声纹识别都是通过视频监控技术的形式,通过设置几个点位转动摄像头停留一定时间进行监视,同时需要调度人员在监控室长时间轮巡盯屏监视,发现异常现象安排人员去处理。但是,这一方式有可能导致漏报,首先是摄像头监视节点的背面无法进行有效监视,其次是人员无法24h监视屏幕,然后是轮巡摄像头较多,并不
能实时全天候的监视每一个摄像头。因此,如何提供一种施工的机械声纹识别方法是本领域技术人员急需解决的技术问题。
[0058]
因此,本发明提供了一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别方法及系统,本发明通过采用接触式传感器采集机械施工现场的声音,通过卷积神经网络实现声纹识别施工机械,由于施工机械的声纹在土壤中传播没有那么远,采用接触式传感器将土壤中的声音拾取,可过滤掉环境其它噪音,更好地识别施工机械。
[0059]
参阅图1所示,本发明的公开实施例提供了一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别方法,包括:
[0060]
步骤s1:通过接触式拾音传感器采集机械施工现场的声纹数据,并得到声纹数据所对应的声纹图谱;
[0061]
步骤s2:对声纹图谱进行预处理,去除声纹图谱的噪声;
[0062]
步骤s3:通过傅里叶变换提取声纹图谱的特征信息;
[0063]
步骤s4:通过预设dfcnn神经网络模型对声纹图谱的特征信息进行识别。
[0064]
可以理解的是,接触式拾音传感器可以埋到土壤中,也可以固定设置于施工现场的固定位置,在此,不做具体限定,本发明通过接触式拾音传感器可以很好地拾取施工机械的声纹,实现实时监控。
[0065]
在本技术的一种具体实施例中,参阅图2所示,预设dfcnn神经网络模型通过以下方法获得,包括:
[0066]
步骤s1:通过接触式拾音传感器采集机械施工现场的声纹数据;
[0067]
步骤s2:对采集到的声纹数据进行数据划分,并得到划分后的数据集,将数据集转换成声纹特征图谱进行目标框的标注;
[0068]
步骤s3:对声纹特征图谱进行预处理,去除声纹特征图谱的噪声,以提高清晰度;
[0069]
步骤s4:通过傅里叶变换提取声纹特征图谱的特征信息;
[0070]
步骤s5:通过dfcnn模型对声纹特征图谱的特征信息进行模型训练,并得到预设dfcnn神经网络模型;
[0071]
步骤s6:通过步骤s2中的数据集对预设dfcnn神经网络模型进行模型评估。
[0072]
可以理解的是,本发明通过接触式拾音传感器采集施工机械声音信号样本,采用傅里叶变换,提取施工机械声纹的频谱特征,标记后训练dfcnn模型,形成训练好的多分类器,然后对声纹进行智能实时检测,可以有效地对其它声纹进行过滤,当识别到施工机械声纹后实时报警,降低管道第三方破坏的安全风险。
[0073]
在本技术的一种具体实施例中,dfcnn模型包括4个卷积层、4个池化层、1个全连接层,中间层激活函数使用relu,最后一层使用 softmax,每个卷积层后使用批量归一化加速训练,dfcnn模型通过对采集到的声纹数据的每帧数据信息进行傅里叶变换,并将声纹数据转化成图像数据作为输入,将时间和频率做为图像数据的两个维度,然后使用3*3的卷积核对图像数据进行卷积,卷积层输出32特征,使用最大池化maxpooling提取最大参数,池化层输出64特征,并通过一次cnn_cell,将图像数据的维度减半,使得特征值变为128,并接入全连接层。
[0074]
在本技术的一种具体实施例中,设置卷积层的卷积核的大小为 (3,3),提取32个特征并扩充padding为1,将卷积步长设置为1,当经过一次卷积层后,图像数据的尺寸为(n+
2p-f+1)*(n+2p-f+1)=(n, n);
[0075]
池化层通过使用maxpooling方法,将pool_size的大小设置为 (2,2),提取pool_size中最大的数字,当图像数据经过池化层后,图像数据的维度减半;
[0076]
将全连接层的每个神经元与全连接层相连接的前一个池化层的所有神经元进行连接,其中,每个神经元的激励函数使用relu函数,并将最后一层的输出值被传递到sotfmax逻辑回归进行分类。
[0077]
在本技术的一种具体实施例中,步骤s4中还包括:
[0078]
通过预设dfcnn神经网络模型对声纹图谱的特征信息进行识别时,当识别到施工机械声纹时,立即报警;
[0079]
其中,施工机械声纹包括挖掘机、夯土机以及穿越机的声纹数据。
[0080]
基于相同的技术构思,参阅图3所示,本发明还相应地提供了一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别系统,包括:
[0081]
接触式拾音传感器,接触式拾音传感器用于采集机械施工现场的声纹数据;
[0082]
声纹数据处理单元,数据处理单元用于对声纹数据进行处理,并得到声纹数据所对应的声纹图谱;
[0083]
声纹图谱预处理单元,声纹图谱预处理单元用于对声纹图谱进行预处理,去除声纹图谱的噪声;
[0084]
声纹图谱处理单元,声纹图谱处理单元用于通过傅里叶变换提取声纹图谱的特征信息;
[0085]
数据信息识别单元,数据信息识别单元用于通过预设dfcnn神经网络模型对声纹图谱的特征信息进行识别。
[0086]
可以理解的是,接触式拾音传感器可以埋到土壤中,也可以固定设置于施工现场的固定位置,在此,不做具体限定,本发明通过接触式拾音传感器可以很好地拾取施工机械的声纹,实现实时监控。
[0087]
在本技术的一种具体实施例中,预设dfcnn神经网络模型包括:
[0088]
采集模块,采集模块用于通过接触式拾音传感器采集机械施工现场的声纹数据;
[0089]
分类模块,分类模块用于对采集到的声纹数据进行数据划分,并得到划分后的数据集,分类模块还用于将数据集转换成声纹特征图谱进行目标框的标注;
[0090]
预处理模块,预处理模块用于对声纹特征图谱进行预处理,去除声纹特征图谱的噪声,以提高清晰度;
[0091]
提取模块,提取模块用于通过傅里叶变换提取声纹特征图谱的特征信息;
[0092]
训练模块,训练模块用于通过dfcnn模型对声纹特征图谱的特征信息进行模型训练,并得到预设dfcnn神经网络模型;
[0093]
评估模块,评估模块用于通过数据集对预设dfcnn神经网络模型进行模型评估。
[0094]
可以理解的是,本发明通过接触式拾音传感器采集施工机械声音信号样本,采用傅里叶变换,提取施工机械声纹的频谱特征,标记后训练dfcnn模型,形成训练好的多分类器,然后对声纹进行智能实时检测,可以有效地对其它声纹进行过滤,当识别到施工机械声纹后实时报警,降低管道第三方破坏的安全风险。
[0095]
在本技术的一种具体实施例中,dfcnn模型包括4个卷积层、4个池化层、1个全连接
层,中间层激活函数使用relu,最后一层使用 softmax,每个卷积层后使用批量归一化加速训练,dfcnn模型用于通过对采集到的声纹数据的每帧数据信息进行傅里叶变换,并将声纹数据转化成图像数据作为输入,将时间和频率做为图像数据的两个维度,然后使用3*3的卷积核对图像数据进行卷积,卷积层输出32特征,使用最大池化maxpooling提取最大参数,池化层输出64特征,并通过一次cnn_cell,将图像数据的维度减半,使得特征值变为128,并接入全连接层。
[0096]
在本技术的一种具体实施例中,卷积层的卷积核的大小为(3,3),提取32个特征并扩充padding为1,将卷积步长设置为1,当经过一次卷积层后,图像数据的尺寸为(n+2p-f+1)*(n+2p-f+1)=(n,n);
[0097]
池化层用于通过使用maxpooling方法,将pool_size的大小设置为(2,2),提取pool_size中最大的数字,当图像数据经过池化层后,图像数据的维度减半;
[0098]
全连接层的每个神经元与全连接层相连接的前一个池化层的所有神经元进行连接,其中,每个神经元的激励函数使用relu函数,并将最后一层的输出值被传递到sotfmax逻辑回归进行分类。
[0099]
在本技术的一种具体实施例中,数据信息识别单元中还包括:
[0100]
报警单元,报警单元用于当数据信息识别单元通过预设dfcnn神经网络模型对声纹图谱的特征信息进行识别时,当识别到施工机械声纹时,立即报警;
[0101]
其中,施工机械声纹包括挖掘机、夯土机以及穿越机的声纹数据。
[0102]
根据本发明的第一构思,本发明通过基于深度学习的声纹识别技术,基于预设dfcnn神经网络模型对声纹图谱的特征信息进行识别,极大地提高了识别结果的准确性,此外,通过系统全自动化控制运行,可以节省大量的人工劳动力。
[0103]
根据本发明的第二构思,本发明通过采用接触式传感器将土壤中的声音拾取,可过滤掉环境其它噪音,进而更好地识别施工机械。。
[0104]
基于深度学习的声纹识别技术经过多年的发展,取得了非常大的进步,在工业上用于机械设备运行状态异常的检测,因此,利用接触式传感器拾取声纹,这一识别技术在识别施工机械方面具有一定的应用前景,可以很好地识别施工机具的声音进行安全监控。综上所述,本发明所提供的一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别方法及系统,通过采用接触式拾音传感器采集施工机械声音信号样本,采用傅里叶变换提取施工机械声纹的频谱特征,标记后训练dfcnn模型,形成训练好的多分类器,然后对声纹进行智能实时检测,基于dfcnn智能识别施工机械声纹的算法,可以有效实现对于其它声纹的过滤,当识别到施工机械声纹后实时报警,进而降低管道第三方破坏的安全风险。
[0105]
以上所述仅为本发明的一个实施例子,但不能以此限制本发明的范围,凡依据本发明所做的结构上的变化,只要不失本发明的要义所在,都应视为落入本发明保护范围之内受到制约。
[0106]
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0107]
需要说明的是,上述实施例提供的系统,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,
也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。
[0108]
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的模块、方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,软件模块、方法步骤对应的程序可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0109]
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
[0110]
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
[0111]
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

技术特征:


1.一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别方法,其特征在于,包括:步骤s1:通过所述接触式拾音传感器采集机械施工现场的声纹数据,并得到所述声纹数据所对应的声纹图谱;步骤s2:对所述声纹图谱进行预处理,去除所述声纹图谱的噪声;步骤s3:通过傅里叶变换提取所述声纹图谱的特征信息;步骤s4:通过预设dfcnn神经网络模型对所述声纹图谱的特征信息进行识别。2.根据权利要求1所述的一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别方法,其特征在于,所述预设dfcnn神经网络模型通过以下方法获得,包括:步骤s1:通过所述接触式拾音传感器采集机械施工现场的声纹数据;步骤s2:对采集到的所述声纹数据进行数据划分,并得到划分后的数据集,将所述数据集转换成声纹特征图谱进行目标框的标注;步骤s3:对所述声纹特征图谱进行预处理,去除所述声纹特征图谱的噪声,以提高清晰度;步骤s4:通过傅里叶变换提取所述声纹特征图谱的特征信息;步骤s5:通过dfcnn模型对所述声纹特征图谱的特征信息进行模型训练,并得到所述预设dfcnn神经网络模型;步骤s6:通过所述步骤s2中的所述数据集对所述预设dfcnn神经网络模型进行模型评估。3.根据权利要求2所述的一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别方法,其特征在于,所述dfcnn模型包括4个卷积层、4个池化层、1个全连接层,中间层激活函数使用relu,最后一层使用softmax,每个卷积层后使用批量归一化加速训练,所述dfcnn模型通过对采集到的所述声纹数据的每帧数据信息进行傅里叶变换,并将所述声纹数据转化成图像数据作为输入,将时间和频率做为所述图像数据的两个维度,然后使用3*3的卷积核对所述图像数据进行卷积,所述卷积层输出32特征,使用最大池化maxpooling提取最大参数,所述池化层输出64特征,并通过一次cnn_cell,将所述图像数据的维度减半,使得特征值变为128,并接入所述全连接层。4.根据权利要求3所述的一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别方法,其特征在于,设置所述卷积层的卷积核的大小为(3,3),提取32个特征并扩充padding为1,将卷积步长设置为1,当经过一次卷积层后,所述图像数据的尺寸为(n+2p-f+1)*(n+2p-f+1)=(n,n);所述池化层通过使用maxpooling方法,将pool_size的大小设置为(2,2),提取所述pool_size中最大的数字,当所述图像数据经过所述池化层后,所述图像数据的维度减半;将所述全连接层的每个神经元与所述全连接层相连接的前一个池化层的所有神经元进行连接,其中,每个所述神经元的激励函数使用relu函数,并将最后一层的输出值被传递到sotfmax逻辑回归进行分类。5.根据权利要求1所述的一种基于接触式拾音传感器的卷积神经网络施工的机械声纹
识别方法,其特征在于,所述步骤s4中还包括:通过所述预设dfcnn神经网络模型对所述声纹图谱的特征信息进行识别时,当识别到施工机械声纹时,立即报警;其中,所述施工机械声纹包括挖掘机、夯土机以及穿越机的声纹数据。6.一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别系统,其特征在于,包括:接触式拾音传感器,所述接触式拾音传感器用于采集机械施工现场的声纹数据;声纹数据处理单元,所述数据处理单元用于对所述声纹数据进行处理,并得到所述声纹数据所对应的声纹图谱;声纹图谱预处理单元,所述声纹图谱预处理单元用于对所述声纹图谱进行预处理,去除所述声纹图谱的噪声;声纹图谱处理单元,所述声纹图谱处理单元用于通过傅里叶变换提取所述声纹图谱的特征信息;数据信息识别单元,所述数据信息识别单元用于通过预设dfcnn神经网络模型对所述声纹图谱的特征信息进行识别。7.根据权利要求6所述的一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别系统,其特征在于,所述预设dfcnn神经网络模型包括:采集模块,所述采集模块用于通过所述接触式拾音传感器采集机械施工现场的声纹数据;分类模块,所述分类模块用于对采集到的所述声纹数据进行数据划分,并得到划分后的数据集,所述分类模块还用于将所述数据集转换成声纹特征图谱进行目标框的标注;预处理模块,所述预处理模块用于对所述声纹特征图谱进行预处理,去除所述声纹特征图谱的噪声,以提高清晰度;提取模块,所述提取模块用于通过傅里叶变换提取所述声纹特征图谱的特征信息;训练模块,所述训练模块用于通过dfcnn模型对所述声纹特征图谱的特征信息进行模型训练,并得到所述预设dfcnn神经网络模型;评估模块,所述评估模块用于通过所述数据集对所述预设dfcnn神经网络模型进行模型评估。8.根据权利要求7所述的一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别系统,其特征在于,所述dfcnn模型包括4个卷积层、4个池化层、1个全连接层,中间层激活函数使用relu,最后一层使用softmax,每个卷积层后使用批量归一化加速训练,所述dfcnn模型用于通过对采集到的所述声纹数据的每帧数据信息进行傅里叶变换,并将所述声纹数据转化成图像数据作为输入,将时间和频率做为所述图像数据的两个维度,然后使用3*3的卷积核对所述图像数据进行卷积,所述卷积层输出32特征,使用最大池化maxpooling提取最大参数,所述池化层输出64特征,并通过一次cnn_cell,将所述图像数据的维度减半,使得特征值变为128,并接入所述全连接层。9.根据权利要求8所述的一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别系统,其特征在于,
所述卷积层的卷积核的大小为(3,3),提取32个特征并扩充padding为1,将卷积步长设置为1,当经过一次卷积层后,所述图像数据的尺寸为(n+2p-f+1)*(n+2p-f+1)=(n,n);所述池化层用于通过使用maxpooling方法,将pool_size的大小设置为(2,2),提取所述pool_size中最大的数字,当所述图像数据经过所述池化层后,所述图像数据的维度减半;所述全连接层的每个神经元与所述全连接层相连接的前一个池化层的所有神经元进行连接,其中,每个所述神经元的激励函数使用relu函数,并将最后一层的输出值被传递到sotfmax逻辑回归进行分类。10.根据权利要求6所述的一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别系统,其特征在于,所述数据信息识别单元中还包括:报警单元,所述报警单元用于当所述数据信息识别单元通过所述预设dfcnn神经网络模型对所述声纹图谱的特征信息进行识别时,当识别到施工机械声纹时,立即报警;其中,所述施工机械声纹包括挖掘机、夯土机以及穿越机的声纹数据。

技术总结


本发明涉及油气储运管道线路沿线声纹识别第三方施工机械的技术领域,特别是涉及一种基于接触式拾音传感器的卷积神经网络施工的机械声纹识别方法及系统。包括:步骤S1:通过接触式拾音传感器采集机械施工现场的声纹数据,并得到声纹数据所对应的声纹图谱;步骤S2:对声纹图谱进行预处理,去除声纹图谱的噪声,并提高清晰度;步骤S3:通过傅里叶变换提取声纹图谱的特征信息;步骤S4:通过预设DFCNN神经网络模型对声纹图谱的特征信息进行识别。本发明通过采用接触式传感器将土壤中的声音拾取,可过滤掉环境其它噪音,更好地识别施工机械。更好地识别施工机械。更好地识别施工机械。


技术研发人员:

赵云峰 姜有文 李荣光 张巍 王禹钦 蔡培培

受保护的技术使用者:

国家管网集团北方管道有限责任公司

技术研发日:

2022.10.25

技术公布日:

2023/2/3

本文发布于:2024-09-22 14:31:59,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/60919.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   卷积   图谱   数据
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议