一种声音数据的处理系统以及方法



1.本技术涉及医疗器械领域,具体涉及一种声音数据的处理系统以及方法。


背景技术:



2.目前对于肺炎的诊断,出现了以呼吸和/或咳嗽的声音特征来提供判断依据的技术。
3.然而,本技术发明人在研究中发现,现有技术中相关声音数据的采集装置依赖于面罩等设备,实际应用中使用场景存在较大的限制,且使用方式也存在着较大的不便,从而导致这类采集装置应用价值较低。


技术实现要素:



4.本技术提供了一种声音数据的处理系统以及方法,用于结合马甲来采集声音数据,并上传至服务端,从而显著扩大了使用场景,且使用上的便利性也得到了显著的提高,从而具有较高的应用价值。
5.第一方面,本技术提供了一种声音数据的处理系统,系统包括佩戴式马甲和服务端;
6.佩戴式马甲根据自身配置的声音传感器,采集佩戴自身的用户的声音,得到声音数据;
7.佩戴式马甲通过自身配置的通讯模块,将声音数据上传至服务端;
8.服务端按照预设的声音数据处理策略,对声音数据进行相应的声音数据处理。
9.结合本技术第一方面,在本技术第一方面第一种可能的实现方式中,声音传感器包括第一声音传感器,第一声音传感器设置于佩戴式马甲的上端位置。
10.结合本技术第一方面第一种可能的实现方式,在本技术第一方面第二种可能的实现方式中,第一声音传感器设置于佩戴式马甲的拉链环。
11.结合本技术第一方面,在本技术第一方面第三种可能的实现方式中,声音传感器包括多个第二声音传感器,多个第二声音传感器设置于佩戴式马甲的前侧,多个第二声音传感器按照佩戴式马甲的前侧的中心线进行对称设置。
12.结合本技术第一方面第三种可能的实现方式,在本技术第一方面第四种可能的实现方式中,多个第二声音传感器设置于佩戴式马甲对应锁骨中线的位置。
13.结合本技术第一方面,在本技术第一方面第五种可能的实现方式中,服务端按照预设的声音数据处理策略,对声音数据进行相应的声音数据处理,包括:
14.服务端通过训练方式不同的三个声音数据处理模型,分别对输入的声音数据进行相应的声音数据处理;
15.服务端融合三个声音数据处理模型分别输出的声音数据处理结果,得到最终的目标声音数据处理结果。
16.结合本技术第一方面,在本技术第一方面第六种可能的实现方式中,第一声音数
据处理模型根据分为正负两类的样本数据训练第一cnn网络分类模型得到。
17.结合本技术第一方面,在本技术第一方面第七种可能的实现方式中,第二声音数据处理模型根据肺炎严重程度进行分类的样本数据训练第二cnn网络分类模型得到。
18.结合本技术第一方面,在本技术第一方面第八种可能的实现方式中,第三声音数据处理模型根据肺炎类型进行分类的样本数据训练第三cnn网络分类模型得到。
19.第二方面,本技术提供了一种声音数据的处理方法,方法应用于声音数据的处理系统,系统包括佩戴式马甲和服务端,方法包括:
20.佩戴式马甲根据自身配置的声音传感器,采集佩戴自身的用户的声音,得到声音数据;
21.佩戴式马甲通过自身配置的通讯模块,将声音数据上传至服务端;
22.服务端按照预设的声音数据处理策略,对声音数据进行相应的声音数据处理。
23.结合本技术第一方面,在本技术第一方面第一种可能的实现方式中,声音传感器包括第一声音传感器,第一声音传感器设置于佩戴式马甲的上端位置。
24.结合本技术第一方面第一种可能的实现方式,在本技术第一方面第二种可能的实现方式中,第一声音传感器设置于佩戴式马甲的拉链环。
25.结合本技术第一方面,在本技术第一方面第三种可能的实现方式中,声音传感器包括多个第二声音传感器,多个第二声音传感器设置于佩戴式马甲的前侧,多个第二声音传感器按照佩戴式马甲的前侧的中心线进行对称设置。
26.结合本技术第一方面第三种可能的实现方式,在本技术第一方面第四种可能的实现方式中,多个第二声音传感器设置于佩戴式马甲对应锁骨中线的位置。
27.结合本技术第一方面,在本技术第一方面第五种可能的实现方式中,服务端按照预设的声音数据处理策略,对声音数据进行相应的声音数据处理,包括:
28.服务端通过训练方式不同的三个声音数据处理模型,分别对输入的声音数据进行相应的声音数据处理;
29.服务端融合三个声音数据处理模型分别输出的声音数据处理结果,得到最终的目标声音数据处理结果。
30.结合本技术第二方面,在本技术第一方面第六种可能的实现方式中,第一声音数据处理模型根据分为正负两类的样本数据训练第一cnn网络分类模型得到。
31.结合本技术第二方面,在本技术第一方面第七种可能的实现方式中,第二声音数据处理模型根据肺炎严重程度进行分类的样本数据训练第二cnn网络分类模型得到。
32.结合本技术第二方面,在本技术第一方面第八种可能的实现方式中,第三声音数据处理模型根据肺炎类型进行分类的样本数据训练第三cnn网络分类模型得到。
33.第三方面,本技术提供了一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于处理器进行加载,以执行本技术第二方面或者本技术第二方面任一种可能的实现方式提供的方法。
34.从以上内容可得出,本技术具有以下的有益效果:
35.本技术所提供的声音数据的处理系统,其包括本地的佩戴式马甲和位于远程的服务端,在用户侧由佩戴式马甲根据自身配置的声音传感器,采集佩戴自身的用户的声音,得到声音数据,并通过自身配置的通讯模块,将声音数据上传至服务端,远程侧的服务端则可
以按照预设的声音数据处理策略,对声音数据进行相应的声音数据处理,通过该系统架构,既可以通过马甲的形式方便且灵活地采集相关的声音数据,也可以交由云端的服务端执行方便维护更新的、复杂且高精度的声音数据处理,从而显著扩大了使用场景,且使用上的便利性也得到了显著的提高,从而具有较高的应用价值。
附图说明
36.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
37.图1为本技术声音数据的处理系统的一种系统架构图;
38.图2为本技术声音数据的处理系统的又一种系统架构图;
39.图3为本技术声音数据的处理方法的一种流程示意图;
40.图4为本技术处理设备的一种结构示意图。
具体实施方式
41.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
42.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。在本技术中出现的对步骤进行的命名或者编号,并不意味着必须按照命名或者编号所指示的时间/逻辑先后顺序执行方法流程中的步骤,已经命名或者编号的流程步骤可以根据要实现的技术目的变更执行次序,只要能达到相同或者相类似的技术效果即可。
43.本技术中所出现的模块的划分,是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征可以忽略,或不执行,另外,所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,模块之间的间接耦合或通信连接可以是电性或其他类似的形式,本技术中均不作限定。并且,作为分离部件说明的模块或子模块可以是也可以不是物理上的分离,可以是也可以不是物理模块,或者可以分布到多个电路模块中,可以根据实际的需要选择其中的部分或全部模块来实现本技术方案的目的。
44.首先,参阅图1,图1示出了本技术声音数据的处理系统的一种系统架构图,从图1中可以直观地看出,本技术所提供的声音数据的处理系统,主要涉及了用户侧和服务端,对应的就是佩戴式马甲和服务端。
45.其中,对于佩戴式马甲,容易理解,其为本技术专门为采集用户的相关声音所设置的马甲,马甲上在特定位置配置有相关的声音传感器,从而当用户佩戴了马甲后,在工作过程中,声音传感器可以从用户处采集到相关的声音数据,完成初始的声音数据的采集工作。
46.对于服务端,容易理解,为非用户的一侧,其一般是以云端的服务器来体现,当然,也可能是用户所在本地的工作站,如此,佩戴式马甲和服务端都位于本地,其中,此处所称的本地,在具体应用中,既可能是用户本身所在的固定地点,也可能是需要用户前往的地点。
47.此外,服务端既可能是一个设备,也可能是以设备集的方式设置,具体可以随实际需要调整。
48.应当理解的是,本技术所配置的佩戴式马甲,由于其具有高度的方便还有灵活的特性,因此可以直接设置于用户侧,大大方便了用户居家或者随身携带,并通过远程通讯与云端的服务端进行相应的数据传输,如此实现极为便利的应用场景。
49.而在本技术所提供的声音数据的处理系统的工作过程中,具体可以包括以下内容:
50.(1),佩戴式马甲根据自身配置的声音传感器,采集佩戴自身的用户的声音,得到声音数据;
51.可以理解,一方面佩戴式马甲通常可以配置为被动开机方式,当用户佩戴上马甲后,用户自身或者其他人员则可通过马甲上的相关按钮或者触摸区域进行如按压、触摸等方式的用户操作,以此唤醒马甲进入工作状态。
52.或者,马甲也可通过语音指令的方式来完成相应的人工唤醒。
53.更或者,马甲还可以通过来自服务端的远程唤醒的方式,来完成相应的唤醒。
54.另一方面,佩戴式马甲还可以配置主动开机方式,例如定时自动开机,如此定时自主进入工作状态,或者还可以配置相关的自动唤醒条件,在自身采集的相应数据的触发下,唤醒自身进行正常工作状态。
55.其中,一般优选为通过用户操作来通过被动开机方式唤醒佩戴式马甲进入正常工作状态,如此对于用户自身而言具有更为自由、灵活的选择空间,且也可能尽量地节省佩戴式马甲的能耗。
56.或者,也可以优选为联网后就通过主动开机方式唤醒佩戴式马甲进入正常工作状态。
57.而在正常工作状态中,前面已经说了,本技术所配置的佩戴式马甲,其配置有相关的声音传感器,从而可以从佩戴了马甲的用户处,将声音的自然信号转化为电信号,完成声音数据的采集,这里就涉及了声音传感器本身的模数转换的内容,考虑到不是本技术的重点,本技术对此则是不加以展开说明。
58.(2),佩戴式马甲通过自身配置的通讯模块,将声音数据上传至服务端;
59.可以理解,佩戴式马甲考虑到通讯上的便利性,一般是选用的无线通信模块,从而可以与服务端侧构建无线通讯连接,并通过该预先搭建的或者实时搭建的无线通讯连接,向服务端上传马甲通过传感器所采集到的声音数据。
60.此外,应当理解的是,该声音数据,从传感器采集到后再到传输到服务端之间,还可能涉及到相关的数据预处理,例如直接剔除异常数据,这些数据预处理一般为复杂度较
低、处理规模较小的处理内容。
61.(3),服务端按照预设的声音数据处理策略,对声音数据进行相应的声音数据处理。
62.而在通过自身与佩戴式马甲之间的通讯连接,从用户侧获取到声音数据后,服务端则可按照预先配置的声音数据处理策略,进行相应的声音数据处理。
63.举例而言,服务端可以进行数据的存储,达到本地存储的目的,以供查看、调阅。
64.服务端也可以进行转发工作,将数据转发至预设的指定设备处,供后面的指定设备进行相关的数据应用。
65.服务端甚至还可以进行相关的分析工作,以便确定当前接收到的声音数据是否符合相关的预设特征,从而可以提供相应的数据指导,以便用户或者其他人员进行用户的参考。
66.从图1所示实施例可看出,本技术所提供的声音数据的处理系统,其包括本地的佩戴式马甲和位于远程的服务端,在用户侧由佩戴式马甲根据自身配置的声音传感器,采集佩戴自身的用户的声音,得到声音数据,并通过自身配置的通讯模块,将声音数据上传至服务端,远程侧的服务端则可以按照预设的声音数据处理策略,对声音数据进行相应的声音数据处理,通过该系统架构,既可以通过马甲的形式方便且灵活地采集相关的声音数据,也可以交由云端的服务端执行方便维护更新的、复杂且高精度的声音数据处理,从而显著扩大了使用场景,且使用上的便利性也得到了显著的提高,从而具有较高的应用价值。
67.继续对上述图1所示实施例在实际应用中可能的实现方式进行详细阐述。
68.应当理解,本技术所做的佩戴式马甲的设置,是为了更好的采集声音数据,而对于佩戴式马甲的声音采集功能,其依赖的声音传感器的设置位置,本技术则是还有细节上的一系列优化设置。
69.作为一个实例,本技术所涉及的声音传感器,具体可以包括第一声音传感器,而该第一声音传感器具体则是可以设置于佩戴式马甲的上端位置,可以理解,该上端位置具体可以为马甲自身的领口位置,也可以是对应胸口、肩部等部位的位置,当第一声音传感器设置于该上端位置时,显然比较方便采集用户嘴巴发出的声音,具体则可采集到清晰的咳嗽或者呼吸的声音。
70.进一步的,作为一种适于实用的优化方案,对于该第一声音传感器,本技术具体可以配置为:第一声音传感器设置于佩戴式马甲的拉链环。
71.可以理解,本技术所配置的佩戴式马甲,可以具有拉链结构,方便用户穿戴的同时,也方便进行马甲本身在用户身上的固定(拉链拉上的时候)。
72.而对应于拉链结构,本技术则可直接将声第一声音传感器配置于该拉链结构的拉链环上,容易理解,在佩戴马甲时,拉链结构的拉链环就会随之往上拉,当佩戴好马甲后,拉链结构的拉链环通常则是拉至于拉链结构的顶部位置,该位置一般对应了用户的颈部或者胸口。
73.通过拉链环的第一声音传感器的设置,在具体应用中,则可以带来方便在马甲上布设传感器的优点,拉链环通常为硬度较高的材料制得,因此,不管是将传感器通过相应的夹持、粘贴、卡扣、焊接或者磁连接等方式都能较好地进行固定,避免了对马甲本身拉链结构以外部位的结构改造(用于布设第一传感器),从而大大降低布设第一声音传感器对于马
甲使用寿命所带来的影响,若将第一声音传感器布设于马甲本身拉链结构以外部位,则可能会加剧像一个部位处的磨损。此外对于用户嘴部发出的声音而言,拉链结构的顶部位置的第一声音传感器也能取得较佳的声音数据采集效果。
74.此外,对于本技术所涉及的声音传感器,作为又一个实例,具体也可以包括多个第二声音传感器,多个第二声音传感器设置于佩戴式马甲的前侧,多个第二声音传感器按照佩戴式马甲的前侧的中心线进行对称设置。
75.可以理解,此处对称设置的多个第二声音传感器,其所要采集声音数据的目标,主要对应的则是用户的肺部位置,如此传感器既靠近前侧,也与中心线进行对称设置,在左右两边进行声音数据的采集工作。
76.显然,若是结合了上面针对用户嘴部的第一声音传感器以及此处针对肺部的第二声音传感器,则可以采集到内容量更为丰富、详尽的声音数据。
77.此外,对于该第二声音传感器,进一步的,作为又一种适于实用的优化方案,本技术具体可以配置为:多个第二声音传感器设置于佩戴式马甲对应锁骨中线的位置。
78.可以理解,在将第二声音传感器的布设位置限定于锁骨中线的位置后,在固定下了确定位置的同时,还可以保障采集到更为清晰的、来自肺部的声音数据。
79.此外,对于上面的声音传感器,本技术进一步地还可以配置有:通过卡扣等可调整式结构,来允许调整声音传感器可以基于原特定的布设位置,进行一定距离的调整,如此可以提供小范围的自由调整空间,以便实际操作中相关人员可以根据声音数据采集效果进行位置上的小调整,从而可以取得更佳的声音数据采集效果。
80.当然,该可调整式结构还可以是通过电动的方式来完成其位置上的小调整的,通常可以由服务端通过控制指令进行调整。
81.为进一步理解以上内容中佩戴式马甲和服务端的架构设置,作为一个实例,还可结合图2示出的本技术声音数据的处理系统的一种系统架构图进行理解,在图2中,1为拉链环上设置马甲咳嗽音收集麦克风(马甲的第一声音传感器);2-7为马甲肺部听诊音听诊位点(马甲的第二声音传感器),8-9为马甲袖套孔(供用户手臂伸出),10为马甲信号传输装置(马甲的通讯模块),11为马甲信号储存收集装置(马甲相关数据的存储模块),12为医院系统信号接收器(服务端的相关网络结构),13为医院神经网络分析装置(服务端的主要处理节点),14为云端系统信号接收器(服务端的相关网络结构),15为云端系统(服务端的云服务节点)。
82.而服务端侧对于声音数据所做的声音数据处理,在具体应用中,若是涉及到较为复杂的数据处理内容,还可通过神经网络、知识图谱等技术来完成,以此达到智能化的处理特点。
83.作为又一种适于实用的实现方式,服务端按照预设的声音数据处理策略,对声音数据进行相应的声音数据处理的过程中,具体可以包括:
84.服务端通过训练方式不同的三个声音数据处理模型,分别对输入的声音数据进行相应的声音数据处理;
85.服务端融合三个声音数据处理模型分别输出的声音数据处理结果,得到最终的目标声音数据处理结果。
86.可以理解,此处实施例的目的在于,融合在不同模型的训练方式下训练得到的三
个模型,来处理得到最终的声音数据处理结果,以此避免单个的模型对部分的声音数据存在不稳定的处理精度的问题,在实际操作中,考虑了三个不同模型的处理结果,可以剔除个别异常的处理结果带来的影响,从而可以在整体层面上保障稳定且较高精度的处理效果。
87.其中,对于三个处理结果的融合,可以采用累加处理,或者也可以采用均值处理,或者也可以采用基于权重的加权处理,具体的融合策略可以随实际需要调整。
88.可以理解,其中涉及的不同训练方式,既可以涉及到训练用的样本数据的配置上存在不同,也可以涉及到模型训练框架上的不同,甚至还可以涉及到不同的初始模型,配置的不同的具体训练方式,可以随实际需要调整,本技术再次不做具体限定。
89.作为一个实例,本技术所涉及的模型的类型,具体可以是cnn网络分类模型,即,本技术所涉及的三个声音数据处理模型,都是由cnn网络分类模型训练得到的。
90.在此基础上,对于训练方式的不同,本技术具体聚焦于样本数据及其展开的处理。
91.作为又一种适于实用的实现方式,在三个声音数据处理模型中,第一声音数据处理模型具体可以根据分为正负两类的样本数据训练第一cnn网络分类模型得到。
92.可以理解,样本数据的配置,一般是人工配置的,并进行类别的分类处理。
93.正样本就是存在特定的声音数据处理目标的样本声音数据,可以识别出特定的声音特征,负样本就是未存在特定的声音数据处理目标的样本声音数据,未能识别出特定的声音特征。
94.以二分类的形式的样本数据进行第一cnn网络分类模型,从而训练得到的第一cnn网络分类模型可以得到是否存在特定声音特征的识别结果,以最初改善肺炎检测装置的目标为例,则可以得到是否得出符合肺炎的声音数据的疑似程度值。
95.其中,应当理解,此处实施例涉及的是基于cnn网络分类模型,在数据处理层面上与有无肺炎的声音数据的特征比对。
96.作为此处的一个实例,相关的训练过程具体可以包括:
97.s1:采集大量咳嗽音与肺部听诊音信号样本;
98.s2:将s1得到的咳嗽音信号样本分为正负两类:正类为肺炎患者的咳嗽音信号样本,负类为非肺炎患者的咳嗽音信号样本;
99.s3:将正负样本数据集分别随机划分为训练数据集和测试数据集,其中测试数据集占20%;
100.s4:构建一维cnn网络分类单通道模型;模型输入数据为16000*1的向量因为肺音和咳嗽音的采样速率为4khz/s,模型输出为1*2的向量(存在两种可能的结果)
101.s5:训练s4构建的cnn网络分类模型;
102.s5.1:将训练样本分批次输入到cnn网络分类模型中;
103.s5.2:训练过程中,将cnn网络分类模型输出的正负类别概率值与之前标注的结果计算损失函数,采用随机梯度下降法不断更新模型参数,损失函数如下所示:
[0104][0105]
其中,θ为模型待优化的参数,n为每一批训练样本的数量,c为分类总数(此实施例中为2),为标记的第k类值,为输出的第k类概率值;
[0106]
s5.3:经过大量迭代训练后,cnn网络分类模型输出的loss值收敛到较低,之后,每一轮迭代训练完成后,在测试集上对cnn网络分类模型进行测试;若测试准确率超过90%,则完成了整个训练过程,若测试精度没有达到要求,则回到s5.1继续训练。
[0107]
作为又一种适于实用的实现方式,在三个声音数据处理模型中,第二声音数据处理模型具体可以根据肺炎严重程度进行分类的样本数据训练第二cnn网络分类模型得到。
[0108]
与上面类似的,样本数据的配置,一般是人工配置的,并进行类别的分类处理。
[0109]
肺炎严重程度(疾病严重程度)显然就是根据预设的不同程度肺炎的声音数据的特征进行划分的,例如轻度、中度和重度三种程度,从而训练得到的第二cnn网络分类模型可以得到对应不同程度肺炎的特定声音特征的识别结果。
[0110]
其中,应当理解,此处实施例涉及的是基于cnn网络分类模型,在数据处理层面上与不同程度肺炎的声音数据的特征比对。
[0111]
作为此处的一个实例,相关的训练过程具体可以包括:
[0112]
s1:采集大量咳嗽音与肺部听诊音信号样本;
[0113]
s2:根据正规医疗机构和国际国内指南,将s1得到的咳嗽音信号样本根据严重程度分为轻度、中度、重度三类;
[0114]
s3:将样本数据集分别随机划分为训练数据集和测试数据集,其中测试数据集占20%,训练集占80%;
[0115]
s4:构建一维cnn网络分类单通道模型;模型输入数据为16000*1的向量因为肺音和咳嗽音的采样速率为4khz/s,模型输出为1*2的向量(存在三种可能的结果);
[0116]
s5:训练s4构建的cnn网络分类模型;
[0117]
s5.1:分别将三种样本数据集训练样本分批次输入到cnn网络分类模型中;
[0118]
s5.2:训练过程中,将cnn网络分类模型输出的正负类别概率值与之前标注的结果计算损失函数,采用随机梯度下降法不断更新模型参数,损失函数如下所示:
[0119][0120]
其中,θ为模型待优化的参数,n为每一批训练样本的数量,c为分类总数(此实施例中为2),为标记的第k类值,为输出的第k类概率值;
[0121]
s5.3:经过大量迭代训练后,cnn网络分类模型输出的loss值收敛到较低,之后,每一轮迭代训练完成后,分别在数据集的测试集上对cnn网络分类模型进行测试;若测试准确率超过90%,则完成了整个训练过程,若测试精度没有达到要求,则回到s5.1继续训练。
[0122]
作为又一种适于实用的实现方式,在三个声音数据处理模型中,第三声音数据处理模型具体可以根据肺炎类型进行分类的样本数据训练第三cnn网络分类模型得到。
[0123]
与上面类似的,样本数据的配置,一般是人工配置的,并进行类别的分类处理。
[0124]
肺炎类型(疾病具体类型),则是从疾病本身的类型出发,特指大类下的不同小类,如此可以对应不同的具体肺炎类型。
[0125]
其中,应当理解,此处实施例涉及的是基于cnn网络分类模型,在数据处理层面上与不同类型肺炎的声音数据的特征比对。
[0126]
作为此处的一个实例,相关的训练过程具体可以包括:
[0127]
s1:采集大量咳嗽音与肺部听诊音信号样本;
[0128]
s2:将s1得到的咳嗽音信号样本根据肺炎病因分为细菌性肺炎、病毒性肺炎、真菌性肺炎、衣原体肺炎、支原体肺炎,形成数据集。
[0129]
s3:将样本数据集分别随机划分为训练数据集和测试数据集,其中测试数据集占20%,测试集占80%;
[0130]
s4:构建一维cnn网络分类单通道模型;模型输入数据为16000*1的向量因为肺音和咳嗽音的采样速率为4khz/s,模型输出为1*2的向量(存在五种可能的结果)
[0131]
s5:训练s4构建的cnn网络分类模型;
[0132]
s5.1:分别将五种样本数据集训练样本分批次输入到cnn网络分类模型中;
[0133]
s5.2:训练过程中,将cnn网络分类模型输出的正负类别概率值与之前标注的结果计算损失函数,采用随机梯度下降法不断更新模型参数,损失函数如下所示:
[0134][0135]
其中,θ为模型待优化的参数,n为每一批训练样本的数量,c为分类总数(此实施例中为2),为标记的第k类值,为输出的第k类概率值;
[0136]
s5.3:经过大量迭代训练后,cnn网络分类模型输出的loss值收敛到较低,之后,每一轮迭代训练完成后,分别在五种样本数据集的测试集上对cnn网络分类模型进行测试;若测试准确率超过90%,则完成了整个训练过程,若测试精度没有达到要求,则回到s5.1继续训练。
[0137]
以上是本技术提供的声音数据的处理系统的介绍,在该声音数据的处理系统的基础上,本技术还从工作流程角度提出了一种声音数据的处理方法,具体的,本技术提供的声音数据的处理方法,应用于声音数据的处理系统,系统包括佩戴式马甲和服务端,参阅图3示出的本技术声音数据的处理方法的一种流程示意图,具体可以包括如下步骤s301至步骤s303:
[0138]
步骤s301,佩戴式马甲根据自身配置的声音传感器,采集佩戴自身的用户的声音,得到声音数据;
[0139]
步骤s302,佩戴式马甲通过自身配置的通讯模块,将声音数据上传至服务端;
[0140]
步骤s303,服务端按照预设的声音数据处理策略,对声音数据进行相应的声音数据处理。
[0141]
在一种具体的实现方式中,声音传感器包括第一声音传感器,第一声音传感器设置于佩戴式马甲的上端位置。
[0142]
在又一种具体的实现方式中,第一声音传感器设置于佩戴式马甲的拉链环。
[0143]
在又一种具体的实现方式中,声音传感器包括多个第二声音传感器,多个第二声音传感器设置于佩戴式马甲的前侧,多个第二声音传感器按照佩戴式马甲的前侧的中心线进行对称设置。
[0144]
在又一种具体的实现方式中,多个第二声音传感器设置于佩戴式马甲对应锁骨中线的位置。
[0145]
在又一种具体的实现方式中,服务端按照预设的声音数据处理策略,对声音数据
进行相应的声音数据处理,包括:
[0146]
服务端通过训练方式不同的三个声音数据处理模型,分别对输入的声音数据进行相应的声音数据处理;
[0147]
服务端融合三个声音数据处理模型分别输出的声音数据处理结果,得到最终的目标声音数据处理结果。
[0148]
在又一种具体的实现方式中,第一声音数据处理模型根据分为正负两类的样本数据训练第一cnn网络分类模型得到。
[0149]
在又一种具体的实现方式中,第二声音数据处理模型根据肺炎严重程度进行分类的样本数据训练第二cnn网络分类模型得到。
[0150]
在又一种具体的实现方式中,第三声音数据处理模型根据肺炎类型进行分类的样本数据训练第三cnn网络分类模型得到。
[0151]
此外,为进一步方便理解本技术所提供的声音数据的处理系统,本技术还从硬件结构角度对其中的佩戴式马甲和服务端继续介绍,具体的,可以都将系统中的设备当成一种处理设备看待,在此基础上,参阅图4,图4示出了本技术处理设备的一种结构示意图,具体的,本技术处理设备可包括处理器401、存储器402以及输入输出设备403,处理器401用于执行存储器402中存储的计算机程序时实现如图3对应实施例中对应执行主体的所执行的方法的步骤。
[0152]
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器402中,并由处理器401执行,以完成本技术。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。
[0153]
处理设备可包括,但不仅限于处理器401、存储器402、输入输出设备403。本领域技术人员可以理解,示意仅仅是处理设备的示例,并不构成对处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如处理设备还可以包括网络接入设备、总线等,处理器401、存储器402、输入输出设备403等通过总线相连。
[0154]
处理器401可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是处理设备的控制中心,利用各种接口和线路连接整个设备的各个部分。
[0155]
存储器402可用于存储计算机程序和/或模块,处理器401通过运行或执行存储在存储器402内的计算机程序和/或模块,以及调用存储在存储器402内的数据,实现计算机装置的各种功能。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据处理设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0156]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的声音数据的处理方法、处理设备的具体工作过程,可以参考如图1对应实施例中声音数据的处理系统的说明,具体在此不再赘述。
[0157]
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
[0158]
为此,本技术提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本技术如图3对应实施例中声音数据的处理方法的步骤,具体操作可参考如图3对应实施例中声音数据的处理方法的说明,在此不再赘述。
[0159]
其中,该计算机可读存储介质可以包括:只读存储器(read only memory,rom)、随机存取记忆体(random access memory,ram)、磁盘或光盘等。
[0160]
由于该计算机可读存储介质中所存储的指令,可以执行本技术如图3对应实施例中声音数据的处理方法的步骤,因此,可以实现本技术如图3对应实施例中声音数据的处理方法所能实现的有益效果,详见前面的说明,在此不再赘述。
[0161]
以上对本技术提供的声音数据的处理系统、方法以及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的核心思想;同时,对于本领域的技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。

技术特征:


1.一种声音数据的处理系统,其特征在于,所述系统包括佩戴式马甲和服务端;所述佩戴式马甲根据自身配置的声音传感器,采集佩戴自身的用户的声音,得到声音数据;所述佩戴式马甲通过自身配置的通讯模块,将所述声音数据上传至所述服务端;所述服务端按照预设的声音数据处理策略,对所述声音数据进行相应的声音数据处理。2.根据权利要求1所述的系统,其特征在于,所述声音传感器包括第一声音传感器,所述第一声音传感器设置于所述佩戴式马甲的上端位置。3.根据权利要求2所述的系统,其特征在于,所述第一声音传感器设置于所述佩戴式马甲的拉链环。4.根据权利要求1所述的系统,其特征在于,所述声音传感器包括多个第二声音传感器,所述多个第二声音传感器设置于所述佩戴式马甲的前侧,多个所述第二声音传感器按照所述佩戴式马甲的前侧的中心线进行对称设置。5.根据权利要求4所述的系统,其特征在于,所述多个第二声音传感器设置于所述佩戴式马甲对应锁骨中线的位置。6.根据权利要求1所述的系统,其特征在于,所述服务端按照预设的声音数据处理策略,对所述声音数据进行相应的声音数据处理,包括:所述服务端通过训练方式不同的三个声音数据处理模型,分别对输入的所述声音数据进行相应的声音数据处理;所述服务端融合所述三个声音数据处理模型分别输出的声音数据处理结果,得到最终的目标声音数据处理结果。7.根据权利要求6所述的系统,其特征在于,第一声音数据处理模型根据分为正负两类的样本数据训练第一cnn网络分类模型得到。8.根据权利要求6所述的系统,其特征在于,第二声音数据处理模型根据肺炎严重程度进行分类的样本数据训练第二cnn网络分类模型得到。9.根据权利要求6所述的系统,其特征在于,第三声音数据处理模型根据肺炎类型进行分类的样本数据训练第三cnn网络分类模型得到。10.一种声音数据的处理方法,其特征在于,所述方法应用于声音数据的处理系统,所述系统包括佩戴式马甲和服务端,所述方法包括:所述佩戴式马甲根据自身配置的声音传感器,采集佩戴自身的用户的声音,得到声音数据;所述佩戴式马甲通过自身配置的通讯模块,将所述声音数据上传至所述服务端;所述服务端按照预设的声音数据处理策略,对所述声音数据进行相应的声音数据处理。

技术总结


本申请提供了一种声音数据的处理系统以及方法,用于结合马甲来采集声音数据,并上传至服务端,从而显著扩大了使用场景,且使用上的便利性也得到了显著的提高,从而具有较高的应用价值。本申请提供的声音数据的处理系统,包括佩戴式马甲和服务端;佩戴式马甲根据自身配置的声音传感器,采集佩戴自身的用户的声音,得到声音数据;佩戴式马甲通过自身配置的通讯模块,将声音数据上传至服务端;服务端按照预设的声音数据处理策略,对声音数据进行相应的声音数据处理。应的声音数据处理。应的声音数据处理。


技术研发人员:

朱红玲 曾和松 黄小甫

受保护的技术使用者:

华中科技大学同济医学院附属同济医院

技术研发日:

2022.11.25

技术公布日:

2023/3/2

本文发布于:2024-09-21 16:32:41,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/66702.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:声音   数据   马甲   数据处理
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议