流调信息处理方法及装置、存储介质、电子设备与流程



1.本公开涉及计算机技术领域,具体而言,涉及一种流调信息处理方法、流调信息处理装置、计算机可读存储介质以及电子设备。


背景技术:



2.传染疾病发生之后,对感染病例及其关联病例进行流调对传染疾病的防控具有极其重要的意义。
3.相关技术中,一般主要是流调人员与感染病例及其关联病例进行对话,在对话的过程中人工提取特征信息,并根据特征信息人工整理成流调报告。在上述方式中,由于是通过人工操作完成,操作步骤较繁琐且操作效率较低,及时性较差。
4.需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现要素:



5.本公开提供一种流调信息处理方法及装置、计算机可读存储介质和电子设备,进而至少在一定程度上克服相关技术中流调信息的生成效率低的问题。
6.本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
7.根据本公开的一个方面,提供一种流调信息处理方法,包括:响应发送端发送的采访者与目标对象的对话请求,基于外置设备获取所述对话请求中的第一输入音频流;获取所述采访者的第二输入音频流;将所述第一输入音频流与所述第二输入音频流进行合并,获取混合音频流;对所述混合音频流进行结构化处理确定特征信息,并结合模板信息以及所述特征信息确定所述目标对象的流调信息。
8.在本公开的一种示例性实施例中,所述基于外置设备获取所述对话请求中的第一输入音频流,包括:获取多个音频输入源的音频流,所述音频流包括第一类型标识和第二类型标识,其中,所述第一类型标识用于确定第二输入音频流,所述第二类型标识用于确定第一输入音频流;通过所述第一类型标识对所述多个音频输入源的音频流进行筛选,以从所述音频流中确定第二输入音频流;确定所述第二输入音频流的第二类型标识的值,并将与所述第二类型标识的值不同的音频流确定为所述外置设备的所述第一输入音频流。
9.在本公开的一种示例性实施例中,在将所述第一输入音频流与所述第二输入音频流进行合并,获取混合音频流之前,所述方法还包括:根据所述第二类型标识将所述第一输入音频流和/或所述第二输入音频流中相同的音频流确定为重复音频流,并对所述重复音频流进行过滤操作。
10.在本公开的一种示例性实施例中,所述将所述第一输入音频流与所述第二输入音频流进行合并,获取混合音频流,包括:按照时间顺序将所述第一输入音频流与所述第二输入音频流进行合并,以获取所述混合音频流。
11.在本公开的一种示例性实施例中,在将所述第一输入音频流与所述第二输入音频流进行合并,获取混合音频流之前,所述方法还包括:对所述第一输入音频流和所述第二输入音频流中,满足音频条件的实时音频参数进行音效调整操作,以调整所述第一输入音频流和所述第二输入音频流。
12.在本公开的一种示例性实施例中,所述对所述混合音频流进行结构化处理确定特征信息,并结合模板信息以及所述特征信息确定所述目标对象的流调信息,包括:获取与所述混合音频流对应的音频数据;
13.将所述音频数据转换为文字信息,对所述文字信息进行特征信息提取,并通过模板信息对所述特征信息进行填充操作以生成所述流调信息。
14.在本公开的一种示例性实施例中,所述获取与所述混合音频流对应的音频数据,包括:若所述对话请求对应的场景为第一类型场景,按照录音参数对所述混合音频流进行录音操作,得到与语音识别需求匹配的音频数据;所述音频参数包括录音格式、采样率、采样位深度以及通道数中的一种或其组合;若所述对话请求对应的场景为第二类型场景,将所述混合音频流作为所述音频数据。
15.根据本公开的一个方面,提供一种流调信息处理装置,包括:第一音频流获取模块,用于响应发送端发送的采访者与目标对象的对话请求,基于外置设备获取所述对话请求中的第一输入音频流;第二音频流获取模块,用于获取所述采访者的第二输入音频流;音频合并模块,用于将所述第一输入音频流与所述第二输入音频流进行合并,获取混合音频流;流调信息生成模块,用于对所述混合音频流进行结构化处理确定特征信息,并结合模板信息以及所述特征信息确定所述目标对象的流调信息。
16.根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的流调信息处理方法。
17.根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的流调信息处理方法。
18.本公开实施例中提供的流调信息处理方法、流调信息处理装置、计算机可读存储介质以及电子设备,基于外置设备从与目标对象关联的对话请求的信息中获取对应的第一输入音频流,并将第一输入音频流和采访者的第二输入音频流合并成混合音频流,进而结合模板信息以及混合音频流对应的特征信息确定流调信息。一方面,接收端接收外置设备发送的采访者与目标对象的对话请求中的第一输入音频流以及接收采访者的第二输入音频流,进而生成混合音频流,根据模板信息以及混合音频流的特征信息来自动生成流调信息,实现自动化生成流调信息的过程,减少了人工操作时的操作步骤,提高了流调信息的生成效率,提高了及时性。另一方面,可以基于外置设备在对话请求中提取出第一输入音频流,接收端接收外置设备发送的对话请求的第一输入音频流以及接收自带麦克风输入的第二输入音频流,进而根据第一输入音频流和第二输入音频流生成的混合音频流来生成流调信息,由于外置设备能够安装于接收端,配件简单且便于配置,提高了流调操作的便携性和灵活性,并且能够进行大规模推广,增加了应用范围和可执行性。
19.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
20.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施方式,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
21.图1示意性示出本公开实施例用于实现流调信息处理方法的系统架构图。
22.图2示意性示出本公开实施例中一种流调信息处理方法的示意图。
23.图3示意性示出本公开实施例中进行音频流处理的架构示意图。
24.图4示意性示出本公开实施例中进行音频流合并的流程示意图。
25.图5示意性示出本公开实施例中生成流调信息的流程示意图。
26.图6示意性示出本公开实施例中进行电话流调的流程示意图。
27.图7示意性示出本公开实施例中流调信息处理装置的框图。
28.图8示意性示出本公开实施例中一种电子设备的框图。
具体实施方式
29.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
30.此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
31.本公开实施例中提供了一种流调信息处理方法。图1示出了可以应用本公开实施例的技术方案的示例性系统架构的示意图。
32.如图1所示,系统架构100可以包括发送端101、外置设备102、接收端103。其中,发送端可以为智能手机、平板电脑、智能手表、智能手环、智能音箱等能够进行对话或通话的终端设备。外置设备102用以对发送端101和接收端103进行通信连接。外置设备用于获取发送端发送的采访者与目标对象的对话请求,将对话请求中的信息作为自身的第一输入音频流,并将第一输入音频流发送至接收端。在本公开实施例中,发送端101和接收端103之间的外置设备102可以是usb外置声卡。发送端101和外置设备102之间通过音频线连接。接收端103可以是具有计算功能的终端设备,例如便携式计算机、台式计算机、智能手机等具有计算功能的终端设备,用于对发送端发送的数据等进行处理。
33.本公开实施例中,发送端101用于获取对话请求中的信息,外置设备102安装于接
收端上。外置设备用于将发送端中的信息传输到接收端上,外置设备通过音频线与发送端连接,且在连接完成后通过外置设备建立发送端与接收端之间的通信连接,将发送端的对话请求的信息导入到接收端的输入端。接收端103用于接收外置设备102发送的对话请求的第一输入音频流以及接收自带麦克风输入的第二输入音频流,并将第一输入音频流和第二输入音频流进行合并得到混合音频流。进一步地,接收端103还将混合音频流进行结构化处理获取特征信息,并结合模板信息以及特征信息自动生成与目标对象对应的流调信息。
34.需要说明的是,本公开实施例所提供的流调信息处理方法可以由接收端执行,具体可以根据接收端上存储的计算机程序实现。
35.基于上述系统架构,本公开实施例中提供了一种流调信息处理方法,应用于接收端,用于在通话场景中通过外置设备以及接收端实现自动化流调。参考图2中所示,该流调信息处理方法包括步骤s210至步骤s230,详细介绍如下:
36.在步骤s210中,响应发送端发送的采访者与目标对象的对话请求,基于外置设备获取所述对话请求中的第一输入音频流。
37.本公开实施例中,目标对象可以为与应用场景关联的对象,具体可以根据应用场景的不同而不同。当应用场景为传染疾病的流调场景时,目标对象可以为与传染疾病关联的人员,例如确诊传染疾病的病例或者是接触传染疾病的人员等等。当应用场景为问卷调查或者是电话回访时,目标对象可以为问卷调查以及电话回访关联的用户,例如使用某个产品的用户。此处以应用场景为传染疾病的流调场景为例进行说明。传染疾病可以为具有传染性的疾病(传染病),例如可以为各种类型的疫情或者是各种具有传染性的流感等等。传染疾病可以针对某一个区域而言,也可以针对所有区域而言,此处不做限定。单位时间例如可以为每天,也可以为每两天或者是每周等等。
38.对话请求可以基于发送端而建立,发送端可以通过视频对话、电话通话、语音对话、即时通信应用程序对话等方式,使得采访者与目标对象建立对话请求。举例而言,如果检测到采访者的终端1(发送端)通过电话通话方式与目标对象的终端2进行通信连接,则可以认为检测到发送端建立的采访者与目标对象的对话请求。在对话过程中,发送端可以播放和输出对话请求的信息,对话请求的信息可以包含任意类型的与目标对象关联的信息,例如目标对象的姓名、电话、年龄、身份信息、位置信息、历史轨迹信息以及防护信息(是否注射疫苗、是否戴口罩、是否配戴防护物品)等等。
39.在检测到对话请求后,外置设备可以将对话请求的信息导入至接收端。外置设备可以为外置声卡,即通过接口和主板连接的声卡,例如可以为直接插在usb接口上的usb外置声卡。外置声卡的第一端与音频线连接,用于通过音频线连接至发送端;外置声卡的第二端与接收端连接,用于将发送端的对话请求的信息导入至接收端。如图3中所示的架构图,电脑(接收端)303上连接好usb外置声卡302。手机(发送端)301连接上手机音频线304,手机音频线304的输出端插入外置声卡的mic输入接口。其中,外置声卡不能用耳麦一体的接口,需要使用独立的麦克风输入接口。
40.在通过外置设备将发送端和接收端建立通信连接之后,可以通过外置设备将对话请求中的第一输入音频流,传输到接收端的输入端作为接收端的输入信息。该过程可以通过多种编程语言可以实现,此处以网页端javascript语言进行举例说明。
41.在一些实施例中,可以通过标识信息来确定基于外置设备获取的第一输入音频流
以及第二输入音频流。其中可以通过第一类型标识和第二类型标识来确定第一输入音频流和第二输入音频流。具体地,可以通过接口获取多个音频输入源的音频流,并通过第一类型标识对所述多个音频输入源的音频流进行筛选,以从所述音频流中确定第二输入音频流;在区分出第二输入音频流之后,可获取第二输入音频流的第二类型标识,确定所述第二输入音频流的第二类型标识的值,并将与第二类型标识的值不同的音频流确定为所述外置设备获取的所述第一输入音频流。其中,每个音频流均可包括第一类型标识和第二类型标识。第一类型标识可以为输入设备源标识deviceid,用于标识音频流是否属于自带麦克风输入的,即,第一类型标识用于确定音频流是否属于第二输入音频流。第二类型标识的标识含义与第一类型标识不同。例如,第二类型标识可以为groupid,groupid代表的是组标识符,用于区分音频流是本身自带麦克风输入还是外置设备输入,即第二类型标识用于确定音频流是否属于第一输入音频流。
42.通过浏览器提供的接口web audio api,可以获取到所有的音频输入源。若某个音频输入源的第一类型标识即输入设备源标识deviceid为目标值default,则确定该音频输入源是接收端自带的mic输入源,可认为该音频输入源的音频流为第二输入音频流。在确定接收端自带的mic输入之后,可以基于第二类型标识对多个音频输入源的音频流继续进行筛选,以确定外置设备获取的第一输入音频流。示例性地,可以将多个音频输入源的音频流中与上述第二类型标识的值不同的音频流,确定为所述外置设备的所述第一输入音频流。当确定第二输入音频流后进而确定第二输入音频流的第二类型标识的值;当出现与第二类型标识的值不同的音频流,则认为该音频流为外置设备获取的第一输入音频流。即,将第二类型标识与接收端自带麦克风输入的第二类型标识不同的音频流确定为外置设备发送的第一输入音频流。在一些实施例中,通过比对第二类型标识groupid,将第二类型标识groupid和接收端自带的mic输入的groupid值不同的音频输入,确定为外置设备的音频输入。通过第一类型标识和第二类型标识,能够准确地区分出音频流的类型和来源。
43.在步骤s220中,获取所述采访者的第二输入音频流。
44.本公开实施例中,采访者可以为流调人员,也可以为智能助理或智能机器人等等,只要能够对目标对象进行通话流调即可。第二输入音频流可以通过接收端自带麦克风输入,即第二输入音频流可为采访者自身的音频流,且第二输入音频流在对话过程中,可以直接存储至接收端。第二输入音频流可以为与对话请求相关的音频流,也可以为对话请求不相关的音频流,此处不作限定,只要是对话请求过程中采访者的音频流即可。
45.举例而言,采访者a对目标对象b发送对话请求,则第一输入音频流可以为外置设备发送的对话请求中的音频流,可以包括采访者a与目标对象b的音频流;第二输入音频流可以为采访者a通过接收端自带麦克风输入的音频流。
46.在此基础上,可通过外置设备获取对话请求中的第一输入音频流,并通过外置设备将第一输入音频流发送至接收端。接收端用于接收外置设备发送的对话请求的第一输入音频流以及接收自带麦克风输入的第二输入音频流。在发送端与接收端通过外置设备建立通信连接之后,手机(发送端)上的音频输出,在电脑(接收端)上通过扬声器或者耳机可以播放输出。
47.参考图3中所示,电脑303上连接好usb外置声卡302。手机301通过手机音频线304与外置声卡通信连接,手机音频线304的输出端插入外置声卡的mic输入接口,从而实现发
送端与接收端之间的通信连接。流调人员(采访者)通过手机与目标对象进行对话请求的过程中,对话请求的信息通过手机音频线流出,进而通过外置声卡发送至电脑中自带的扬声器或者是耳机音频输出接口进行输出,以使电脑接收到通过外置设备发送的对话请求中的第一输入音频流。与此同时,流调人员(采访者)的声音通过电脑自带mic(microphone,麦克风)接口输入电脑,以使电脑接收到第二输入音频流。
48.继续参考图2中所示,在步骤s230中,将所述第一输入音频流与所述第二输入音频流进行合并,获取混合音频流。
49.本公开实施例中,在通过外置设备从发送端的对话请求中获取到第一输入音频流,且通过外置设备将第一输入音频流导入至接收端后,接收端可以将外置设备发送的对话请求中的第一输入音频流和接收端自带麦克风输入的第二输入音频流进行合并,从而获取混合音频流。
50.为了提高音频流的准确性,可以根据第二类型标识将第一输入音频流和/或第二输入音频流中的重复音频流进行过滤操作。可将所述第一输入音频流或所述第二输入音频流中相同的音频流确定为重复音频流,还可以将第一输入音频流和第二输入音频流中相同的音频流确定为重复音频流,并对所述重复音频流进行过滤操作。即,获取到所有的音频输入源的音频流,通过groupid进行一次滤重操作。按照第二类型标识通过将第一输入音频流和/或第二输入音频流进行滤重操作,能够避免重复音频流导致的重复合并的问题,提高合并的准确性,且避免了资源浪费。按照第二类型标识进行滤重操作指的是,将第二类型标识对应的第一输入音频流或者是第二输入音频流分别进行过滤,并对第一输入音频流以及第二输入音频流进行过滤,以删除其中包含的重复音频流。通过删除所有音频源中的重复音频流,能够避免重复音频流的干扰,减少由于重复音频流而导致的合并准确性低的问题。示例性地,对第一输入音频流与第二输入音频流的内容进行对比,若内容相同,则将第一输入音频流与第二输入音频流中相同内容对应的部分音频流确定为重复音频流;若内容不同,则将第一输入音频流与第二输入音频流确定为非重复音频流。举例而言,若第一输入音频流中的音频流a与第二输入音频流中的音频流b的部分内容1相同,则认为二者的该部分内容1属于重复音频流。在此基础上,可以对重复音频流进行过滤,以提高准确性。
51.在对不同音频输入源的音频流进行合并时,还可以根据实时音频参数来对第一输入音频流以及第二输入音频流进行音效调整和降噪处理,以优化第一输入音频流和第二输入音频流。实时音频参数可以包括但不限于音量、回声、噪音以及音中的一种或多种的组合。音效调整操作可以针对实时音频参数而进行,例如可以包括但不限于音量调整、回声处理、噪音消除、音修改等等。当实时音频参数满足音频条件时,可以对满足音频条件的实时音频参数进行音效调整操作。其中,音量大于第一预设值或者是小于第二预设值、存在回声、噪音大于第三预设值中的任意一种或多种情况,都可以认为实时音频参数满足音频条件。其中,第一预设值可以大于第二预设值,第三预设值可以大于第一预设值。或者也可以根据实际应用场景来确定是否需要对实时音频参数进行音效调整操作。音效调整操作的操作程度可以根据实时音频参数的大小以及与音频条件中的参考值来确定。参考值可以为第一预设值、第二预设值或者是第三预设值。除此之外,也可以根据其他参数来确定音效调整操作的操作程度,只要处理之后的实时音频参数满足音频条件即可。举例而言,可以对第一输入音频流以及第二输入音频流实现音效调整操作,例如增减音量、减轻回声以及降低噪
音、调整音等等。若音量大于第一预设值,则可以调低音量,以使小于第一预设值即可。
52.接下来,可以按照时间顺序对第一输入音频流以及第二输入音频流进行合并。按照时间顺序可以包括:将相同时间段内来自于不同音频输入源的音频流进行合并,即将相同时间段内外置设备的第一输入音频流以及接收端的第二输入音频流进行拼接合并,具体可以按照第一输入音频流以及第二输入音频流的开始时间进行合并。若相同时间段内第一输入音频流和第二输入音频流的开始时间相同,则将二者进行混合即可。若相同时间段内第一输入音频流和第二输入音频流的开始时间不同,则按照开始时间的排列顺序对第一输入音频流和第二输入音频流进行拼接合并。开始时间的排列顺序指的是开始时间的先后顺序。按照时间顺序也可以包括:按照时间的先后顺序,将来自于不同音频输入源的音频流进行合成。举例而言,第一输入音频流a的时间晚于第二输入音频流b的时间,可将第一输入音频流和第二输入音频流合成为第二输入音频流b,第一输入音频流a组成的混合音频流。
53.在一些实施例中,可以将接收端接收的usb外置声卡发送的对话请求的第一输入音频流和接收端接收的电脑自带麦克风的音频流输入进行合并。通过多种编程语言可以实现,此处以网页端javascript语言进行举例说明。通过浏览器提供的web audio api接口中的音频合并的方法,获取到所有的音频输入源,通过第二类型标识groupid进行一次滤重。进一步使用audiocontext类建立一个音频处理流程,将多个音频源连接到同一个音频目标实现聚合。audiocontext类表示由连接在一起的音频模块构建的音频处理图,用于对多个不同源构建一个管道,以实现多个不同源的音频流的合并。需要补充的是,可以在audiocontext类中嵌入多个处理节点以实现多种音效调整操作,且每个节点用于执行一种音效调整操作。
54.在一些实施例中,由于音频流可以表示为波形的数据,即可以对音频流对应的函数做傅里叶展开生成正弦波和余弦波。因此可以对每一个正弦波和余弦波进行修改,修改其对应的振幅、相位、波长等参数,并对修改后的正弦波和余弦波按照时间顺序进行合并,得到混合音频流。
55.参考图4中所示,将第一输入音频流401以及第二输入音频流402分别进行音效调整操作,获取处理后的第一输入音频流403以及处理后的第二输入音频流404,将处理后的第一输入音频流403以及处理后的第二输入音频流404进行合并,得到混合音频流405。
56.本公开实施例中,通过将接收端接收的外置设备发送的对话请求的第一输入音频流以及接收端接收自带麦克风输入的第二输入音频流进行合并,避免遗漏音频流而导致的不完整的问题,能够实现精准音频整合,提高音频流的完整性和全面性。
57.继续参考图2中所示,在步骤s240中,对所述混合音频流进行结构化处理确定特征信息,并结合模板信息以及所述特征信息确定所述目标对象的流调信息。
58.本公开实施例中,结构化处理用于进行特征信息提取,以生成可识别的格式化文本。特征信息可以为混合音频流中的关键词,且特征信息可以与模板信息中的参考特征信息存在关联关系,参考特征信息可以为用于表示姓名、年龄、证件号码、住址、接触状态、历史轨迹信息(时间以及历史位置)、防护信息的信息。例如参考特征信息为姓名,混合音频流中的特征信息可以为张某等等;参考特征信息为住址,特征信息可以为a小区等等。
59.图5中示意性示出了生成流调信息的流程图,参考图5中所示,主要包括步骤s510和步骤s520,其中:
60.在步骤s510中,获取与所述混合音频流对应的音频数据。
61.本步骤中,音频数据可以用于进行特征信息提取。音频数据可以为混合音频流本身,也可以为对混合音频流进行采样处理得到的数据。在音频数据为混合音频流本身时,音频数据即为音频数据流。当音频数据为对混合音频流进行采样处理得到的数据时,音频数据为音频文件。
62.如图5中所示,获取音频数据可以包括两种方式:在步骤s511中,若所述对话请求对应的场景为第一类型场景,按照录音参数对所述混合音频流进行录音操作,得到与语音识别需求匹配的音频数据进行存储。其中,对混合音频流进行录音操作以进行存储,能够便于后续进行回听或者是核查,以及时更新错误数据。在一些实施例中,可基于录音参数对混合音频流进行录音操作。录音参数可以包括但不限于录音格式、采样率、采样位深度以及通道数中的一种或其组合。具体地,可使用mediarecorder类对混合音频流进行录音,录音格式为pcm(pulse code modulation,脉冲编码调制)原始音频,采样率为16000,采样位深度为16bit,通道数为1,录音操作后可以获取到符合语音识别需求匹配的音频文件。其中,pcm格式可以将声音等模拟信号变成符号化的脉冲列,再进行记录存储。需要说明的是,如果通道数多于1则丢弃多余的通道数据。其中,当通道数大于1时可以认为属于立体声音频,由于电脑一般使用麦克风阵列,且麦克风阵列的通道数较多。为了支持语音识别,需要舍弃多余的通道数据,以提高准确性。第一类型场景可以为对话请求满足对话条件的场景,也可以为任意类型场景。若对话请求中存在噪音,或对话请求中的语速大于标准语速,或对话请求的信息量大(例如大于信息量阈值),则可以认为对话请求满足对话条件。即,第一类型场景可以为存在噪音、语速大于标准语速或者是信息量大于信息量阈值的场景。
63.在将混合音频流转换为音频数据后,可以将音频数据输入至实时语音识别系统进行语音识别。
64.在步骤s512中,若所述对话请求对应的场景为第二类型场景,将所述混合音频流作为所述音频数据。第二类型场景可以为不存在噪音、语速慢或者是信息量小的场景。若对话请求中不存在噪音,或对话请求中的语速不大于标准语速,或对话请求的信息量小(例如不大于信息量阈值),则可以认为对话请求不满足对话条件以确定第二类型场景。即,在第二类型场景下直接对混合音频流对应的流数据进行实时传输,以将混合音频流对接到实时语音识别系统中进行语音识别,而不需要进行录音操作生成音频文件。
65.需要补充的是,可以在第一类型场景下将混合音频流转换为音频数据,在第二类型场景下将混合音频流直接作为音频数据。本公开实施例中,以任意类型场景下都可以进行录音操作、任意类型场景下都可以进行实时传输为例进行说明。基于此,在任意类型场景下,都可以将混合音频流按照音频参数进行录音操作得到音频数据,并且将混合音频流直接作为音频数据。进一步地,可以将任意一种方式得到的音频数据输入至实时语音识别系统来进行语音识别。其中,可以根据场景类型或实际需求选择一种方式,此处不作限定。例如图3中所示,接收端可将接收的外置声卡发送的对话请求的第一输入音频流以及接收端接收的自带麦克风输入的第二输入音频流进行音频合成后进行格式转换,生成目标数据流,即音频数据。
66.在步骤s520中,将所述音频数据转换为文字信息,对所述文字信息进行特征信息提取,并通过模板信息对所述特征信息进行填充操作以生成所述流调信息。
67.本步骤中,在得到音频数据后,可以将音频数据通过语音识别方式转换为文字信息。进一步地,可以对文字信息进行结构化处理得到特征信息,即得到关键词。在一些实施例中,结构化处理可以基于正则表达式或者是基于深度学习的方式进行特征信息提取。正则表达式指的是通过字符以及字符的组合组成的规则字符串,用于对字符串进行过滤。基于深度学习的方式可以为基于机器学习模型、深度学习模型等各种能够用于提取文本信息的模型进行提取。举例而言,可以对文本信息的所有分析语句进行分词操作,以得到分析语句的词语单元;获取词语单元的词语特征、词语单元在对应分析语句中的语句特征、以及词语单元在所述提取文本中的文本特征;基于机器学习算法建立的机器学习模型,使用每个分析语句中的词语单元的词语特征、语句特征以及文本特征,对每个分析语句进行关键词提取操作。机器学习模型可以为任意类型的模型,例如可以为支持向量机等等,此处不作具体限定。除此之外,对于用词向量表示的文本信息,可通过k-means算法对文本信息中的词进行聚类,选择聚类中心作为文本的一个主要关键词,计算其他词与聚类中心的距离即相似度,选择距离聚类中心最近的词作为关键词。需要说明的是,该步骤中的语音识别服务需要支持实时流处理,以提高实时性,进而提高处理效率。
68.在获取到特征信息之后,可以结合模板信息以及特征信息生成流调信息。模板信息可以为流调模板,对于流调模板而言,不同的传染疾病对应的流调模板可以相同或不同,不同地区的流调模板也可以相同或不同,具体可以根据实际需求而确定。流调模板中可以包含参考特征信息,例如可以包括但不限于用于表示姓名、年龄、证件号码、住址、接触状态、历史轨迹信息(时间以及历史位置)、防护信息的信息。基于此,可以将音频数据转换成的文本信息中的特征信息,自动填充至流调模板中的对应位置,生成针对于目标对象的流调信息,即流调报告。在一些实施例中,可以根据特征信息和参考特征信息的匹配关系来确定填充位置,在确定填充位置之后,可将特征信息自动填充至流调模板中的填充位置进行自动填充操作,从而生成对应的流调信息。基于此,结构化服务获取到的特征信息与流调模板易相结合并进行自动填充操作,可将生成的文本添加必要的样式导出为文档格式,即可获取到标准统一格式的流调报告,提高了生成流调信息的操作效率。
69.图6中示意性示出了进行电话流调的具体流程示意图,参考图6中所示,主要包括以下步骤:
70.在步骤s610中,采访者的发送端与目标对象的终端建立对话请求;
71.在步骤s620中,将对话请求的信息发送至外置设备;
72.在步骤s630中,外置设备从对话请求中获取第一输入音频流传输至接收端;
73.在步骤s640中,接收端接收自带麦克风输入第二输入音频流,并获取外置设备发送的对话请求的第一输入音频流,对第二输入音频流和第一输入音频流进行合并,进而结合混合音频流和流调模板生成流调信息。
74.本公开实施例中,可以在进行对话请求的过程中,根据接收端接收的外置设备发送的对话请求的第一输入音频流以及接收端接收的自带麦克风输入的第二输入音频流进行合并生成混合音频流,并对混合音频流进行特征信息提取,进而根据特征信息以及模板信息中的参考特征信息,将提取的特征信息自动填充至模板信息中,生成统一格式的流调报告。本公开实施例中的技术方案,能够基于手机、电脑及音频线、外置声卡等电脑配件协同实现自动化电话流调,提高流调信息的生成效率,降低了成本。进一步地,由于外置设备
的配置方式简单且便于携带,因此能够提高生成流调信息的便捷性和可靠性,并且能够提高全面性,增加应用范围,有利于大规模进行推广实施,提高可用性。
75.本公开实施例中,还提供了一种流调信息处理装置,参考图7中所示,该流调信息处理装置700主要包括以下模块:
76.第一音频流获取模块701,响应发送端发送的采访者与目标对象的对话请求,基于外置设备获取所述对话请求中的第一输入音频流;
77.第二音频流获取模块702,用于获取所述采访者的第二输入音频流;
78.音频流合并模块703,用于将所述第一输入音频流与所述第二输入音频流进行合并,获取混合音频流;
79.流调信息生成模块704,用于对所述混合音频流进行结构化处理确定特征信息,并结合模板信息以及所述特征信息确定所述目标对象的流调信息。
80.在本公开的一种示例性实施例中,第一音频流获取模块包括:音频流获取模块,用于获取多个音频输入源的音频流,所述音频流包括第一类型标识和第二类型标识;所述第一类型标识用于确定第二输入音频流,所述第二类型标识用于确定第一输入音频流;音频源确定模块,用于通过所述第一类型标识对所述多个音频输入源的音频流进行筛选,以从所述音频流中确定第二输入音频流;第一输入音频流确定模块,用于确定所述第二输入音频流的第二类型标识的值,并将与所述第二类型标识的值不同的音频流确定为所述外置设备的所述第一输入音频流。
81.在本公开的一种示例性实施例中,在将所述第一输入音频流与所述第二输入音频流进行合并,获取混合音频流之前,所述装置还包括:音频流过滤模块,用于根据第二类型标识将所述第一输入音频流和/或所述第二输入音频流中相同的音频流确定为重复音频流,并对所述重复音频流进行过滤操作。
82.在本公开的一种示例性实施例中,音频流合并模块包括:合并控制模块,用于按照时间顺序将所述第一输入音频流与所述第二输入音频流进行合并,以获取所述混合音频流。
83.在本公开的一种示例性实施例中,在将所述外置设备的第一输入音频流与接收端的第二输入音频流进行合并,获取混合音频流之前,所述装置还包括:音频流调整模块,用于对所述第一输入音频流和所述第二输入音频流中,满足音频条件的实时音频参数进行音效调整操作,以调整所述第一输入音频流和所述第二输入音频流。
84.在本公开的一种示例性实施例中,流调信息生成模块包括:音频数据获取模块,用于获取与所述混合音频流对应的音频数据;模板填充模块,用于将所述音频数据转换为文字信息,对所述文字信息进行特征信息提取,并通过模板信息对所述特征信息进行填充操作以生成所述流调信息。
85.在本公开的一种示例性实施例中,音频数据获取模块包括:第一获取模块,用于若所述对话请求对应的场景为第一类型场景,按照录音参数对所述混合音频流进行录音操作,得到与语音识别需求匹配的音频数据进行;所述音频参数包括录音格式、采样率、采样位深度以及通道数中的一种或其组合;第二获取模块,用于若所述对话请求对应的场景为第二类型场景,将所述混合音频流作为所述音频数据。
86.此外,上述流调信息处理装置中各部分的具体细节在流调信息处理方法部分实施
方式中已经详细说明,未披露的细节内容可以参见方法部分的实施方式内容,因而不再赘述。
87.应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
88.此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
89.在本公开的实施例中,还提供了一种能够实现上述方法的电子设备。
90.所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
91.下面参照图8来描述根据本公开的这种实施方式的电子设备800。图8显示的电子设备800仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
92.如图8所示,电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于:上述至少一个处理单元810、上述至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830以及显示单元840。
93.其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元810执行,使得所述处理单元810执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,所述处理单元810可以执行如图2中所示的步骤。
94.存储单元820可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)8201和/或高速缓存存储单元8202,还可以进一步包括只读存储单元(rom)8203。
95.存储单元820还可以包括具有一组(至少一个)程序模块8205的程序/实用工具8204,这样的程序模块8205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
96.总线830可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速接口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
97.电子设备800也可以与一个或多个外部设备900(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备800交互的设备通信,和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口850进行。并且,电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器860通过总线830与电子设备800的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及
数据备份存储系统等。
98.在本公开的实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
99.根据本公开的实施方式的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
100.所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
101.计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
102.可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
103.此外,上述附图仅是根据本公开实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
104.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
105.应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并
且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。

技术特征:


1.一种流调信息处理方法,其特征在于,包括:响应发送端发送的采访者与目标对象的对话请求,基于外置设备获取所述对话请求中的第一输入音频流;获取所述采访者的第二输入音频流;将所述第一输入音频流与所述第二输入音频流进行合并,获取混合音频流;对所述混合音频流进行结构化处理确定特征信息,并结合模板信息以及所述特征信息确定所述目标对象的流调信息。2.根据权利要求1所述的流调信息处理方法,其特征在于,所述基于外置设备获取所述对话请求中的第一输入音频流,包括:获取多个音频输入源的音频流,所述音频流包括第一类型标识和第二类型标识,其中,所述第一类型标识用于确定第二输入音频流,所述第二类型标识用于确定第一输入音频流;通过所述第一类型标识对所述多个音频输入源的音频流进行筛选,以从所述音频流中确定第二输入音频流;确定所述第二输入音频流的第二类型标识的值,并将与所述第二类型标识的值不同的音频流确定为所述外置设备的所述第一输入音频流。3.根据权利要求2所述的流调信息处理方法,其特征在于,在将所述第一输入音频流与所述第二输入音频流进行合并,获取混合音频流之前,所述方法还包括:根据所述第二类型标识将所述第一输入音频流和/或所述第二输入音频流中相同的音频流确定为重复音频流,并对所述重复音频流进行过滤操作。4.根据权利要求1所述的流调信息处理方法,其特征在于,所述将所述第一输入音频流与所述第二输入音频流进行合并,获取混合音频流,包括:按照时间顺序将所述第一输入音频流与所述第二输入音频流进行合并,以获取所述混合音频流。5.根据权利要求1所述的流调信息处理方法,其特征在于,在将所述第一输入音频流与所述第二输入音频流进行合并,获取混合音频流之前,所述方法还包括:对所述第一输入音频流和所述第二输入音频流中,满足音频条件的实时音频参数进行音效调整操作,以调整所述第一输入音频流和所述第二输入音频流。6.根据权利要求1所述的流调信息处理方法,其特征在于,所述对所述混合音频流进行结构化处理确定特征信息,并结合模板信息以及所述特征信息确定所述目标对象的流调信息,包括:获取与所述混合音频流对应的音频数据;将所述音频数据转换为文字信息,对所述文字信息进行特征信息提取,并通过模板信息对所述特征信息进行填充以生成所述流调信息。7.根据权利要求6所述的流调信息处理方法,其特征在于,所述获取与所述混合音频流对应的音频数据,包括:若所述对话请求对应的场景为第一类型场景,按照录音参数对所述混合音频流进行录音操作,得到与语音识别需求匹配的音频数据;所述音频参数包括录音格式、采样率、采样位深度以及通道数中的一种或其组合;
若所述对话请求对应的场景为第二类型场景,将所述混合音频流作为所述音频数据。8.一种流调信息处理装置,其特征在于,包括:第一音频流获取模块,用于响应发送端发送的采访者与目标对象的对话请求,基于外置设备获取所述对话请求中的第一输入音频流;第二音频流获取模块,用于获取所述采访者的第二输入音频流;音频合并模块,用于将所述第一输入音频流与所述第二输入音频流进行合并,获取混合音频流;流调信息生成模块,用于对所述混合音频流进行结构化处理确定特征信息,并结合模板信息以及所述特征信息确定所述目标对象的流调信息。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任意一项所述的流调信息处理方法。10.一种电子设备,其特征在于,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任意一项所述的流调信息处理方法。

技术总结


本公开提供一种流调信息处理方法、流调信息处理装置、存储介质与电子设备,涉及计算机技术领域。其中,所述流调信息处理方法包括:响应发送端发送的采访者与目标对象的对话请求,基于外置设备获取所述对话请求中的第一输入音频流;获取所述采访者的第二输入音频流;将所述第一输入音频流与所述第二输入音频流进行合并,获取混合音频流;对所述混合音频流进行结构化处理确定特征信息,并结合模板信息以及所述特征信息确定所述目标对象的流调信息。本公开实施例中的技术方案,能够提高流调信息的生成效率,且提高了灵活性。且提高了灵活性。且提高了灵活性。


技术研发人员:

赖昆

受保护的技术使用者:

医渡云(北京)技术有限公司

技术研发日:

2022.04.21

技术公布日:

2022/7/29

本文发布于:2024-09-22 17:39:33,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/18996.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:音频   所述   流进   信息
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议