应用程序的语音控制方法、装置、存储介质及电子设备与流程



1.本发明涉及语音控制技术领域,且更具体地,涉及应用程序的语音控制方法、装置、存储介质及电子设备。


背景技术:



2.随着人机交互技术的不断进步,智能终端上的语音控制功能也变得越来越普遍。目前,智能终端上的语音控制功能通常都是出厂调试完成的,而在日常生活中,用户常常会根据自身的需求,在智能终端的应用市场中下载安装各种各样的应用程序,而智能终端对于从应用市场中新下载的应用程序不能进行语音控制,因此确定一种应用程序的语音控制方法具有重要意义。


技术实现要素:



3.本发明提供了应用程序的语音控制方法、装置、计算机可读存储介质及电子设备,以解决现有的智能终端对于从应用市场中新下载的应用程序不能进行语音控制的技术问题。
4.第一方面,提供了一种应用程序的语音控制方法,具体包括如下步骤:
5.基于语音控制程序对获取的语音指令进行识别,确定所述语音指令对应的语义识别结果;
6.基于所述语义识别结果,确定目标应用程序;
7.基于所述目标应用程序对应的语音服务注册信息和预设配置表,确定所述语音控制程序与所述目标应用程序间的通信执行方式;
8.基于所述通信执行方式,控制所述目标应用程序执行所述语音指令对应的操作。
9.第二方面,提供了一种应用程序的语音控制装置,具体包括如下模块:
10.识别处理模块,用于基于语音控制程序对获取的语音指令进行识别,确定所述语音指令对应的语义识别结果;
11.程序确定模块,用于基于所述语义识别结果,确定目标应用程序;
12.方式确定模块,用于基于所述目标应用程序对应的语音服务注册信息和预设配置表,确定所述语音控制程序与所述目标应用程序间的通信执行方式;
13.操作处理模块,用于基于所述通信执行方式,控制所述目标应用程序执行所述语音指令对应的操作。
14.第三方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述的应用程序的语音控制方法。
15.第四方面,提供了一种电子设备,所述电子设备包括:
16.处理器;
17.用于存储所述处理器可执行指令的存储器;
18.所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现
上述的应用程序的语音控制方法。
19.与现有技术相比,本发明提供的应用程序的语音控制方法、装置、计算机可读存储介质及电子设备,至少包括以下有益效果:
20.本发明提供的技术方案在用户下达语音指令后,通过系统内支持语音功能的语音控制程序对获取的语音指令进行识别,确定出语音指令对应的语义识别结果,并根据语义识别结果,确定出用户意图通过语音指令控制的目标应用程序。进一步确定目标应用程序对应的语音服务注册信息,存在语音服务注册信息表明目标应用程序已向语音控制程序进行了语音服务注册,即目标应用程序存在语音控制程序支撑语音服务的权限,也就是说在本发明提供的技术方案中允许下载的应用程序进行语音服务注册,从而为下载的应用程序进行语音控制提供了前提条件。因为市场上的应用程序较多,为了实现语音控制程序与下载的各种应用程序间的信息交互,为不同的下载的应用程序确定不同的通信执行方式,从而在目标应用程序存在对应的语音服务注册信息时,结合预先获取的预设配置表,确定出语音控制程序与目标应用程序间的通信执行方式,即语音控制程序与目标应用程序间可以通过确定出的通信执行方式进行信息交互,则目标应用程序可以获取到与语音指令相关的信息,以使得目标应用程序可以执行语音指令对应的操作,实现用户对目标应用程序的语音控制,方便用户的使用。
附图说明
21.为了更清楚地说明本发明的技术方案,下面将对本发明的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
22.图1是本发明一示例性实施例提供的应用程序的语音控制方法的流程示意图一;
23.图2是本发明一示例性实施例提供的应用程序的语音控制方法的流程示意图二;
24.图3是本发明一示例性实施例提供的应用程序的语音控制方法的流程示意图三;
25.图4是本发明一示例性实施例提供的应用程序的语音控制方法的流程示意图四;
26.图5是本发明一示例性实施例提供的应用程序的语音控制方法的流程示意图五;
27.图6是本发明一示例性实施例提供的应用程序的语音控制装置的结构示意图;
28.图7是本发明一示例性实施例提供的电子设备的结构图。
具体实施方式
29.下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部实施例。根据本发明中的实施例,本领域普通技术人员在没有创造性劳动前提下所获得的所有其他实施例,都属于本发明实施例保护的范围。
30.示例性方法
31.图1是本发明一示例性实施例提供的应用程序的语音控制方法的流程示意图,具体包括如下步骤:
32.步骤10,基于语音控制程序对获取的语音指令进行识别,确定所述语音指令对应
的语义识别结果。
33.在一实施例中,语音控制程序为智能终端系统内已安装的支持语音功能的语音控制程序,其中智能终端包括但不限于手机、电脑、平板、车机。具体的,在车机系统中安装语音控制程序a,则在用户下达语音指令后,语音采集装置获取该语音指令,并将该语音指令传递给语音控制程序a,语音控制程序a对接收到的语音指令进行识别,确定出语音指令对应的语义识别结果。
34.步骤20,基于所述语义识别结果,确定目标应用程序。
35.在一实施例中,目标应用程序是指用户意图通过语音指令控制的程序对象。例如,确定的语义识别结果为“应用程序b”“播放歌曲”,则确定出目标应用程序为应用程序b。当然在用户下达语音指令时,可能不会明确的提及应用程序b,如语音指令为“打开新闻c”,此时提取出语义识别结果中的“新闻c”,若新闻c为应用程序d对应的内容,则应用程序d为目标应用程序。
36.步骤30,基于所述目标应用程序对应的语音服务注册信息和预设配置表,确定所述语音控制程序与所述目标应用程序间的通信执行方式。
37.在一实施例中,在确定目标应用程序后,确定目标应用程序对应的语音服务注册信息,若目标应用程序向语音控制程序进行过语音服务注册,则目标应用程序存在对应的语音服务注册信息,若目标应用程序没有向语音控制程序进行过语音服务注册,则目标应用程序不存在对应的语音服务注册信息,也就是说在本发明提供的技术方案中允许下载的应用程序进行语音服务注册,从而为下载的应用程序进行语音控制提供了前提条件。并且因为市场上的应用程序较多,为了实现语音控制程序与下载的各种应用程序间的信息交互,为不同的下载的应用程序确定不同的通信执行方式,在目标应用程序存在对应的语音服务注册信息后,则可以根据预设配置表,确定出语音控制程序与目标应用程序间的通信执行方式。其中通信执行方式包括但不限于调用方式和虚拟点击方式。
38.具体的,判断目标应用程序是否存在对应的语音服务注册信息,若存在,则基于预设配置表,确定语音控制程序与目标应用程序间的通信执行方式,若不存在,则停止当前流程,即不能通过语音对目标应用程序进行控制。
39.步骤40,基于所述通信执行方式,控制所述目标应用程序执行所述语音指令对应的操作。
40.在一实施例中,通过确定出的通信执行方式,可以实现语音控制程序与目标应用程序间的信息交互,则目标应用程序可以获取到与语音指令相关的信息,以使得目标应用程序可以执行语音指令对应的操作。
41.在上述实施例中,在用户下达语音指令后,通过系统内支持语音功能的语音控制程序对获取的语音指令进行识别,确定出语音指令对应的语义识别结果,并根据语义识别结果,确定出用户意图通过语音指令控制的目标应用程序。进一步确定目标应用程序对应的语音服务注册信息,存在语音服务注册信息表明目标应用程序已向语音控制程序进行了语音服务注册,即目标应用程序存在语音控制程序支撑语音服务的权限,也就是说在本实施例提供的技术方案中允许下载的应用程序进行语音服务注册,从而为下载的应用程序进行语音控制提供了前提条件。因为市场上的应用程序较多,为了实现语音控制程序与下载的各种应用程序间的信息交互,为不同的下载的应用程序确定不同的通信执行方式,从而
在目标应用程序存在对应的语音服务注册信息时,结合预先获取的预设配置表,确定出语音控制程序与目标应用程序间的通信执行方式,即语音控制程序与目标应用程序间可以通过确定出的通信执行方式进行信息交互,则目标应用程序可以获取到与语音指令相关的信息,以使得目标应用程序可以执行语音指令对应的操作,实现用户对目标应用程序的语音控制,方便用户的使用。
42.如图2所示,在上述图1所示实施例的基础上,本发明一个示例性实施例中,步骤30基于所述目标应用程序对应的语音服务注册信息和预设配置表,确定所述语音控制程序与所述目标应用程序间的通信执行方式,具体可以包括如下步骤:
43.步骤301,若所述目标应用程序存在语音服务注册信息,则基于预设配置表,确定所述语音控制程序与所述目标应用程序间的调用关系。
44.步骤302,基于所述调用关系,确定通信执行方式。
45.在上述实施例中,预设配置表记载有应用程序的配置相关信息,根据预设配置表可以确定出语音控制程序与各个应用程序间的调用关系,即是语音控制程序主动调用下载的应用程序,还是下载的应用程序主动调用语音控制程序,不同的调用方式对应不同的通信执行方式。因此在目标应用程序存在语音服务注册信息时,进一步根据预设配置表确定出语音控制程序与目标应用程序间的调用关系,进而确定出通信执行方式。随着市场上应用程序的增加,存在部分下载的应用程序可以主动调用语音控制程序,同时存在部分下载的应用程序与智能终端系统的协议不适配的情况,因此需要语音控制程序主动调用该部分应用程序,在本实施例中对两种可能存在的调用关系均进行考虑,为实现对各种不同的应用程序进行语音控制提供了条件。
46.如图3所示,在上述图2所示实施例的基础上,在本发明一示例性实施例中,步骤302基于所述调用关系,确定通信执行方式,包括:步骤3021,若所述调用关系为所述语音控制程序调用所述目标应用程序,确定通信执行方式为中间件通信。
47.在一实施例中,当下载的应用程序的协议与智能终端系统的协议并不适配时,为了满足用户对该部分应用程序进行语音控制的需要,开发人员需要根据该部分应用程序的外部校验的sdk进行适配,配置出中间件,以使得语音控制程序可以通过中间件调用该部分应用程序,因此当调用关系为语音控制程序调用目标应用程序时,通信执行方式为中间件通信。具体的,对于下载应用市场中常用的应用程序,如下载应用市场下载量为前100名的应用程序,若存在与智能终端系统的协议不适配的,开发人员均可以进行适配工作,在开发人员进行适配后,将该应用程序对应的包名添加到的预设配置表中,从而在预设配置表中可以获取到语音控制程序可以主动调用的应用程序的名单。
48.步骤40,所述基于所述通信执行方式,控制所述目标应用程序执行所述语音指令对应的操作,包括:
49.步骤401,若所述通信执行方式为中间件通信,则基于所述语义识别结果,确定中间件中的目标配置信息。
50.步骤402,基于所述目标配置信息,调用所述目标应用程序的目标接口,以使得所述目标应用程序执行所述语音指令对应的操作。
51.在上述实施例中,对于不同的应用程序,会存在不同的配置信息,因此在确定出通信执行方式为中间件通信后,进一步根据语义识别结果,确定中间件中的目标配置信息,根
据目标配置信息可以调用目标应用程序的目标接口,通过目标接口可以实现语音指令对应的操作动作。在本实施例中,通过采用中间件通信的方式可以有效的实现语音控制程序与目标应用程序间的通信,使得对常用的下载的应用程序进行语音控制提供了条件,以便实现用户对更多的下载的应用程序进行语音控制。
52.举例来说,开发人员针对应用程序e进行了适配,在中间件中进行信息的配置,以使得通过中间件可以调用应用程序e,实现应用程序e中sdk里的控制功能,并将应用程序e对应的包名添加到预设配置表中,即通过预设配置表可以确定出语音控制程序主动调用应用程序e。当用户的语音指令为“用应用程序e播放音乐时”,则可以确定目标应用程序为应用程序e,判断应用程序e是否存在语音服务注册信息,若应用程序e存在语音服务注册信息,进一步判断应用程序e是否在预设配置表内,若应用程序e在预设配置表内,确定应用程序e与语音控制程序间的调用关系,若确定出调用关系为语音控制程序调用目标应用程序,则可知通信执行方式为中间件通信,根据确定出的目标应用程序即应用程序e,以及目标动作即播放,确定出目标配置信息,根据目标配置信息,调用目标应用程序中实现播放功能的目标接口,使得目标接口执行播放动作,从而实现利用语音对下载的目标应用程序的语音控制。
53.当语音控制程序与应用程序间的调用关系为语音控制程序主动调用应用程序时,在应用程序向语音控制程序进行语音服务注册时,也是通过中间件完成的。在一种可能的实现方式中:获取第一应用程序,若基于预设配置表,确定所述语音控制程序调用所述第一应用程序,则接收中间件发送的第一语音服务注册请求;基于所述第一语音服务注册请求,确定所述第一应用程序对应的语音服务注册信息。其中,获取第一应用程序可以通过下载方式,即下载第一应用程序后,若基于预设配置表,确定语音控制程序调用第一应用程序,则可以控制中间件向语音控制程序发送第一语音服务注册请求,从而使得语音控制程序根据第一语音服务注册请求确定第一应用程序语音服务的权限。当然在下载第一应用程序后,系统会进行新下载应用程序的广播,中间件基于该广播,向语音控制程序发送第一语音服务注册请求,从而在下载第一应用程序后及时为第一应用程序进行语音服务注册。获取第一应用程序可以通过用户选择的方式,即对于已经下载安装的第一应用程序,当用户想要实现对该第一应用程序进行语音控制时,主动在语音功能注册界面进行选择,获取到第一应用程序,进而实现对已经下载的第一应用程序的语音服务注册。
54.如图4所示,在上述图2所示实施例的基础上,在本发明一示例性实施例中,所述步骤302基于所述调用关系,确定通信执行方式,包括:步骤3022,若所述调用关系为所述目标应用程序调用所述语音控制程序,确定通信执行方式为直接调用通信。
55.在一实施例中,若调用关系为目标应用程序调用语音控制程序,即目标应用程序进行主动调用,可以直接通过目标应用程序调用语音控制程序的方式实现信息交互,无需使用中间件。具体的,部分应用程序为了推广使用,会根据语音控制程序的外部校验的sdk进行自身应用程序的配置,从而使得应用程序的协议与智能终端系统的协议相适配,即下载该应用程序后,该应用程序可调用语音控制程序,此部分的应用程序也会记载在预设配置表内,因此可以通过预设配置表,确定调用关系为目标应用程序调用语音控制程序。
56.步骤40,所述基于所述通信执行方式,控制所述目标应用程序执行所述语音指令对应的操作,包括:
57.步骤403,若所述通信执行方式为直接调用通信,则接收所述目标应用程序的调用请求;
58.步骤404,将基于所述调用请求确定的逻辑结果返回给所述目标应用程序,以使得所述目标应用程序执行所述语音指令对应的操作。
59.在上述实施例中,若通信执行方式为直接调用通信,则语音控制程序会直接接收到目标应用程序的调用请求,根据目标应用的调用请求进行调用,将根据该调用请求确定的逻辑结果返回给目标应用程序,从而使得目标应用程序执行语音指令对应的操作。在一种可能的实现方式中,在语音控制程序识别到目标应用程序后,向目标应用程序传递告知信息,目标应用程序基于该告知信息向目标应用程序传递调用请求。在本实施例中可以通过目标应用程序对语音控制程序主动调用的方式进行交互,以实现对目标应用程序的语音控制,实现用户对更多的下载的应用程序进行语音控制。
60.当语音控制程序与应用程序间的调用关系为应用程序主动调用语音控制程序时,在应用程序向语音控制程序进行语音服务注册时,是由应用程序完成的。在一种可能的实现方式中:获取第二应用程序,若基于预设配置表,确定所述第二应用程序调用所述语音控制程序,则接收所述第二应用程序的第二语音服务注册请求;基于所述第二语音服务注册请求,确定所述第二应用程序的语音服务注册信息。其中,获取第二应用程序可以通过下载方式,即下载第二应用程序后,若基于预设配置表,确定第二应用程序调用语音控制程序,则在下载完成后,启动安装时,第二应用程序直接向语音控制程序传递第二语音服务注册请求,从而使得语音控制程序根据第二语音服务注册请求确定第二应用程序语音服务的权限,即在下载第二应用程序后及时为第二应用程序进行语音服务注册。获取第二应用程序可以通过用户选择的方式,即对于已经下载安装的第二应用程序,当用户想要实现对该第二应用程序进行语音控制时,主动在语音功能注册界面进行选择,获取到第二应用程序,进而实现对已经下载的第二应用程序的语音服务注册。
61.如图5所示,在上述图1所示实施例的基础上,在本发明一示例性实施例中,步骤30基于所述目标应用程序对应的语音服务注册信息和预设配置表,确定所述语音控制程序与所述目标应用程序间的通信执行方式,具体可以包括如下步骤:
62.步骤303,若所述目标应用程序存在语音服务注册信息,且所述目标应用程序没有在预设配置表内,则确定所述语音控制程序与所述目标应用程序间的通信执行方式为虚拟点击。
63.步骤40,所述基于所述通信执行方式,控制所述目标应用程序执行所述语音指令对应的操作,包括:
64.步骤405,若所述通信执行方式为虚拟点击,则确定所述语义识别结果在所述目标应用程序中对应的目标按键;
65.步骤406,触发所述目标按键,使得所述目标应用程序执行所述语音指令对应的操作。
66.在上述实施例中,若目标应用程序存在语音服务注册信息,但是目标应用程序并没有在预设配置表内,此时目标应用程序和语音控制程序因接口差异,无法彼此调用,为了满足对此类应用程序的语音控制,本实施例中采用虚拟点击的通信执行方式。具体的,系统方可以获取到应用程序的显示文字,通过将显示文字注册为对应的语音,当语义识别结果
中存在某显示文字后,可以根据注册内容在目标应用程序中确定出目标按键,通过触发该目标按键,使得目标应用程序执行该语音指令对应的操作。市场上存在较多的应用程序,因此存在部分的应用程序没有在预设配置表内的情况,在本实施例中可以通过虚拟点击的方式对该类应用程序进行语音控制,满足用户控制更多应用程序的需求。
67.当语音控制程序与应用程序间并不存在调用关系时,对该部分的应用程序可以通过以下方式进行语音服务注册:获取第三应用程序,若所述第三应用程序没有在预设配置表内,则确定所述显示文字与按键的关联关系,并提取所述第三应用程序的显示文字进行语音服务注册。其中,获取第三应用程序可以通过下载方式,即下载第三应用程序,若第三应用程序没有在预设配置表内,则获取第三应用程序的显示文字,并确定每一个显示文字对应的按键,即确定出显示文字与按键的关联关系,然后将显示文字在语音控制程序进行语音服务注册,从而使得语音控制程序根据显示文字的语音服务注册,确定第三应用程序的语音服务注册信息,确认第三应用程序语音服务的权限,实现及时为第三应用程序进行语音服务注册。获取第三应用程序可以通过用户选择的方式,即对于已经下载安装的第三应用程序,当用户想要实现对该第三应用程序进行控制时,主动在语音功能注册界面进行选择,从而获取到第三应用程序,进而实现对已经下载的第三应用程序的语音服务注册。
68.在本发明一示例性实施例中,所述提取所述第三应用程序的显示文字进行语音服务注册,包括:提取所述第三应用程序的显示文字;确定所述显示文字的显示位置;基于所述显示文字和显示位置进行语音服务注册。
69.在上述实施例中,提取第三应用程序的显示文字,并进一步确定显示文字对应的显示位置,从而在进行语音服务注册时,不仅考虑显示文字的具体内容,还考虑显示位置。当应用程序不同位置存在相同的显示文字时,若仅根据显示文字进行语音服务注册,则可能会无法准确进行语音控制的情况。因此为了实现更为准确的语音控制,在进行语音服务注册时,同时考虑显示文字和显示位置,以便通过显示文字的内容和显示位置准确的确定出目标按键。
70.在本发明一示例性实施例中,所述方法还包括:基于接收到的配置信息,更新所述预设配置表。在上述实施例中,随着市场上应用程序的更新、开发人员适配工作的推进以及应用程序的推广需求,均需要对预设配置表的内容进行更新,因此可以通过配置信息对预设配置表进行管理,使得预设配置表内的信息具有实时性,以使得用户可以对最新、最热门的下载应用程序进行语音控制,具有更好的便利性。
71.示例性装置
72.根据与本发明方法实施例相同的构思,如图6所示,本发明实施例还提供了一种应用程序的语音控制装置,具体包括如下模块:
73.识别处理模块61,用于基于语音控制程序对获取的语音指令进行识别,确定所述语音指令对应的语义识别结果;
74.程序确定模块62,用于基于所述语义识别结果,确定目标应用程序;
75.方式确定模块63,用于基于所述目标应用程序对应的语音服务注册信息和预设配置表,确定所述语音控制程序与所述目标应用程序间的通信执行方式;
76.操作处理模块64,用于基于所述通信执行方式,控制所述目标应用程序执行所述语音指令对应的操作。
77.在本发明一示例性实施例中,所述方式确定模块,包括
78.关系确定单元,用于若所述目标应用程序存在语音服务注册信息,则基于预设配置表,确定所述语音控制程序与所述目标应用程序间的调用关系;
79.方式确定单元,用于基于所述调用关系,确定通信执行方式。
80.在本发明一示例性实施例中,所述方式确定单元,用于若所述调用关系为所述语音控制程序调用所述目标应用程序,确定通信执行方式为中间件通信;
81.则操作处理模块,包括:
82.信息确定单元,用于若所述通信执行方式为中间件通信,则基于所述语义识别结果,确定中间件中的目标配置信息;
83.第一操作单元,用于基于所述目标配置信息,调用所述目标应用程序的目标接口,以使得所述目标应用程序执行所述语音指令对应的操作。
84.在本发明一示例性实施例中,所述装置还包括:
85.第一获取模块,用于获取第一应用程序,若基于预设配置表,确定所述语音控制程序调用所述第一应用程序,则接收中间件发送的第一语音服务注册请求;
86.第一注册模块,用于基于所述第一语音服务注册请求,确定所述第一应用程序对应的语音服务注册信息。
87.在本发明一示例性实施例中,所述方式确定单元,用于若所述调用关系为所述目标应用程序调用所述语音控制程序,确定通信执行方式为直接调用通信。
88.则操作处理模块,包括:
89.调用处理单元,用于若所述通信执行方式为直接调用通信,则接收所述目标应用程序的调用请求;
90.第二操作单元,用于将基于所述调用请求确定的逻辑结果返回给所述目标应用程序,以使得所述目标应用程序执行所述语音指令对应的操作。
91.在本发明一示例性实施例中,所述装置还包括:
92.第二获取模块,用于获取第二应用程序,若基于预设配置表,确定所述第二应用程序调用所述语音控制程序,则接收所述第二应用程序的第二语音服务注册请求;
93.第二注册模块,用于基于所述第二语音服务注册请求,确定所述第二应用程序的语音服务注册信息。
94.在本发明一示例性实施例中,所述方式确定模块,包括:
95.虚拟处理单元,用于若所述目标应用程序存在语音服务注册信息,且所述目标应用程序没有在预设配置表内,则确定所述语音控制程序与所述目标应用程序间的通信执行方式为虚拟点击;
96.则操作处理模块,包括:
97.按键确定单元,用于若所述通信执行方式为虚拟点击,则确定所述语义识别结果在所述目标应用程序中对应的目标按键;
98.第三操作单元,用于触发所述目标按键,使得所述目标应用程序执行所述语音指令对应的操作。
99.在本发明一示例性实施例中,所述装置还包括:
100.第三注册模块,用于获取第三应用程序,若所述第三应用程序没有在预设配置表
内,则确定所述显示文字与按键的关联关系,并提取所述第三应用程序的显示文字进行语音服务注册。
101.在本发明一示例性实施例中,所述第三注册模块,用于获取第三应用程序,若所述第三应用程序没有在预设配置表内,则确定所述显示文字与按键的关联关系,并提取所述第三应用程序的显示文字;确定所述显示文字的显示位置;基于所述显示文字和显示位置进行语音服务注册。
102.在本发明一示例性实施例中,所述装置还包括:
103.更新处理模块,用于基于接收到的配置信息,更新所述预设配置表。
104.示例性电子设备
105.图7图示了根据本发明实施例的电子设备的框图。
106.如图7所示,电子设备100包括一个或多个处理器101和存储器102。
107.处理器101可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备100中的其他组件以执行期望的功能。
108.存储器102可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器101可以运行所述程序指令,以实现上文所述的本发明的各个实施例的应用程序的语音控制方法以及/或者其他期望的功能。
109.在一个示例中,电子设备100还可以包括:输入装置103和输出装置104,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
110.当然,为了简化,图7中仅示出了该电子设备100中与本发明有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备100还可以包括任何其他适当的组件。
111.示例性计算机程序产品和计算机可读存储介质
112.除了上述方法和设备以外,本发明的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种实施例的应用程序的语音控制方法中的步骤。
113.所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本发明实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如java、c++等,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
114.此外,本发明的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种实施例的应用程序的语音控制方法中的步骤。
115.所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电
磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
116.以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,在本发明中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本发明的各个实施例必须具备的。另外,上述发明的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本发明为必须采用上述具体的细节来实现。
117.本发明中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
118.还需要指出的是,在本发明的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。
119.提供所发明的方面的以上描述以使本领域的任何技术人员能够做出或者使用本发明。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本发明的范围。因此,本发明不意图被限制到在此示出的方面,而是按照与在此发明的原理和新颖的特征一致的最宽范围。
120.为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本发明的实施例限制到在此发明的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

技术特征:


1.一种应用程序的语音控制方法,其特征在于,具体包括如下步骤:基于语音控制程序对获取的语音指令进行识别,确定所述语音指令对应的语义识别结果;基于所述语义识别结果,确定目标应用程序;基于所述目标应用程序对应的语音服务注册信息和预设配置表,确定所述语音控制程序与所述目标应用程序间的通信执行方式;基于所述通信执行方式,控制所述目标应用程序执行所述语音指令对应的操作。2.根据权利要求1所述的方法,所述基于所述目标应用程序对应的语音服务注册信息和预设配置表,确定所述语音控制程序与所述目标应用程序间的通信执行方式,包括:若所述目标应用程序存在语音服务注册信息,则基于预设配置表,确定所述语音控制程序与所述目标应用程序间的调用关系;基于所述调用关系,确定通信执行方式。3.根据权利要求2所述的方法,所述基于所述调用关系,确定通信执行方式,包括:若所述调用关系为所述语音控制程序调用所述目标应用程序,确定通信执行方式为中间件通信;所述基于所述通信执行方式,控制所述目标应用程序执行所述语音指令对应的操作,包括:若所述通信执行方式为中间件通信,则基于所述语义识别结果,确定中间件中的目标配置信息;基于所述目标配置信息,调用所述目标应用程序的目标接口,以使得所述目标应用程序执行所述语音指令对应的操作。4.根据权利要求3所述的方法,所述方法还包括:获取第一应用程序,若基于预设配置表,确定所述语音控制程序调用所述第一应用程序,则接收中间件发送的第一语音服务注册请求;基于所述第一语音服务注册请求,确定所述第一应用程序对应的语音服务注册信息。5.根据权利要求2所述的方法,所述基于所述调用关系,确定通信执行方式,包括:若所述调用关系为所述目标应用程序调用所述语音控制程序,确定通信执行方式为直接调用通信;所述基于所述通信执行方式,控制所述目标应用程序执行所述语音指令对应的操作,包括:若所述通信执行方式为直接调用通信,则接收所述目标应用程序的调用请求;将基于所述调用请求确定的逻辑结果返回给所述目标应用程序,以使得所述目标应用程序执行所述语音指令对应的操作。6.根据权利要求5所述的方法,所述方法还包括:获取第二应用程序,若基于预设配置表,确定所述第二应用程序调用所述语音控制程序,则接收所述第二应用程序的第二语音服务注册请求;基于所述第二语音服务注册请求,确定所述第二应用程序的语音服务注册信息。7.根据权利要求1所述的方法,所述基于所述目标应用程序对应的语音服务注册信息和预设配置表,确定所述语音控制程序与所述目标应用程序间的通信执行方式,包括:
若所述目标应用程序存在语音服务注册信息,且所述目标应用程序没有在预设配置表内,则确定所述语音控制程序与所述目标应用程序间的通信执行方式为虚拟点击;所述基于所述通信执行方式,控制所述目标应用程序执行所述语音指令对应的操作,包括:若所述通信执行方式为虚拟点击,则确定所述语义识别结果在所述目标应用程序中对应的目标按键;触发所述目标按键,使得所述目标应用程序执行所述语音指令对应的操作。8.根据权利要求7所述的方法,所述方法还包括:获取第三应用程序,若所述第三应用程序没有在预设配置表内,则确定所述显示文字与按键的关联关系,并提取所述第三应用程序的显示文字进行语音服务注册。9.根据权利要求8所述的方法,所述提取所述第三应用程序的显示文字进行语音服务注册,包括:提取所述第三应用程序的显示文字;确定所述显示文字的显示位置;基于所述显示文字和显示位置进行语音服务注册。10.根据权利要求1-9任一项所述的方法,所述方法还包括:基于接收到的配置信息,更新所述预设配置表。11.一种应用程序的语音控制装置,其特征在于,具体包括如下模块:识别处理模块,用于基于语音控制程序对获取的语音指令进行识别,确定所述语音指令对应的语义识别结果;程序确定模块,用于基于所述语义识别结果,确定目标应用程序;方式确定模块,用于基于所述目标应用程序对应的语音服务注册信息和预设配置表,确定所述语音控制程序与所述目标应用程序间的通信执行方式;操作处理模块,用于基于所述通信执行方式,控制所述目标应用程序执行所述语音指令对应的操作。12.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-10任一项所述的应用程序的语音控制方法。13.一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-10任一项所述的应用程序的语音控制方法。

技术总结


本发明提供了一种应用程序的语音控制方法、装置、计算机可读存储介质及电子设备,该方法包括:基于语音控制程序对获取的语音指令进行识别,确定所述语音指令对应的语义识别结果;基于所述语义识别结果,确定目标应用程序;基于所述目标应用程序对应的语音服务注册信息和预设配置表,确定所述语音控制程序与所述目标应用程序间的通信执行方式;基于所述通信执行方式,控制所述目标应用程序执行所述语音指令对应的操作。本发明提供的技术方案可以实现对下载的目标应用程序进行语音控制,便于用户的使用。户的使用。户的使用。


技术研发人员:

唐涛

受保护的技术使用者:

博泰车联网(南京)有限公司

技术研发日:

2021.08.02

技术公布日:

2023/2/9

本文发布于:2024-09-22 03:30:39,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/61062.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   应用程序   语音   目标
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议