语音控制方法、装置、存储介质以及电子设备与流程



1.本技术涉及语音控制技术领域,尤其涉及一种语音控制方法、装置、存储介质以及电子设备


背景技术:



2.随着语音技术的发展以及人们对智能化生活的追求,人们对电子设备的依赖性日益增强。其中,具备语音控制功能的电子设备常常出现语音交互的场景,即用户发出语音控制指令,电子设备根据该控制指令执行相关操作。但是当用户拥有多个具备语音控制功能的电子设备时,需要确定具体由哪个电子设备来执行语音指令。


技术实现要素:



3.本技术实施例提供一种语音控制方法、装置、存储介质以及电子设备,可以实现当用户拥有多个具备语音控制功能的电子设备时,准确确定具体由哪个电子设备来执行语音指令。
4.第一方面,本技术实施例提供一种语音控制方法,所述方法包括:
5.监测到用户语音满足语音唤醒条件时,判断当前设备是否处于第一预设设备状态
6.若所述当前设备处于所述第一预设设备状态,则将所述第一预设设备状态对应的第一设备状态信息发送至候选设备,所述候选设备与所述当前设备处于同一多设备场景中;
7.若接收到所述候选设备发送的第二设备状态信息,则根据所述第一预设设备状态以及所述第二设备状态信息对应的第二预设设备状态,确定所述当前设备是否进行语音交互。
8.第二方面,本技术实施例提供一种语音控制方法,所述方法包括:
9.监测到用户语音满足语音唤醒条件时,判断当前主设备是否处于第一预设设备状态;
10.若所述当前主设备处于所述第一预设设备状态,且接收到从属设备发送的第二设备状态信息,则根据第一预设设备状态对应的第一设备状态信息以及所述第二设备状态信息,从所述当前主设备以及所述从属设备中确定进行语音交互的目标交互设备;
11.基于交互指令控制所述目标交互设备进行语音交互。
12.第三方面,本技术实施例提供一种语音控制方法,所述方法包括:
13.监测到用户语音满足语音唤醒条件时,判断当前从属设备是否处于第二预设设备状态;
14.若所述当前从属设备处于所述第二预设设备状态,则将所述当前设备的第二设备状态信息发送至主设备;
15.若接收到所述主设备发送的交互指令,则控制所述当前从属设备进行语音交互,
其中,所述交互指令为所述主设备根据所述主设备的第一设备状态信息、所述当前从属设备的第二设备状态信息以及其他从属设备的第二设备状态信息生成。
16.第四方面,本技术实施例提供一种语音控制装置,所述装置包括:
17.语音唤醒模块,用于监测到用户语音满足语音唤醒条件时,判断当前设备是否处于第一预设设备状态;
18.设备状态发送模块,用于若所述当前设备处于所述第一预设设备状态,则将所述第一预设设备状态对应的第一设备状态信息发送至候选设备,所述候选设备与所述当前设备处于同一多设备场景中;
19.语音交互确定模块,用于若接收到所述候选设备发送的第二设备状态信息,则根据所述第一预设设备状态以及所述第二设备状态信息对应的第二预设设备状态,确定所述当前设备是否进行语音交互。
20.第五方面,本技术实施例提供一种语音控制装置,所述装置包括:
21.主设备语音唤醒模块,用于监测到用户语音满足语音唤醒条件时,判断当前主设备是否处于第一预设设备状态;
22.主设备语音交互确定模块,用于若所述当前主设备处于所述第一预设设备状态,且接收到从属设备发送的第二设备状态信息,则根据第一预设设备状态对应的第一设备状态信息以及所述第二设备状态信息,从所述当前主设备以及所述从属设备中确定进行语音交互的目标交互设备;
23.指令控制模块,用于基于交互指令控制所述目标交互设备进行语音交互。
24.第六方面,本技术实施例提供一种语音控制装置,所述装置包括:
25.从属设备语音唤醒模块,用于监测到用户语音满足语音唤醒条件时,判断当前从属设备是否处于第二预设设备状态;
26.从属设备状态发送模块,用于若所述当前从属设备处于所述第二预设设备状态,则将所述当前设备的第二设备状态信息发送至主设备;
27.从属设备语音交互模块,用于若接收到所述主设备发送的交互指令,则控制所述当前从属设备进行语音交互,其中,所述交互指令为所述主设备根据所述主设备的第一设备状态信息、所述当前从属设备的第二设备状态信息以及其他从属设备的第二设备状态信息生成。
28.第七方面,本技术实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法的步骤。
29.第八方面,本技术实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序。
30.本技术实施例一些实施例提供的技术方案带来的有益效果至少包括:
31.在本技术实施例中,首先监测到用户语音满足语音唤醒条件时,判断当前设备是否处于第一预设设备状态;然后若当前设备处于第一预设设备状态,则将第一预设设备状态对应的第一设备状态信息发送至候选设备,候选设备与当前设备处于同一多设备场景中;最后若接收到候选设备发送的第二设备状态信息,则根据第一预设设备状态以及第二设备状态信息对应的第二预设设备状态,确定当前设备是否进行语音交互。监测到用户语音满足语音唤醒条件时,可以获取当前设备的第一预设设备状态与候选设备的第二预设设
备状态,由于设备状态可以代表用户对设备的使用情况,因此根据各设备的设备状态可以确定用户具体想要使用哪个设备进行语音交互,有效提升了语音控制的准确性。
附图说明
32.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术实施例的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
33.图1为本技术实施例提供的相关技术中的一种设备交互方法;
34.图2为本技术实施例提供的一种语音控制方法的示例性系统架构图;
35.图3为本技术实施例提供的一种语音控制方法的流程示意图;
36.图4为本技术实施例提供的一种设备交互方法;
37.图5为本技术另一实施例提供的一种语音控制方法的流程示意图;
38.图6为本技术另一实施例提供的一种语音控制方法的流程示意图;
39.图7为本技术另一实施例提供的一种语音控制装置的结构框图;
40.图8为本技术另一实施例提供的一种语音控制方法的流程示意图;
41.图9为本技术另一实施例提供的一种语音控制装置的结构框图;
42.图10为本技术另一实施例提供的一种语音控制方法的流程示意图;
43.图11为本技术另一实施例提供的一种语音控制装置的结构框图;
44.图12为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
45.为使得本技术的特征和优点能够更加的明显和易懂,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而非全部实施例。基于本技术中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
46.下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
47.另外需要说明的是,本技术实施例所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本技术中涉及的对象特征、交互行为特征以及用户信息等都是在充分授权的情况下获取的。
48.语音助手是人工智能在电子设备上的重要应用。电子设备通过语音助手可以与用户进行智能对话和即时问答的智能交互。还可以识别用户输入的语音命令,并触发电子设备自动执行该语音命令对应的事件。通常情况下,语音助手是处于休眠状态的,用户在使用语音助手前,可以对语音助手进行语音唤醒。只有在语音助手被唤醒后,才可以接收并识别
用户输入的语音命令。用于唤醒的语音数据可以称为唤醒词,例如,以唤醒词为“小布小布”为例,如果用户想要使用语音助手查询a地的天气,则可说出“小布小布,a地的天气”的语音命令,在语音助手接收到该语义命令之后,可以基于唤醒词“小布小布”被唤醒,进而电子设备利用语音助手可以识别该语音命令,并触发电子设备查询a地的天气,并通过语音或者文字向用户播报a地的天气。
49.在相关技术中,随着技术的发展语音控制的应用越来越广泛。如,很多家居设备目前都支持语音控制功能。如可以通过在家居设备中安装语音助手来实现语音控制功能。这样,便会存在用户所处环境中(如用户家中)包括多个支持语音控制功能的设备的场景,即多设备场景。在该多设备场景下,如果这多个设备中存在唤醒词相同的设备,则在用户说出唤醒词后,具有相同唤醒词的设备的语音助手均会被唤醒,并都会对用户后续说出的语音命令进行识别并作出响应。
50.请参阅图1,图1为本技术实施例提供的相关技术中的一种设备交互方法。
51.如图1所示,将用户的客厅作为多设备场景,其中,用户家客厅有音箱101,电视机102、手机103以及穿戴手表104四个设备,这四个设备均安装有语音助手,且唤醒词均为“小布小布"。那么当用户说出包含唤醒词“小布小布”的语音控制命令之后,音箱101,电视机102、手机103以及穿戴手表104的语音助手均会被唤醒并识别该语音命令,并对语音命令进行识别并作出响应。
52.用户在多设备场景中,往往用户可能只需要某一个设备进行响应,例如,当用户正在使用手机时,此时若需要与语音助手进行语音交互时,由于与手机进行交互更加便捷,那么用户往往更加希望手机中的语音助手可以被唤醒并响应用户的控制命令进行语音交互,而如多个设备同时响应,给用户带来的体验较差。
53.针对上述技术问题,在本技术实施例中,首先监测到用户语音满足语音唤醒条件时,判断当前设备是否处于第一预设设备状态;然后若当前设备处于第一预设设备状态,则将第一预设设备状态对应的第一设备状态信息发送至候选设备,候选设备与当前设备处于同一多设备场景中;最后若接收到候选设备发送的第二设备状态信息,则根据第一预设设备状态以及第二设备状态信息对应的第二预设设备状态,确定当前设备是否进行语音交互。监测到用户语音满足语音唤醒条件时,可以获取当前设备的第一预设设备状态与候选设备的第二预设设备状态,由于设备状态可以代表用户对设备的使用情况,因此根据各设备的设备状态可以确定用户具体想要使用哪个设备进行语音交互,有效提升了语音控制的准确性。
54.请参阅图2,图2为本技术实施例提供的一种语音控制方法的示例性系统架构图。
55.如图2所示,系统架构可以包括电子设备201、网络202和服务器203。网络202用于在电子设备201和服务器203之间提供通信链路的介质。网络202可以包括各种类型的有线通信链路或无线通信链路,例如:有线通信链路包括光纤、双绞线或同轴电缆的,无线通信链路包括蓝牙通信链路、无线保真(wireless-fidelity,wi-fi)通信链路或微波通信链路等。
56.电子设备201可以通过网络202与服务器203交互,以接收来自服务器203的消息或向服务器203发送消息,或者电子设备201可以通过网络202与服务器203交互,进而接收其他用户向服务器203发送的消息或者数据。电子设备201可以是硬件,也可以是软件。当电子
设备201为硬件时,可以是各种电子设备,包括但不限于智能手表、智能手机、平板电脑、智能电视、膝上型便携式计算机和台式计算机等。当电子设备201为软件时,可以是安装在上述所列举的电子设备中,其可以实现呈多个软件或软件模块(例如:用来提供分布式服务),也可以实现成单个软件或软件模块,在此不作具体限定。
57.服务器203可以是提供各种服务的业务服务器。需要说明的是,服务器203可以是硬件,也可以是软件。当服务器203为硬件时,可以实现成多个服务器组成的分布式服务器集,也可以实现成单个服务器。当服务器203为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块,在此不做具体限定。
58.在本技术实施例中,电子设备201的数量可以是多个,多个电子设备201可以处于同一多设备场景,且处于同一多设备场景的多个电子设备201也可以直接通过网络202进行连接,也即多个电子设备201也可以直接基于网络202进行数据传输。因此该系统架构还可以不包括服务器203,换言之,服务器203可以为本说明书实施例中可选的设备,即本说明书实施例提供的方法可以应用于仅包括电子设备201的系统结构中,本技术实施例对此不做限定。
59.在本技术实施例中,如果将系统架构中的某一电子设备201作为当前设备时,若当前设备监测到用户语音满足语音唤醒条件时,判断当前设备是否处于第一预设设备状态,若当前设备处于第一预设设备状态,则将第一预设设备状态对应的第一设备状态信息发送至候选设备,候选设备与当前设备处于同一多设备场景中;若接收到候选设备发送的第二设备状态信息,则根据第一预设设备状态以及第二设备状态信息对应的第二预设设备状态,确定当前设备是否进行语音交互。
60.应理解,图2中的电子设备、网络以及服务器的数目仅是示意性的,根据实现需要,可以是任意数量的电子设备、网络以及服务器。
61.请参阅图3,图3为本技术实施例提供的一种语音控制方法的流程示意图。本技术实施例的执行主体可以是执行语音控制的电子设备,也可以是执行语音控制方法的电子设备中的处理器,还可以是执行语音控制方法的电子设备中的语音控制服务。为方便描述,下面以执行主体是电子设备中的处理器为例,介绍语音控制方法的具体执行过程。
62.如图3所示,语音控制方法至少可以包括:
63.s302、监测到用户语音满足语音唤醒条件时,判断当前设备是否处于第一预设设备状态。
64.可以理解的,在本技术实施例中,语音控制方法主要应用于多设备场景中,多设备场景中存在至少两个电子设备,处于同一多设备场景中的各电子设备属于同一设备组中,同一设备组中的电子设备具有相同设备等级(也即同一设备组中的电子设备不区分从属关系或者主次关系)且各电子设备之间可以直接进行数据传输或者基于服务器的数据转发进行数据传输。进一步地,各电子设备可以通过连接同一个无线接入点(如wifi接入点)、登录了同一个用户账号等方式,以使得各电子设备处于同一多设备场景中。
65.进一步地,处于同一多设备场景中的各电子设备中均设置有类似语音助手的程序,该程序可以基于麦克风采集的语音数据实时监听电子设备周围的用户发出的用户语音,判断用户是否需要进行语音交互。
66.一种判断用户是否需要进行语音交互的方式是,可以提前在各电子设备中设置语
音唤醒条件,若监测到用户语音满足语音唤醒条件时,就可以确认用户需要进行语音交互。在本技术实施例中,语音唤醒条件可以是用户语音中包括预设的唤醒词和/或用户语音对应的声纹为预设声纹,因此当语音助手通过麦克风采集到用户语音之后,可以基于用户语音进行唤醒词检测和/或声纹检测,当用户语音中包括预设的唤醒词和/或用户语音对应的声纹为预设声纹时,就可以认为检测到用户语音满足语音唤醒条件。语音唤醒条件还可以是电子设备处于预设状态,例如,若电子设备为智能手表,为了减少功耗,大部分时间智能手表都是处于熄屏状态,那么如果智能手表处于亮屏状态,则可以确定智能手表满足语音唤醒条件。
67.由于用户在使用电子设备或者对电子设备进行相关操作时,电子设备的设备状态会发生变化,例如,设备状态可以是指设备放置状态、屏幕点亮状态、待机状态、播放视频状态等静态或者动态的状态,因此电子设备的设备状态与用户的操作是关联的,因此当用户在多设备场景中需要进行语音交互时,往往更加希望自己正在操作的电子设备进行响应。
68.基于上述思路,在本技术实施例中,可以在处于同一多设备场景中的各电子设备在检测到用户语音满足语音唤醒条件时,都可以首先判断自身设备是否处于预设设备状态中。
69.具体地,处于同一多设备场景中的各电子设备,若电子设备的类型不同,则其对应的预设状态也不同,因此可以提前根据每个电子设备的设备类型分别设置不同电子设备对应的预设设备状态,那么若电子设备处于预设设备状态也就代表电子设备可能正在被用户操作或者使用,进而用户需要与该电子设备进行交互的可能性也就越大,为了便于将不同设备的预设设备状态进行区分,在本技术实施例中,将当前设备对应的预设设备状态确定为第一预设设备状态。
70.对于当前设备来说,若当前设备监测到用户语音满足语音唤醒条件时,可以判断当前设备是否处于第一预设设备状态,其中,判断前设备是否处于第一预设设备状态的方式可以不做限定,例如,可以通过获取当前设备中预设传感器采集的数据进而判断当前设备是否处于第一预设设备状态。
71.s304、若当前设备处于第一预设设备状态,则将第一预设设备状态对应的第一设备状态信息发送至候选设备,候选设备与当前设备处于同一多设备场景中。
72.若判断当前设备处于第一预设设备状态,则可以确定当前设备可能是为用户正在使用或者操作的设备,但是由于多设备场景中存在多个电子设备,因此多设备场景中还可能存在其他也处于预设设备状态的电子设备,那么为了便于从多个处于预设设备状态的电子设备中确定出用户想要进行语音交互的电子设备,处于同一多设备场景中的电子设备在确定自身处于预设设备状态之后,都可以将自身处于的预设设备状态对应的状态信息同步至其他电子设备。
73.进一步地,由于预设设备状态并不是实体数据,不能直接进行传输,因此当前设备可以获取代表第一预设设备状态的第一设备状态信息,并将第一设备状态发送至与当前设备处于同一多设备场景的至少一个候选设备,其中,候选设备可以是与当前设备处于同一多设备场景的所有电子设备,也可以是与当前设备处于同一多设备场景中用户指定的电子设备。
74.s306、若接收到候选设备发送的第二设备状态信息,则根据第一预设设备状态以
及第二设备状态信息对应的第二预设设备状态,确定当前设备是否进行语音交互。
75.由于多设备场景中存在多个电子设备,因此多设备场景中还可能存在其他也处于预设设备状态的电子设备,也即当前设备将第一设备状态对应的第一设备状态信息发送至候选设备时,有可能候选设备也会发送其对应的预设设备状态的设备状态信息,这里为了与当前设备处于的第一预设设备状态进行区分,在本技术实施例中,将候选设备处于的预设设备状态记为第二预设设备状态,那么在当前设备第一预设设备状态对应的第一设备状态信息发送至候选设备之后,当前设备可以等待第一预设时间,若在第一预设时间内接收到至少一个候选设备发送的第二设备状态信息,则代表多设备场景中还可能存在其他也处于预设设备状态的电子设备。
76.进一步地,在接收到至少一个候选设备发送的第二设备状态信息之后,可以根据第二设备状态信息分别确定各候选设备对应的第二预设设备状态,然后根据将第一预设设备状态与各第二预设设备状态进行比较,然后确定当前设备是否进行语音交互。其中,将第一预设设备状态与各第二预设设备状态进行比较的方式可以不做限定,可以是根据用户或者电子设备出厂时设置的规则进行比较,以确定比较结果。其中,若确定当前设备进行语音交互,则可以解析用户语音对应的语音控制命令,并响应该语音控制命令。
77.由于处于多设备场景中的每个电子设备都会执行上述语音控制方法,因此可以从处于多设备场景中的多个电子设备中确定一个进行语音交互的电子设备,提什么了用户进行语音交互时的体验。
78.请参阅图4,图4为本技术实施例提供的一种设备交互方法。
79.如图4所示,将用户的客厅作为多设备场景,其中,用户家客厅有音箱101,电视机102、手机103以及穿戴手表104四个设备,这四个设备均安装有语音助手,且唤醒词均为“小布小布"。那么当用户说出包含唤醒词“小布小布”的用户语音之后,音箱101,电视机102、手机103以及穿戴手表104的语音助手均可能都会监测到用户语音满足语音唤醒条件,那么音箱101,电视机102、手机103以及穿戴手表104会分别判断各自是否处于预设设备状态,如果手机103均判断自身处于第一预设设备状态,则会将第一预设设备状态对应的第一设备状态信息发送至音箱101,电视机102以及穿戴手表104,如果手机103接收到音箱101,电视机102以及穿戴手表104的第二设备状态信息,那么手机103会比较手机103的第一预设设备状态以及其他设备的第二设备状态信息对应的第二预设设备状态,进而确定手机103是否进行语音交互,那么音箱101,电视机102以及穿戴手表104也会确定自身是否进行语音交互,最终从音箱101,电视机102、手机103以及穿戴手表104确定出一个电子设备进行交互。
80.在图4中,手机103确定进行语音交互,那么手机103可以解析用户语音对应的语音控制命令,并影响该语音控制命令。
81.由于与手机进行交互更加便捷,那么用户往往更加希望手机中的语音助手可以被唤醒并响应用户的控制命令进行语音交互,而如多个设备同时响应,给用户带来的体验较差。
82.在本技术实施例中,首先监测到用户语音满足语音唤醒条件时,判断当前设备是否处于第一预设设备状态;然后若当前设备处于第一预设设备状态,则将第一预设设备状态对应的第一设备状态信息发送至候选设备,候选设备与当前设备处于同一多设备场景中;最后若接收到候选设备发送的第二设备状态信息,则根据第一预设设备状态以及第二
设备状态信息对应的第二预设设备状态,确定当前设备是否进行语音交互。监测到用户语音满足语音唤醒条件时,可以获取当前设备的第一预设设备状态与候选设备的第二预设设备状态,由于设备状态可以代表用户对设备的使用情况,因此根据各设备的设备状态可以确定用户具体想要使用哪个设备进行语音交互,有效提升了语音控制的准确性。
83.请参阅图5,图5为本技术另一实施例提供的一种语音控制方法的流程示意图。如图5所示,语音控制方法至少可以包括:
84.s502、监测到用户语音满足语音唤醒条件时,判断当前设备是否处于第一预设设备状态。
85.由于用户在使用电子设备或者对电子设备进行相关操作时,对不同类型的电子设备进行使用或者操作的方式也不同,进而导致不同类型的电子设备所处的预设设备状态不同,因此在判断当前设备是否处于第一预设设备状态的过程中,一种可行的实施方式是,可以先获取当前设备的设备类型,设备类型用于区分不同设备的类别,例如,设备类型可以分为手持设备、穿戴设备、音箱设备以及电视设备等,设备类型可以根据用户需要进行划分,也可以直接在出厂时进行划分;那么不同设备类型的电子设备对应的预设设备状态也是不同的,例如,当电子设备的设备类型为手持设备时,其对应的预设设备状态可以是手持状态;当电子设备的设备类型为穿戴设备时,其对应的预设设备状态可以是肢体抬起状态;当电子设备的设备类型为音箱设备时,其对应的预设设备状态可以是播放音乐状态;当电子设备的设备类型为电视设备时,其对应的预设设备状态可以是播放视频状态等。
86.进一步地,不同设备状态下设备中某些状态参数是不同的,那么可以根据当前设备的设备类型获取当前设备对应的指定状态参数,其中,指定状态参数可以通过指定的传感器等器件获取,最后根据指定状态参数判断当前设备是否处于第一预设设备状态。
87.例如,若当前设备的设备类型为手持设备,例如,当前设备为智能手机,那么对于手持设备来说如果用户正在使用或者操作手持设备,手持设备一般不会被口袋等物体遮挡,手持设备也并不会完全水平,并且手持设备不会非常平稳,因此若当前设备的设备类型为手持设备,则可以获取当前设备对应的遮挡状态参数、放置角度状态参数以及抖动状态参数中的至少一种,以便于根据遮挡参数、放置角度参数以及抖动参数中的至少一种判断当前设备是否处于手持状态。
88.具体地,如果根据遮挡参数、放置角度参数以及抖动参数判断当前设备是否处于手持状态时,那么首先可以基于遮挡状态参数判断当前设备是否被遮挡,其中,遮挡状态参数可以包括光照传感器采集的光照数值以及接近传感器采集的接近距离数值,如果光照数值小于预设光照数值,且接近距离数值小于预设接近距离数值,则可以确定当前设备被遮挡,也即确定当前设备不处于手持状态(第一预设设备状态);否则可以确定当前设备没有被遮挡,那么可以基于放置角度状态参数判断当前设备是否处于平放状态,其中,放置角度参数可以包括地磁传感器采集的地磁数值以及加速度传感器采集的加速度数值,如果基于地磁数值以及加速度数值计算出的角度小于预设平放角度,则可以确定当前设备处于平放状态,也即确定当前设备不处于手持状态(第一预设设备状态);否则可以确定当前设备不处于平放状态,可以基于抖动状态参数判断当前设备是否处于抖动状态,其中,抖动状态参数可以包括角速度传感器采集的角速度数值,根据角速度数值可以计算出时间滑动窗口内平均角速度值,若当前实时的角速度数值大于预设最大角速度值,或者当前实时的角速度
数值大于预设最小角速度值、小于预设最大角速度值且平均角速度值大于预设平均角速度数值,则可以确定当前设备处于抖动状态,那么也就可以确定当前设备处于手持状态(第一预设设备状态),否则可以确定当前设备不处于抖动状态,那么也就可以确定当前设备不处于手持状态(第一预设设备状态)。
89.s504、若当前设备处于第一预设设备状态,则将第一预设设备状态对应的第一设备状态信息发送至候选设备,候选设备与当前设备处于同一多设备场景中。
90.关于步骤s504,可以参阅上述步骤s304中的记载,此处不在赘述。
91.s506、若接收到候选设备发送的第二设备状态信息,则比较第一预设设备状态的优先级与第二设备状态信息对应的第二预设设备状态的优先级,根据优先级比较结果确定当前设备是否进行语音交互。
92.在本技术实施例中,在接收到候选设备发送的第二设备状态信息之后,可以对第一预设设备状态与第二设备状态信息对应的第二预设设备状态的进行比较,在比较过程中,一种可行的实施方式是,可以分别确定第一预设设备状态与以及各第二预设设备状态优先级,然后根据优先级比较结果确定当前设备是否进行语音交互。
93.具体地,可以根据用户的指示或者在设备出厂时预设设置处于同一多设备场景中各电子设备对应的预设设备状态的优先级顺序,然后预先设置的设备状态优先级顺序确定第一预设设备状态对应的第一状态优先级,以及确定第二设备状态信息对应的第二预设设备状态对应的第二状态优先级,若第一状态优先级大于第二状态优先级,代表当前设备拥有更高优先级的语音交互控制权,则确定当前设备进行语音交互;若第一状态优先级小于第二状态优先级,代表其他候选设备拥有更高优先级的语音交互控制权,则确定当前设备不进行语音交互。
94.s508、若未接收到候选设备发送的第二设备状态信息,则确定当前设备进行语音交互。
95.若当前设备在第一预设时间内未接收到候选设备发送的第二设备状态信息,代表多设备场景中不存在也处于预设设备状态的候选设备,此时可以直接确定当前设备的语音交互优先级最高,以及控制当前设备进行语音交互。
96.s510、若当前设备未处于第一预设设备状态且接收到候选设备发送的第二设备状态信息,则确定当前设备不进行语音交互。
97.如果当前设备未处于第一预设设备状态,但是却接收到候选设备发送的第二设备状态信息,代表多设备场景中存在也处于预设设备状态的候选设备,那么候选设备的语音交互优先级高,此时可以控制当前设备不进行语音交互。
98.若当前设备未处于第一预设设备状态且未接收到候选设备发送的第二设备状态信息,代表多设备场景中的所有电子设备的交互优先级都较低,则各电子设备可以不进行语音交互,继续监听用户的语音是否满足唤醒条件,也可以通过其他判定条件从多设备场景中的所有电子设备继续筛选进行语音交互的电子设备。
99.在本技术实施例中,通过比较多设备场景中各电子设备的设备类型,确定各电子设备是否满足预设设备状态,进而确定多设备场景中各电子设备的预设设备状态的优先级,以确定当前设备是否进行语音交互,可以提高判断语音交互设备的准确性。
100.请参阅图6,图6为本技术另一实施例提供的一种语音控制方法的流程示意图。如
图6所示,语音控制方法至少可以包括:
101.s602、监测到用户语音满足语音唤醒条件时,判断当前设备是否处于第一预设设备状态。
102.s604、若当前设备处于第一预设设备状态,则将第一预设设备状态对应的第一设备状态信息发送至候选设备,候选设备与当前设备处于同一多设备场景中。
103.s606、若接收到候选设备发送的第二设备状态信息,则根据第一预设设备状态以及第二设备状态信息对应的第二预设设备状态,确定当前设备是否进行语音交互。
104.关于步骤s602至s606,可以参阅上述实施例中的描述,此处不在赘述。
105.s608、若当前设备未处于第一预设设备状态且未接收到候选设备发送的第二设备状态信息,则根据用户语音获取当前设备对应的第一通用语音特征值,以及将第一通用语音特征值发送至候选设备。
106.如果当前设备未处于第一预设设备状态且未接收到候选设备发送的第二设备状态信息,代表多设备场景中的所有电子设备的交互优先级都较低,如果此时仍然需要选出一个电子设备进行语音交互,可以通过各电子设备对应的通用语音特征值选择出进行语音交互的电子设备。
107.其中,通用语音特征值用于表示发声源与设备之间的唤醒优先级,而表示发声源与设备之间的唤醒优先级的因素很多,那么可以使用通用语音特征参数来表征发声源与设备之间的唤醒优先级,也即通用语音特征值可以使用多种通用语音特征参数进行表示。容易理解地,由于用户与设备进行语音交互时,往往会靠近该设备并面向该设备发出用户语音,因此通用语音特征参数可以包括但不限于:发声源与设备之间的距离参数以及设备相对于发声源的方位参数。
108.具体地,发声源与设备之间的距离参数可以通过用户语音中唤醒词音频能量来计算,能量越大表示距离越近,发声源与设备之间的距离参数也就越小,唤醒优先级也越高。具体地,唤醒词音频能量需要尽可能降低环境噪声的影响,可以使用语音活动检测(voice activitydetection,vad)的方法在包含有唤醒词的用户语音基础上切分出唤醒词和环境噪声,进一步地可以得到唤醒词的能量和时长以及环境噪声的能量和时长,那么去除噪声影响的唤醒词能量可以如下计算:
[0109][0110]
其中,唤醒词的能量和时长分别计为es、ts,以及环境噪声的能量和时长分别计为en、tn,那么可以看做是唤醒词的功率,可以看做是环境噪声的功率,那么与之差可以认为是去除噪声影响的唤醒词的功率,进而可以通过去除噪声影响的唤醒词的功率去表示去除噪声影响的唤醒词能量。
[0111]
进一步地,当前设备相对于发声源的方位参数的计算方法可以通过预先录制的音频数据训练出声音朝向的决策模型,然后将用户语音输入至该决策模型以得到声音朝向结果也即当前设备相对于发声源的方位参数,其中预先录制的音频数据可以包括:1、频谱特征数据,选择频谱特征数据的原因是发声源对于发声源的方位参数增大,声音会更多的经过反射到达当前设备,那么当前设备接收到的用户语音中高频部分相较于低频部分会衰减
的更多。2、混响特征数据,选择混响特征数据的原因是如果发声源对于发声源的方位参数增大,混响能量越大,那么当前设备可以计算用户语音的语音直混比以及自相关特征,如果混响越大,自相关结果的峰值也会越多越大。3、多麦特征数据,选择多麦特征数据的原因是如果当前设备有多个麦克风参与语音的控制,还可以计算多个麦克风的声音方向特征,辅助决策当前设备相对于发声源的方位参数。
[0112]
进一步地,由于第一通用语音特征参数的数量可以是多个,那么不同的第一通用语音特征参数对发声源与设备之间的唤醒优先级的影响是不同的,因此预设对各第一通用语音特征参数对应的第一通用语音特征权值进行设置,其中,第一通用语音特征参数对发声源与设备之间的唤醒优先级的影响越大,则其对应的第一通用语音特征权值也就越大。例如,如果第一通用语音特征参数包括:发声源与当前设备之间的距离参数以及当前设备相对于发声源的方位参数,那么可以设置发声源与当前设备之间的距离参数对应的第一通用语音特征权值为0.6,以及设置当前设备相对于发声源的方位参数对应的第一语音特征权值为0.4。
[0113]
那么在获取到当前设备对应第一通用语音特征参数之后,还可以获取各第一通用语音特征参数对应的第一通用语音特征权值,进而基于各第一通用语音特征参数以及各第一通用语音特征权值,计算当前设备对应的第一通用语音特征值,也即各第一通用语音特征参数与其对应的第一通用语音特征权值相乘,并将各乘积结果相加作为当前设备对应的第一通用语音特征值。
[0114]
进一步地,在根据用户语音获取当前设备对应的第一通用语音特征值之后,需要将第一通用语音特征值同步给多设备场景中的其他电子设备,同样的,多设备场景中的其他电子设备也会使用与当前设备相同的方法获取用户语音对应的第二通用语音特征值,并将第二通用语音特征值同步给当前设备。
[0115]
s610、若接收到候选设备发送的第二通用语音特征值,则根据第一通用语音特征值以及第二通用语音特征值,确定当前设备是否进行语音交互。
[0116]
在本技术实施例中,当前设备将第一通用语音特征值发送至多设备场中的所有候选设备之后,可以等待第二预设时间,若在第二预设时间内至少一个候选设备接收到候选设备发送的第二通用语音特征值,则可以根据第一通用语音特征值以及第二通用语音特征值,也即比较第一通用语音特征值以及第二通用语音特征值,根据比较结果确定当前设备是否进行语音交互。
[0117]
具体地,可以比较第一通用语音特征值以及第二通用语音特征值,若第一通用语音特征值大于第二通用语音特征值,代表当前设备具有与用户更高的交互优先权,则确定当前设备进行语音交互;若第一通用语音特征值小于第二通用语音特征值,代表当前设备不具有与用户更高的交互优先权,也即其他候选设备具有与用户更高的交互优先权,则确定当前设备不进行语音交互;若第一通用语音特征值等于第二通用语音特征值,代表当前设备和其他候选设备都不具有更高的交互优先权,此时可以判断当前设备是否为预先设置的优先交互设备,其中,优先交互设备为用户自定义设置或者电子设备出厂时设置的,以便于在多个设备的通用语音特征值相同时,选择其中一个电子设备进行交互,避免出现用户语音交互失败的情况,那么如果确定当前设备为预先设置的优先交互设备,则确定当前设备进行语音交互。
[0118]
s612、若未接收到候选设备发送的第二通用语音特征值,则确定当前设备进行语音交互。
[0119]
在本技术实施例中,当前设备将第一通用语音特征值发送至多设备场中的所有候选设备之后,可以等待第二预设时间,若在第二预设时间内未接收到候选设备发送的第二通用语音特征值,代表多场景设备中除了当前设备没有其他候选设备获取到通用语音特征值,此时可以直接确定当前设备进行语音交互。
[0120]
在本技术实施例中,在确定多设备场景中的各电子设备均不处于预设状态时,可以分别获取各电子设备针对用户语音获取的通用语音特征,进而根据通用语音特征选择进行语音交互的电子设备,有效提升了确定进行语音交互的设备的准确性。
[0121]
请参阅图7,图7为本技术另一实施例提供的一种语音控制装置的结构框图。如图7所示,语音控制装置700包括:
[0122]
语音唤醒模块710,用于监测到用户语音满足语音唤醒条件时,判断当前设备是否处于第一预设设备状态;
[0123]
设备状态发送模块720,用于若当前设备处于第一预设设备状态,则将第一预设设备状态对应的第一设备状态信息发送至候选设备,候选设备与当前设备处于同一多设备场景中;
[0124]
第一语音交互确定模块730,用于若接收到候选设备发送的第二设备状态信息,则根据第一预设设备状态以及第二设备状态信息对应的第二预设设备状态,确定当前设备是否进行语音交互。
[0125]
可选地,第一语音交互确定模块730,还用于比较第一预设设备状态的优先级与第二设备状态信息对应的第二预设设备状态的优先级,根据优先级比较结果确定当前设备是否进行语音交互。
[0126]
可选地,第一语音交互确定模块730,还用于根据预先设置的设备状态优先级顺序确定第一预设设备状态对应的第一状态优先级,以及确定第二设备状态信息对应的第二预设设备状态对应的第二状态优先级;若第一状态优先级大于第二状态优先级,则确定当前设备进行语音交互;若第一状态优先级小于第二状态优先级,则确定当前设备不进行语音交互。
[0127]
可选地,语音唤醒模块710,还用于获取当前设备的设备类型,根据设备类型获取当前设备对应的指定状态参数;根据指定状态参数判断当前设备是否处于第一预设设备状态。
[0128]
可选地,语音唤醒模块710,还用于若设备类型为手持设备,则获取当前设备对应的遮挡状态参数、放置角度状态参数以及抖动状态参数;根据遮挡参数、放置角度参数以及抖动参数判断当前设备是否处于手持状态。
[0129]
可选地,语音控制装置700还包括:第二语音交互确定模块,用于若未接收到候选设备发送的第二设备状态信息,则确定当前设备进行语音交互。
[0130]
可选地,语音控制装置700还包括:第三语音交互确定模块,用于若当前设备未处于第一预设设备状态且接收到候选设备发送的第二设备状态信息,则确定当前设备不进行语音交互。
[0131]
可选地,语音控制装置700还包括:第四语音交互确定模块,用于若当前设备未处
于第一预设设备状态且未接收到候选设备发送的第二设备状态信息,则根据用户语音获取当前设备对应的第一通用语音特征值,以及将第一通用语音特征值发送至候选设备;若接收到候选设备发送的第二通用语音特征值,则根据第一通用语音特征值以及第二通用语音特征值,确定当前设备是否进行语音交互。
[0132]
可选地,第四语音交互确定模块,还用于根据用户语音获取当前设备对应第一通用语音特征参数以及各第一通用语音特征参数对应的第一通用语音特征权值;基于各第一通用语音特征参数以及各第一通用语音特征权值,计算当前设备对应的第一通用语音特征值。
[0133]
可选地,第一通用语音特征参数包括但不限于:发声源与当前设备之间的距离参数以及当前设备相对于发声源的方位参数。
[0134]
可选地,第四语音交互确定模块,还用于若第一通用语音特征值大于第二通用语音特征值,则确定当前设备进行语音交互;若第一通用语音特征值小于第二通用语音特征值,则确定当前设备不进行语音交互;若第一通用语音特征值等于第二通用语音特征值,且确定当前设备为预先设置的优先交互设备,则确定当前设备进行语音交互。
[0135]
可选地,语音控制装置700还包括:第五语音交互确定模块,用于若未接收到候选设备发送的第二通用语音特征值,则确定当前设备进行语音交互。
[0136]
在本技术实施例中,语音控制装置包括:语音唤醒模块,用于监测到用户语音满足语音唤醒条件时,判断当前设备是否处于第一预设设备状态;设备状态发送模块,用于若当前设备处于第一预设设备状态,则将第一预设设备状态对应的第一设备状态信息发送至候选设备,候选设备与当前设备处于同一多设备场景中;语音交互确定模块,用于若接收到候选设备发送的第二设备状态信息,则根据第一预设设备状态以及第二设备状态信息对应的第二预设设备状态,确定当前设备是否进行语音交互。监测到用户语音满足语音唤醒条件时,可以获取当前设备的第一预设设备状态与候选设备的第二预设设备状态,由于设备状态可以代表用户对设备的使用情况,因此根据各设备的设备状态可以确定用户具体想要使用哪个设备进行语音交互,有效提升了语音控制的准确性。
[0137]
请参阅图8,图8为本技术另一实施例提供的一种语音控制方法的流程示意图。
[0138]
如图8所示,语音控制方法包括:
[0139]
s802、监测到用户语音满足语音唤醒条件时,判断当前主设备是否处于第一预设设备状态。
[0140]
在本技术实施例中,多设备场景中存在至少两个电子设备,处于同一多设备场景中的各电子设备属于同一设备组中,同一设备组中的电子设备具有从属关系或者主次关系,也即多设备场景中至少存在一个主设备以及至少一个从属设备,例如,多设备环境中包括音箱,电视机、手机以及穿戴手表,那么可以将数据处理性能较好的手机作为主设备,而将数据处理性能较差的音箱,电视机以及穿戴手表作为从属设备。为了方便描述,先以语音控制方法应用于主设备进行描述。
[0141]
当主设备监测到用户语音满足语音唤醒条件时,可以先判断当前主设备自身是否处于第一预设设备状态。
[0142]
s804、若当前主设备处于第一预设设备状态,且接收到从属设备发送的第二设备状态信息,则根据第一预设设备状态对应的第一设备状态信息以及第二设备状态信息,从
当前主设备以及从属设备中确定进行语音交互的目标交互设备。
[0143]
若当前设备处于第一预设设备状态,则可以确定当前设备可能是为用户正在使用或者操作的设备,但是由于多设备场景中存在多个电子设备,因此多设备场景中还可能存在其他也处于预设设备状态的电子设备,那么为了便于从多个处于预设设备状态的电子设备中确定出用户想要进行语音交互的电子设备,处于同一多设备场景中的从属设备在确定自身处于预设设备状态之后,都可以将自身处于的预设设备状态对应的状态信息同步至主设备。
[0144]
因此在主设备接收到从属设备发送的第二设备状态信息之后,可以根据第一预设设备状态对应的第一设备状态信息以及第二设备状态信息,从当前主设备以及从属设备中确定进行语音交互的目标交互设备。具体根据设备状态信息确定目标交互设备的方法可以参阅上述实施例中的描述,此处不在赘述。
[0145]
s806、基于交互指令控制目标交互设备进行语音交互。
[0146]
在确定目标交互设备之后,主设备可以生成交互指令,若目标交互设备为当前主设备,则直接基于交互指令控制当前主设备进行语音交互;若目标交互设备为从属设备,则将交互指令发送至目标交互设备,交互指令用于指示目标交互设备进行语音交互,也即目标交互设备接收到交互指令之后控制目标交互设备本身进行语音交互。
[0147]
进一步地,若当前主设备处于第一预设设备状态,且未接收到从属设备发送的第二设备状态信息,则控制当前主设备进行语音交互。
[0148]
可选地,若当前主设备未处于第一预设设备状态,那么代表当前主设备不具备设备状态方面的语音交互优先级,此时若接收到从属设备发送的第二设备状态信息,则可以根据第二设备状态信息从从属设备中确定进行语音交互的目标交互设备,并基于交互指令控制目标交互设备进行语音交互。
[0149]
可选地,若当前主设备未处于第一预设设备状态且未接收到从属设备发送的第二设备状态信息,代表多设备场景中的所有电子设备的交互优先级都较低,如果此时仍然需要选出一个电子设备进行语音交互,可以通过各电子设备对应的通用语音特征值选择出进行语音交互的电子设备,此时可以根据用户语音获取当前主设备对应的第一通用语音特征值;若接收到从属设备发送的第二通用语音特征值,则根据第一通用语音特征值以及第二通用语音特征值,从当前主设备以及从属设备中确定进行语音交互的目标交互设备,以及基于交互指令控制目标交互设备进行语音交互。
[0150]
可选地,若当前主设备未监测到用户语音满足语音唤醒条件,且接收到从属设备发送的第二设备状态信息时,则根据第二设备状态信息从从属设备中确定进行语音交互的目标交互设备,以及基于交互指令控制目标交互设备进行语音交互。
[0151]
可选地,若当前主设备未监测到用户语音满足语音唤醒条件且接收到从属设备发送的第二通用语音特征值,则根据第二通用语音特征值从从属设备中确定进行语音交互的目标交互设备,以及基于交互指令控制目标交互设备进行语音交互。
[0152]
在本技术实施例中,将根据状态信息确定目标交互设备或者根据语音特征值确定目标交互设备的工作均设置在主设备中,一方面,由于主设备的性能较好,因此可以提高确定目标交互设备的速度,另一方面,由于从属设备的性能较差,那么可以减少从属设备的数据处理量,降低从属设备的功耗。
[0153]
请参阅图9,图9为本技术另一实施例提供的一种语音控制装置的结构框图。如图9所示,语音控制装置900包括:
[0154]
主设备语音唤醒模块910,用于监测到用户语音满足语音唤醒条件时,判断当前主设备是否处于第一预设设备状态;
[0155]
主设备语音交互确定模块920,用于若当前主设备处于第一预设设备状态,且接收到从属设备发送的第二设备状态信息,则根据第一预设设备状态对应的第一设备状态信息以及第二设备状态信息,从当前主设备以及从属设备中确定进行语音交互的目标交互设备;
[0156]
指令控制模块930,用于基于交互指令控制目标交互设备进行语音交互。
[0157]
可选地,主设备语音交互确定模块920,还用于若目标交互设备为当前主设备,则基于交互指令控制当前主设备进行语音交互;若目标交互设备为从属设备,则将交互指令发送至目标交互设备,交互指令用于指示目标交互设备进行语音交互。
[0158]
可选地,主设备语音交互确定模块920,还用于若当前主设备处于第一预设设备状态,且未接收到从属设备发送的第二设备状态信息,则控制当前主设备进行语音交互。
[0159]
可选地,主设备语音交互确定模块920,还用于若当前主设备未处于第一预设设备状态,且接收到从属设备发送的第二设备状态信息,则根据第二设备状态信息从从属设备中确定进行语音交互的目标交互设备;基于交互指令控制目标交互设备进行语音交互。
[0160]
可选地,主设备语音交互确定模块920,还用于若当前主设备未处于第一预设设备状态且未接收到从属设备发送的第二设备状态信息,则根据用户语音获取当前主设备对应的第一通用语音特征值;若接收到从属设备发送的第二通用语音特征值,则根据第一通用语音特征值以及第二通用语音特征值,从当前主设备以及从属设备中确定进行语音交互的目标交互设备;基于交互指令控制目标交互设备进行语音交互。
[0161]
可选地,主设备语音交互确定模块920,还用于若未监测到用户语音满足语音唤醒条件,且接收到从属设备发送的第二设备状态信息时,则根据第二设备状态信息从从属设备中确定进行语音交互的目标交互设备;基于交互指令控制目标交互设备进行语音交互。
[0162]
可选地,主设备语音交互确定模块920,还用于若未监测到用户语音满足语音唤醒条件且接收到从属设备发送的第二通用语音特征值,则根据第二通用语音特征值从从属设备中确定进行语音交互的目标交互设备;基于交互指令控制目标交互设备进行语音交互。
[0163]
请参阅图10,图10为本技术另一实施例提供的一种语音控制方法的流程示意图。
[0164]
如图10所示,语音控制方法包括:
[0165]
s1002、监测到用户语音满足语音唤醒条件时,判断当前从属设备是否处于第二预设设备状态。
[0166]
在本技术实施例中,多设备场景中存在至少两个电子设备,处于同一多设备场景中的各电子设备属于同一设备组中,同一设备组中的电子设备具有从属关系或者主次关系,也即多设备场景中至少存在一个主设备以及至少一个从属设备,例如,多设备环境中包括音箱,电视机、手机以及穿戴手表,那么可以将数据处理性能较好的手机作为主设备,而将数据处理性能较差的音箱,电视机以及穿戴手表作为从属设备。为了方便描述,先以语音控制方法应用于从属设备进行描述。
[0167]
s1004、若当前从属设备处于第二预设设备状态,则将当前设备的第二设备状态信
息发送至主设备。
[0168]
s1006、若接收到主设备发送的交互指令,则控制当前从属设备进行语音交互,其中,交互指令为主设备根据主设备的第一设备状态信息、当前从属设备的第二设备状态信息以及其他从属设备的第二设备状态信息生成。
[0169]
可选地,若当前从属设备不处于第二预设设备状态,且未接收到主设备发送的交互指令,则根据用户语音获取当前从属设备对应的第二通用语音特征值,以及将第二通用语音特征值发送至主设备;若接收到主设备发送的交互指令,则控制当前从属设备进行语音交互,其中交互指令为主设备根据主设备对应的第二语音特征值、当前从属设备的第二语音特征值以及其他从属设备的第二语音特征值生成。
[0170]
在本技术实施例中,将根据状态信息确定目标交互设备或者根据语音特征值确定目标交互设备的工作均设置在主设备中,一方面,由于主设备的性能较好,因此可以提高确定目标交互设备的速度,另一方面,由于从属设备的性能较差,那么可以减少从属设备的数据处理量,降低从属设备的功耗。
[0171]
请参阅图11,图11为本技术另一实施例提供的一种语音控制装置的结构框图。如图11所示,语音控制装置1100包括:
[0172]
从属设备语音唤醒模块1110,用于监测到用户语音满足语音唤醒条件时,判断当前从属设备是否处于第二预设设备状态;
[0173]
从属设备状态发送模块1120,用于若当前从属设备处于第二预设设备状态,则将当前设备的第二设备状态信息发送至主设备;
[0174]
从属设备语音交互模块1130,用于若接收到主设备发送的交互指令,则控制当前从属设备进行语音交互,其中,交互指令为主设备根据主设备的第一设备状态信息、当前从属设备的第二设备状态信息以及其他从属设备的第二设备状态信息生成。
[0175]
可选地,从属设备语音交互模块1130,还用于若当前从属设备不处于第二预设设备状态,且未接收到主设备发送的交互指令,则根据用户语音获取当前从属设备对应的第二通用语音特征值,以及将第二通用语音特征值发送至主设备。
[0176]
可选地,从属设备语音交互模块1130,还用于若接收到主设备发送的交互指令,则控制当前从属设备进行语音交互,其中交互指令为主设备根据主设备对应的第二语音特征值、当前从属设备的第二语音特征值以及其他从属设备的第二语音特征值生成。
[0177]
本技术实施例还提供了一种计算机存储介质,计算机存储介质可以存储有多条指令,指令适于由处理器加载并执行如上述实施例中的任一项的方法的步骤。
[0178]
请参见图12,图12为本技术实施例提供的一种电子设备的结构示意图。如图12所示,电子设备1200可以包括:至少一个电子设备处理器1201,至少一个网络接口1204,用户接口1203,存储器1205,至少一个通信总线1202。
[0179]
其中,通信总线1202用于实现这些组件之间的连接通信。
[0180]
其中,用户接口1203可以包括显示屏(display)、摄像头(camera),可选用户接口1203还可以包括标准的有线接口、无线接口。
[0181]
其中,网络接口1204可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。
[0182]
其中,电子设备处理器1201可以包括一个或者多个处理核心。电子设备处理器1201利用各种接口和线路连接整个电子设备1200内的各个部分,通过运行或执行存储在存
储器1205内的指令、程序、代码集或指令集,以及调用存储在存储器1205内的数据,执行电子设备1200的各种功能和处理数据。可选的,电子设备处理器1201可以采用数字信号处理(digital signal processing,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。电子设备处理器1201可集成中央处理器(central processing unit,cpu)、图像处理器(graphics processing unit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到电子设备处理器1201中,单独通过一块芯片进行实现。
[0183]
其中,存储器1205可以包括随机存储器(random access memory,ram),也可以包括只读存储器(read-only memory,rom)。可选的,该存储器1205包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器1205可用于存储指令、程序、代码、代码集或指令集。存储器1205可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器1205可选的还可以是至少一个位于远离前述电子设备处理器1201的存储装置。如图12所示,作为一种计算机存储介质的存储器1205中可以包括操作系统、网络通信模块、用户接口模块以及语音控制程序。
[0184]
在图12所示的电子设备1200中,用户接口1203主要用于为用户提供输入的接口,获取用户输入的数据;而电子设备处理器1201可以用于调用存储器1205中存储的语音控制程序,并具体执行以下操作:
[0185]
监测到用户语音满足语音唤醒条件时,判断当前设备是否处于第一预设设备状态;
[0186]
若当前设备处于第一预设设备状态,则将第一预设设备状态对应的第一设备状态信息发送至候选设备,候选设备与当前设备处于同一多设备场景中;
[0187]
若接收到候选设备发送的第二设备状态信息,则根据第一预设设备状态以及第二设备状态信息对应的第二预设设备状态,确定当前设备是否进行语音交互。
[0188]
在一个实施例中,根据第一预设设备状态以及第二设备状态信息对应的第二预设设备状态,确定当前设备是否进行语音交互,包括:比较第一预设设备状态的优先级与第二设备状态信息对应的第二预设设备状态的优先级,根据优先级比较结果确定当前设备是否进行语音交互。
[0189]
在一个实施例中,比较第一预设设备状态的优先级与第二设备状态信息对应的第二预设设备状态的优先级,根据优先级比较结果确定当前设备是否进行语音交互,包括:根据预先设置的设备状态优先级顺序确定第一预设设备状态对应的第一状态优先级,以及确定第二设备状态信息对应的第二预设设备状态对应的第二状态优先级;若第一状态优先级大于第二状态优先级,则确定当前设备进行语音交互;若第一状态优先级小于第二状态优先级,则确定当前设备不进行语音交互。
[0190]
在一个实施例中,判断当前设备是否处于第一预设设备状态,包括:获取当前设备的设备类型,根据设备类型获取当前设备对应的指定状态参数;根据指定状态参数判断当
前设备是否处于第一预设设备状态。
[0191]
在一个实施例中,根据设备类型获取当前设备对应的指定状态参数,包括:若设备类型为手持设备,则获取当前设备对应的遮挡状态参数、放置角度状态参数以及抖动状态参数;根据设备状态参数判断当前设备是否处于第一预设设备状态,包括:根据遮挡参数、放置角度参数以及抖动参数判断当前设备是否处于手持状态。
[0192]
在一个实施例中,方法还包括:若未接收到候选设备发送的第二设备状态信息,则确定当前设备进行语音交互。
[0193]
在一个实施例中,方法还包括:若当前设备未处于第一预设设备状态且接收到候选设备发送的第二设备状态信息,则确定当前设备不进行语音交互。
[0194]
在一个实施例中,方法还包括:若当前设备未处于第一预设设备状态且未接收到候选设备发送的第二设备状态信息,则根据用户语音获取当前设备对应的第一通用语音特征值,以及将第一通用语音特征值发送至候选设备;若接收到候选设备发送的第二通用语音特征值,则根据第一通用语音特征值以及第二通用语音特征值,确定当前设备是否进行语音交互。
[0195]
在一个实施例中,根据用户语音获取当前设备对应的第一通用语音特征值,包括:根据用户语音获取当前设备对应第一通用语音特征参数以及各第一通用语音特征参数对应的第一通用语音特征权值;基于各第一通用语音特征参数以及各第一通用语音特征权值,计算当前设备对应的第一通用语音特征值。
[0196]
在一个实施例中,第一通用语音特征参数包括但不限于:发声源与当前设备之间的距离参数以及当前设备相对于发声源的方位参数。
[0197]
在一个实施例中,根据第一通用语音特征值以及第二通用语音特征值,确定当前设备是否进行语音交互,包括:若第一通用语音特征值大于第二通用语音特征值,则确定当前设备进行语音交互;若第一通用语音特征值小于第二通用语音特征值,则确定当前设备不进行语音交互;若第一通用语音特征值等于第二通用语音特征值,且确定当前设备为预先设置的优先交互设备,则确定当前设备进行语音交互。
[0198]
在一个实施例中,方法还包括:若未接收到候选设备发送的第二通用语音特征值,则确定当前设备进行语音交互。
[0199]
在图12所示的电子设备1200中,用户接口1203主要用于为用户提供输入的接口,获取用户输入的数据;而电子设备处理器1201可以用于调用存储器1205中存储的语音控制程序,并具体执行以下操作:
[0200]
监测到用户语音满足语音唤醒条件时,判断当前主设备是否处于第一预设设备状态;若当前主设备处于第一预设设备状态,且接收到从属设备发送的第二设备状态信息,则根据第一预设设备状态对应的第一设备状态信息以及第二设备状态信息,从当前主设备以及从属设备中确定进行语音交互的目标交互设备;基于交互指令控制目标交互设备进行语音交互。
[0201]
在一个实施例中,若目标交互设备为当前主设备,则基于交互指令控制当前主设备进行语音交互;若目标交互设备为从属设备,则将交互指令发送至目标交互设备,交互指令用于指示目标交互设备进行语音交互。
[0202]
在一个实施例中,语音控制方法还包括:若当前主设备处于第一预设设备状态,且
未接收到从属设备发送的第二设备状态信息,则控制当前主设备进行语音交互。
[0203]
在一个实施例中,语音控制方法还包括:若当前主设备未处于第一预设设备状态,且接收到从属设备发送的第二设备状态信息,则根据第二设备状态信息从从属设备中确定进行语音交互的目标交互设备;基于交互指令控制目标交互设备进行语音交互。
[0204]
在一个实施例中,语音控制方法还包括:若当前主设备未处于第一预设设备状态且未接收到从属设备发送的第二设备状态信息,则根据用户语音获取当前主设备对应的第一通用语音特征值;若接收到从属设备发送的第二通用语音特征值,则根据第一通用语音特征值以及第二通用语音特征值,从当前主设备以及从属设备中确定进行语音交互的目标交互设备;基于交互指令控制目标交互设备进行语音交互。
[0205]
在一个实施例中,语音控制方法还包括:若未监测到用户语音满足语音唤醒条件,且接收到从属设备发送的第二设备状态信息时,则根据第二设备状态信息从从属设备中确定进行语音交互的目标交互设备;基于交互指令控制目标交互设备进行语音交互。
[0206]
在一个实施例中,语音控制方法还包括:若未监测到用户语音满足语音唤醒条件且接收到从属设备发送的第二通用语音特征值,则根据第二通用语音特征值从从属设备中确定进行语音交互的目标交互设备;基于交互指令控制目标交互设备进行语音交互。
[0207]
在图12所示的电子设备1200中,用户接口1203主要用于为用户提供输入的接口,获取用户输入的数据;而电子设备处理器1201可以用于调用存储器1205中存储的语音控制程序,并具体执行以下操作:
[0208]
监测到用户语音满足语音唤醒条件时,判断当前从属设备是否处于第二预设设备状态;若当前从属设备处于第二预设设备状态,则将当前设备的第二设备状态信息发送至主设备;若接收到主设备发送的交互指令,则控制当前从属设备进行语音交互,其中,交互指令为主设备根据主设备的第一设备状态信息、当前从属设备的第二设备状态信息以及其他从属设备的第二设备状态信息生成。
[0209]
在一个实施例中,语音控制方法还包括:若当前从属设备不处于第二预设设备状态,且未接收到主设备发送的交互指令,则根据用户语音获取当前从属设备对应的第二通用语音特征值,以及将第二通用语音特征值发送至主设备;若接收到主设备发送的交互指令,则控制当前从属设备进行语音交互,其中交互指令为主设备根据主设备对应的第二语音特征值、当前从属设备的第二语音特征值以及其他从属设备的第二语音特征值生成。
[0210]
在本技术实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0211]
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0212]
另外,在本技术实施例各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集
成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
[0213]
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术实施例各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0214]
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术实施例并不受所描述的动作顺序的限制,因为依据本技术实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本技术实施例所必须的。
[0215]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
[0216]
以上为对本技术实施例所提供的语音控制方法、装置、存储介质以及电子设备的描述,对于本领域的技术人员,依据本技术实施例实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本技术实施例的限制。

技术特征:


1.一种语音控制方法,其特征在于,所述方法包括:监测到用户语音满足语音唤醒条件时,判断当前设备是否处于第一预设设备状态;若所述当前设备处于所述第一预设设备状态,则将所述第一预设设备状态对应的第一设备状态信息发送至候选设备,所述候选设备与所述当前设备处于同一多设备场景中;若接收到所述候选设备发送的第二设备状态信息,则根据所述第一预设设备状态以及所述第二设备状态信息对应的第二预设设备状态,确定所述当前设备是否进行语音交互。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一预设设备状态以及所述第二设备状态信息对应的第二预设设备状态,确定所述当前设备是否进行语音交互,包括:比较所述第一预设设备状态的优先级与所述第二设备状态信息对应的第二预设设备状态的优先级,根据优先级比较结果确定所述当前设备是否进行语音交互。3.根据权利要求2所述的方法,其特征在于,所述比较所述第一预设设备状态的优先级与所述第二设备状态信息对应的第二预设设备状态的优先级,根据优先级比较结果确定所述当前设备是否进行语音交互,包括:根据预先设置的设备状态优先级顺序确定所述第一预设设备状态对应的第一状态优先级,以及确定所述第二设备状态信息对应的第二预设设备状态对应的第二状态优先级;若所述第一状态优先级大于所述第二状态优先级,则确定所述当前设备进行语音交互;若所述第一状态优先级小于所述第二状态优先级,则确定所述当前设备不进行语音交互。4.根据权利要求1所述的方法,其特征在于,所述判断所述当前设备是否处于第一预设设备状态,包括:获取所述当前设备的设备类型,根据所述设备类型获取所述当前设备对应的指定状态参数;根据所述指定状态参数判断所述当前设备是否处于第一预设设备状态。5.根据权利要求4所述的方法,其特征在于,所述根据所述设备类型获取所述当前设备对应的指定状态参数,包括:若所述设备类型为手持设备,则获取所述当前设备对应的遮挡状态参数、放置角度状态参数以及抖动状态参数中的至少一种;根据所述设备状态参数判断所述当前设备是否处于第一预设设备状态,包括:根据所述遮挡参数、所述放置角度参数以及所述抖动参数中的至少一种判断所述当前设备是否处于手持状态。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:若未接收到所述候选设备发送的第二设备状态信息,则确定所述当前设备进行语音交互。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述当前设备未处于所述第一预设设备状态且接收到所述候选设备发送的第二设备状态信息,则确定所述当前设备不进行语音交互。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述当前设备未处于所述第一预设设备状态且未接收到所述候选设备发送的第二
设备状态信息,则根据所述用户语音获取所述当前设备对应的第一通用语音特征值,以及将所述第一通用语音特征值发送至所述候选设备;若接收到所述候选设备发送的第二通用语音特征值,则根据所述第一通用语音特征值以及所述第二通用语音特征值,确定所述当前设备是否进行语音交互。9.根据权利要求8所述的方法,其特征在于,所述根据所述用户语音获取所述当前设备对应的第一通用语音特征值,包括:根据所述用户语音获取所述当前设备对应第一通用语音特征参数以及各第一通用语音特征参数对应的第一通用语音特征权值;基于各第一通用语音特征参数以及各第一通用语音特征权值,计算所述当前设备对应的第一通用语音特征值。10.根据权利要求9所述的方法,其特征在于,所述第一通用语音特征参数包括但不限于:发声源与所述当前设备之间的距离参数以及所述当前设备相对于所述发声源的方位参数。11.根据权利要求8所述的方法,其特征在于,所述根据所述第一通用语音特征值以及所述第二通用语音特征值,确定所述当前设备是否进行语音交互,包括:若所述第一通用语音特征值大于所述第二通用语音特征值,则确定所述当前设备进行语音交互;若所述第一通用语音特征值小于所述第二通用语音特征值,则确定所述当前设备不进行语音交互;若所述第一通用语音特征值等于所述第二通用语音特征值,且确定所述当前设备为预先设置的优先交互设备,则确定所述当前设备进行语音交互。12.根据权利要求8所述的方法,其特征在于,所述方法还包括:若未接收到所述候选设备发送的第二通用语音特征值,则确定所述当前设备进行语音交互。13.一种语音控制方法,其特征在于,所述方法包括:监测到用户语音满足语音唤醒条件时,判断当前主设备是否处于第一预设设备状态;若所述当前主设备处于所述第一预设设备状态,且接收到从属设备发送的第二设备状态信息,则根据第一预设设备状态对应的第一设备状态信息以及所述第二设备状态信息,从所述当前主设备以及所述从属设备中确定进行语音交互的目标交互设备;基于交互指令控制所述目标交互设备进行语音交互。14.根据权利要求13所述的方法,其特征在于,所述基于交互指令控制所述目标交互设备进行语音交互,包括:若所述目标交互设备为所述当前主设备,则基于交互指令控制所述当前主设备进行语音交互;若所述目标交互设备为所述从属设备,则将交互指令发送至所述目标交互设备,所述交互指令用于指示所述目标交互设备进行语音交互。15.根据权利要求13所述的方法,其特征在于,所述方法还包括:若所述当前主设备处于所述第一预设设备状态,且未接收到从属设备发送的第二设备状态信息,则控制所述当前主设备进行语音交互。
16.根据权利要求13所述的方法,其特征在于,所述方法还包括:若所述当前主设备未处于所述第一预设设备状态,且接收到所述从属设备发送的第二设备状态信息,则根据所述第二设备状态信息从所述从属设备中确定进行语音交互的目标交互设备;基于交互指令控制所述目标交互设备进行语音交互。17.根据权利要求13所述的方法,其特征在于,所述方法还包括:若所述当前主设备未处于所述第一预设设备状态且未接收到所述从属设备发送的第二设备状态信息,则根据所述用户语音获取所述当前主设备对应的第一通用语音特征值;若接收到所述从属设备发送的第二通用语音特征值,则根据所述第一通用语音特征值以及所述第二通用语音特征值,从所述当前主设备以及所述从属设备中确定进行语音交互的目标交互设备;基于交互指令控制所述目标交互设备进行语音交互。18.根据权利要求13所述的方法,其特征在于,所述方法还包括:若未监测到用户语音满足语音唤醒条件,且接收到所述从属设备发送的第二设备状态信息时,则根据所述第二设备状态信息从所述从属设备中确定进行语音交互的目标交互设备;基于所述交互指令控制所述目标交互设备进行语音交互。19.根据权利要求18所述的方法,其特征在于,所述方法还包括:若未监测到用户语音满足语音唤醒条件且接收到所述从属设备发送的第二通用语音特征值,则根据所述第二通用语音特征值从所述从属设备中确定进行语音交互的目标交互设备;基于交互指令控制所述目标交互设备进行语音交互。20.一种语音控制方法,其特征在于,所述方法包括:监测到用户语音满足语音唤醒条件时,判断当前从属设备是否处于第二预设设备状态;若所述当前从属设备处于所述第二预设设备状态,则将所述当前设备的第二设备状态信息发送至主设备;若接收到所述主设备发送的交互指令,则控制所述当前从属设备进行语音交互,其中,所述交互指令为所述主设备根据所述主设备的第一设备状态信息、所述当前从属设备的第二设备状态信息以及其他从属设备的第二设备状态信息生成。21.根据权利要求20所述的方法,其特征在于,所述方法还包括:若所述当前从属设备不处于所述第二预设设备状态,且未接收到所述主设备发送的交互指令,则根据所述用户语音获取所述当前从属设备对应的第二通用语音特征值,以及将所述第二通用语音特征值发送至所述主设备;若接收到所述主设备发送的交互指令,则控制所述当前从属设备进行语音交互,其中所述交互指令为所述主设备根据所述主设备对应的第二语音特征值、所述当前从属设备的第二语音特征值以及其他从属设备的第二语音特征值生成。22.一种语音控制装置,其特征在于,所述装置包括:语音唤醒模块,用于监测到用户语音满足语音唤醒条件时,判断当前设备是否处于第
一预设设备状态;设备状态发送模块,用于若所述当前设备处于所述第一预设设备状态,则将所述第一预设设备状态对应的第一设备状态信息发送至候选设备,所述候选设备与所述当前设备处于同一多设备场景中;语音交互确定模块,用于若接收到所述候选设备发送的第二设备状态信息,则根据所述第一预设设备状态以及所述第二设备状态信息对应的第二预设设备状态,确定所述当前设备是否进行语音交互。23.一种语音控制装置,其特征在于,所述装置包括:主设备语音唤醒模块,用于监测到用户语音满足语音唤醒条件时,判断当前主设备是否处于第一预设设备状态;主设备语音交互确定模块,用于若所述当前主设备处于所述第一预设设备状态,且接收到从属设备发送的第二设备状态信息,则根据第一预设设备状态对应的第一设备状态信息以及所述第二设备状态信息,从所述当前主设备以及所述从属设备中确定进行语音交互的目标交互设备;指令控制模块,用于基于交互指令控制所述目标交互设备进行语音交互。24.一种语音控制装置,其特征在于,所述装置包括:从属设备语音唤醒模块,用于监测到用户语音满足语音唤醒条件时,判断当前从属设备是否处于第二预设设备状态;从属设备状态发送模块,用于若所述当前从属设备处于所述第二预设设备状态,则将所述当前设备的第二设备状态信息发送至主设备;从属设备语音交互模块,用于若接收到所述主设备发送的交互指令,则控制所述当前从属设备进行语音交互,其中,所述交互指令为所述主设备根据所述主设备的第一设备状态信息、所述当前从属设备的第二设备状态信息以及其他从属设备的第二设备状态信息生成。25.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~12、13~19以及20~21任意一项的所述方法的步骤。26.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1~12、13~19以及20~21任一项所述方法的步骤。

技术总结


本申请实施例公开了一种语音控制方法、装置、存储介质以及电子设备。首先监测到用户语音满足语音唤醒条件时,若确定当前设备处于第一预设设备状态,则将第一预设设备状态对应的第一设备状态信息发送至候选设备;若接收到候选设备发送的第二设备状态信息,则根据第一预设设备状态以及第二设备状态信息对应的第二预设设备状态,确定当前设备是否进行语音交互。监测到用户语音满足语音唤醒条件时,可以获取当前设备的第一预设设备状态与候选设备的第二预设设备状态,由于设备状态可以代表用户对设备的使用情况,因此根据各设备的设备状态可以确定用户具体想要使用哪个设备进行语音交互,有效提升了语音控制的准确性。有效提升了语音控制的准确性。有效提升了语音控制的准确性。


技术研发人员:

印亚兵 张昊旻 严锋贵 高烨

受保护的技术使用者:

OPPO广东移动通信有限公司

技术研发日:

2022.11.17

技术公布日:

2023/3/17

本文发布于:2024-09-22 23:38:10,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/79124.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:设备   语音   状态   所述
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议