语音设备的控制方法、装置、电子设备及存储介质与流程



1.本发明实施例涉及语音设备技术领域,尤其涉及一种语音设备的控制方法、装置、电子设备及存储介质。


背景技术:



2.随着科学技术的发展,基于语音控制的智能设备(以下简称:语音设备)在人们的日常生活中应用得越来越广泛,从智能语音音箱、智能手机到智能空调等等。
3.现有技术中,在大部分生活场景中,只要用户输入语音指令,语音设备就会接收该语音指令,然后响应该语音指令进行对应的后续处理。
4.因此,如果只限于在小家庭内部场景下,使用语音设备问题不大,但是若将语音设备引入到公共场景下,如理发店、饭店等,由于会无差别响应多用户的反复控制,容易造成语音设备性能损耗,同时每次响应都会打断语音设备当前播放的资源,一定程度上限制了语音设备的应用场景。


技术实现要素:



5.鉴于此,为解决现有技术中语音设备会无差别响应多用户的反复控制,容易造成语音设备性能损耗,同时每次响应都会打断语音设备当前播放的资源,一定程度上限制了语音设备的应用场景的技术问题,本发明实施例提供一种语音设备的控制方法、装置、电子设备及存储介质。
6.第一方面,本发明实施例提供一种语音设备的控制方法,所述方法包括:
7.获取语音设备采集到的语音指令;
8.对所述语音指令进行语音识别,得到所述语音指令对应的用户意图
9.确定所述用户意图所属的意图类型;
10.根据所述用户意图所属的意图类型,确定目标控制策略;
11.按照所述目标控制策略对所述语音设备进行控制。
12.在一个可能的实施方式中,在所述确定所述用户意图所属的意图类型之前,还包括:
13.确定所述语音设备被配置的工作模式;
14.在确定所述语音设备被配置为第一工作模式的情况下,执行所述确定所述用户意图所属的意图类型的步骤。
15.在一个可能的实施方式中,在所述确定所述语音设备被配置的工作模式之后,还包括:
16.在确定所述语音设备被配置为第二工作模式的情况下,生成与所述用户意图对应的控制指令,并向所述语音设备下发所述控制指令,以由所述语音设备执行所述控制指令;结束流程。
17.在一个可能的实施方式中,所述意图类型包括第一意图类型;
18.所述根据所述用户意图所属的意图类型,确定目标控制策略,包括:
19.在确定所述用户意图所属的意图类型为第一意图类型的情况下,确定目标控制策略为控制所述语音设备播放与所述用户意图对应的资源;
20.所述按照所述目标控制策略对所述语音设备进行控制,包括:
21.在确定所述用户意图所属的意图类型为第一意图类型的情况下,确定所述用户意图对应的资源;
22.将所述资源添加至所述语音设备对应的播放队列,并顺次从所述播放队列中获取资源下发给所述语音设备以由所述语音设备进行播放。
23.在一个可能的实施方式中,所述方法还包括:
24.在检测到所述播放队列不为空时,将所述语音设备的状态置为资源播放状态;
25.在检测到所述播放队列为空时,将所述语音设备的状态置为空闲状态。
26.在一个可能的实施方式中,所述意图类型包括第二意图类型;
27.所述根据所述用户意图所属的意图类型,确定目标控制策略,包括:
28.在确定所述用户意图所属的意图类型为第二意图类型的情况下,确定目标控制策略为控制所述语音设备不执行与所述用户意图对应的设备控制操作;
29.所述按照所述目标控制策略对所述语音设备进行控制,包括:
30.在确定所述用户意图所属的意图类型为第二意图类型的情况下,控制所述语音设备不执行与所述用户意图对应的设备控制操作。
31.在一个可能的实施方式中,所述意图类型包括第三意图类型;
32.所述根据所述用户意图所属的意图类型,确定目标控制策略,包括:
33.在确定所述用户意图所属的意图类型为第三意图类型的情况下,确定目标控制策略为控制所述语音设备根据当前状态播放与所述用户意图对应的设备状态参数;
34.所述按照所述目标控制策略对所述语音设备进行控制,包括:
35.在确定所述用户意图所属的意图类型为第三意图类型的情况下,确定所述语音设备的当前状态;
36.若所述当前状态为空闲状态,则控制所述语音设备播放与所述用户意图对应的设备状态参数;
37.所述方法还包括:
38.若所述当前状态为资源播放状态,则控制所述语音设备不播放与所述用户意图对应的设备状态参数。
39.第二方面,本发明实施例提供一种语音设备的控制装置,所述装置包括:
40.指令获取模块,用于获取语音设备采集到的语音指令;
41.语音识别模块,用于对所述语音指令进行语音识别,得到所述语音指令对应的用户意图;
42.类型确定模块,用于确定所述用户意图所属的意图类型;
43.策略确定模块,用于根据所述用户意图所属的意图类型,确定目标控制策略;
44.控制模块,用于按照所述目标控制策略对所述语音设备进行控制。
45.在一个可能的实施方式中,所述装置还包括:
46.模式确定模块,用于确定所述语音设备被配置的工作模式;
47.第一执行模块,用于在确定所述语音设备被配置为第一工作模式的情况下,执行所述确定所述用户意图所属的意图类型的步骤。
48.在一个可能的实施方式中,所述装置还包括:
49.第二执行模块,用于在确定所述语音设备被配置为第二工作模式的情况下,生成与所述用户意图对应的控制指令,并向所述语音设备下发所述控制指令,以由所述语音设备执行所述控制指令;结束流程。
50.在一个可能的实施方式中,所述意图类型包括第一意图类型;
51.所述策略确定模块,具体用于:
52.在确定所述用户意图所属的意图类型为第一意图类型的情况下,确定目标控制策略为控制所述语音设备播放与所述用户意图对应的资源;
53.所述控制模块,具体用于:
54.在确定所述用户意图所属的意图类型为第一意图类型的情况下,确定所述用户意图对应的资源;
55.将所述资源添加至所述语音设备对应的播放队列,并顺次从所述播放队列中获取资源下发给所述语音设备以由所述语音设备进行播放。
56.在一个可能的实施方式中,所述装置还包括:
57.第一状态模块,用于在检测到所述播放队列不为空时,将所述语音设备的状态置为资源播放状态;
58.第二状态模块,用于在检测到所述播放队列为空时,将所述语音设备的状态置为空闲状态。
59.在一个可能的实施方式中,所述意图类型包括第二意图类型;
60.所述策略确定模块,具体用于:
61.在确定所述用户意图所属的意图类型为第二意图类型的情况下,确定目标控制策略为控制所述语音设备不执行与所述用户意图对应的设备控制操作;
62.所述控制模块,具体用于:
63.在确定所述用户意图所属的意图类型为第二意图类型的情况下,控制所述语音设备不执行与所述用户意图对应的设备控制操作。
64.在一个可能的实施方式中,所述意图类型包括第三意图类型;
65.所述策略确定模块,具体用于:
66.在确定所述用户意图所属的意图类型为第三意图类型的情况下,确定目标控制策略为控制所述语音设备根据当前状态播放与所述用户意图对应的设备状态参数;
67.所述控制模块,具体用于:
68.在确定所述用户意图所属的意图类型为第三意图类型的情况下,确定所述语音设备的当前状态;
69.若所述当前状态为空闲状态,则控制所述语音设备播放与所述用户意图对应的设备状态参数;
70.所述方法还包括:
71.若所述当前状态为资源播放状态,则控制所述语音设备不播放与所述用户意图对应的设备状态参数。
72.第三方面,本发明实施例提供一种电子设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的语音设备的控制程序,以实现第一方面中任一项所述的语音设备的控制方法。
73.第四方面,本发明实施例提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现第一方面中任一项所述的语音设备的控制方法。
74.本发明实施例提供的技术方案,通过获取语音设备采集到的语音指令,对语音指令进行语音识别,得到语音指令对应的用户意图,然后确定用户意图所属的意图类型。最后根据用户意图所属的意图类型,确定目标控制策略,最后按照目标控制策略对语音设备进行控制。这和现有技术相比,由于是先确定用户意图所属的意图类型,再根据用户意图所属的意图类型,确定目标控制策略,因此不会无差别响应多用户的反复控制,有效减少了语音设备的性能损耗,提高了语音设备的智能性,丰富了语音设备的应用场景。
附图说明
75.图1为本发明实施例提供的语音设备的控制方法的应用场景示意图;
76.图2为本发明实施例提供的一种语音设备的控制方法的实施例流程图;
77.图3为本发明实施例提供的另一种语音设备的控制方法的实施例流程图;
78.图4为本发明实施例提供的又一种语音设备的控制方法的实施例流程图;
79.图5为本发明实施例提供的再一种语音设备的控制方法的实施例流程图;
80.图6为本发明实施例提供的还一种语音设备的控制方法的实施例流程图;
81.图7为本发明实施例提供的一种语音设备的控制装置的实施例框图;
82.图8为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
83.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
84.以下首先对本发明实施例提供的语音设备的控制方法的应用场景做出示例性说明:
85.参见图1,为本发明实施例提供的语音设备的控制方法的应用场景示意图。图1所示应用场景中包括:智能音箱11、智能电视12、智能空调13,以及云服务器14。
86.语音设备是指支持语音控制技术的设备,包括但不限于:智能音箱11、智能电视12、智能空调13等。在图1所示应用场景中,以智能音箱11为例,智能音箱11可以采集周围环境中的语音指令,将语音指令发送给云服务器14,云服务器14解析该语音指令,得到对应的控制指令并发送给智能音箱11,智能音箱11执行该控制指令,实现对智能音箱11进行语音控制。
87.作为一示例性应用场景,语音设备可以应用在家居生活场景下,例如客厅、卧室等区域。
88.作为另一示例性应用场景,语音设备可以应用在公共场景下,例如,如理发店、饭店等区域。
89.可以理解的是,在实际生活场景中,语音设备的数量以及类型可由用户根据实际需要进行设定,本发明实施例对此不做限制。
90.云服务器14为语音设备所连接的云服务器,可应用本发明实施例提供的方法来实现对语音设备的控制。
91.此外,云服务器14还可以向语音设备提供更新升级、设置提醒等其他基础服务。
92.下面结合附图以具体实施例对本发明提供的语音设备的控制方法做进一步的解释说明,实施例并不构成对本发明实施例的限定。
93.参见图2,为本发明实施例提供的一种语音设备的控制方法的实施例流程图。如图2所示,该方法可包括以下步骤:
94.步骤201、获取语音设备采集到的语音指令。
95.在图1所示的应用场景中,智能音箱11可采集周围环境中的语音指令,将采集到的语音指令发送给云服务器14,云服务器14可获取智能音箱11采集到的语音指令。
96.步骤202、对语音指令进行语音识别,得到语音指令对应的用户意图。
97.语音识别技术,是指将声音音频转化成文字的一种技术,类似于人类的耳朵,听懂他人的说话内容,语音识别可能将语音指令转化为文本。
98.云服务器14可对上述语音指令进行语音识别,对语音识别文本进行解析,获得语义解析结果。根据语义解析结果,得到语音指令对应的用户意图。
99.步骤203、确定用户意图所属的意图类型。
100.本发明实施例中,可将上述意图类型分类以下三种类型:第一意图类型,第二意图类型,以及第三意图类型。具体的,第一意图类型可指资源获取类(如获取音频、获取视频等),第二意图类型可指设备控制类(如打开设备、关闭设备、调整音量等),第三意图类型可指状态查询类(如链接状态查询、运行状态查询等)。
101.云服务器14可在得到语音指令对应的用户意图后,确定用户意图所属的意图类型。
102.可选的,云服务器可通过关键词匹配的方式确定用户意图所属的意图类型。如下述表1,为意图类型与关键字之间对应关系表的一种示例:
103.表1
[0104][0105][0106]
上述给出的意图类型分类方法以及表1中的对应关系仅仅是一种示例,具体的可由专业人员进行设定,本发明对此不作限制。
[0107]
可选的,可以根据实际需要调整每一意图类型的范围,还可以新增第四意图类型
可指对话(如请求-响应、聊天等)。
[0108]
举例来说,若用户意图为播放一首歌,则云服务器14可确定用户意图所属的意图类型为第一意图类型。
[0109]
步骤204、根据用户意图所属的意图类型,确定目标控制策略。
[0110]
步骤205、按照目标控制策略对语音设备进行控制。
[0111]
下面对步骤204与步骤205进行统一描述:
[0112]
在本发明实施例中,云服务器14可根据用户意图所属的意图类型,确定目标控制策略,按照该目标控制策略对智能音箱11进行控制。
[0113]
具体是如何根据用户意图所属的意图类型,确定目标控制策略,以及按照目标控制策略对语音设备进行控制的,在下文中通过图4所示流程进行说明,在此先不详述。
[0114]
至此,完成图2所示流程的相关描述。
[0115]
通过图2所示流程可以看出,本发明实施例提供的技术方案,通过获取语音设备采集到的语音指令,对语音指令进行语音识别,得到语音指令对应的用户意图,然后确定用户意图所属的意图类型。最后根据用户意图所属的意图类型,确定目标控制策略,最后按照目标控制策略对语音设备进行控制。这和现有技术相比,由于是先确定用户意图所属的意图类型,再根据用户意图所属的意图类型,确定目标控制策略,因此不会无差别响应多用户的反复控制,有效减少了语音设备的性能损耗,提高了语音设备的智能性,丰富了语音设备的应用场景。
[0116]
参见图3,为本发明实施例提供的另一种语音设备的控制方法的实施例流程图。如图3所示,该方法可包括以下步骤:
[0117]
步骤301、获取语音设备采集到的语音指令。
[0118]
步骤302、对语音指令进行语音识别,得到语音指令对应的用户意图。
[0119]
至于步骤301和步骤302的详细描述,可以参见上述图2实施例中步骤201和步骤202的相关描述,在此不再赘述。
[0120]
步骤303、确定语音设备被配置的工作模式。在确定语音设备被配置为第一工作模式的情况下,执行步骤304,在确定语音设备被配置为第二工作模式的情况下,执行步骤307。
[0121]
步骤304、确定用户意图所属的意图类型。
[0122]
步骤305、根据用户意图所属的意图类型,确定目标控制策略。
[0123]
步骤306、按照目标控制策略对语音设备进行控制。
[0124]
步骤307、生成与用户意图对应的控制指令,并向语音设备下发控制指令,以由语音设备执行控制指令。
[0125]
执行步骤307后,结束流程。
[0126]
下面对步骤303至步骤307进行统一描述:
[0127]
上述第一工作模式为不响应用户对设备控制请求的工作模式,可应用于公共场景下。第二工作模式为正常工作模式,无差别地响应用户各种请求,可应用于家庭场景下。
[0128]
基于此,本发明实施例中,云服务器在获取语音设备采集到的语音指令,对语音指令进行语音识别,得到语音指令对应的用户意图之后,首先确定语音设备被配置的工作模式。在确定语音设备被配置为第一工作模式的情况下,再确定用户意图所属的意图类型,根
据用户意图所属的意图类型,确定目标控制策略,以按照目标控制策略对语音设备进行控制。
[0129]
在确定语音设备被配置为第二工作模式的情况下,生成与用户意图对应的控制指令,并向语音设备下发控制指令,以由语音设备执行控制指令。
[0130]
具体是如何根据用户意图所属的意图类型,确定目标控制策略,以及按照目标控制策略对语音设备进行控制的,在下文中通过图4所示流程进行说明,在此先不详述。
[0131]
至此,完成图3所示流程的相关描述。
[0132]
通过图3所示流程可以看出,本发明实施例提供的技术方案,通过确定语音设备被配置的工作模式,在确定语音设备被配置为第一工作模式的情况下,执行确定用户意图所属的意图类型及根据用户意图所属的意图类型,确定目标控制策略,按照目标控制策略对语音设备进行控制的步骤,在确定语音设备被配置为第二工作模式的情况下,生成与用户意图对应的控制指令,并向语音设备下发控制指令,以由语音设备执行控制指令。由于针对语音设备的不同工作模式,采取了不同的控制策略,因此使得语音设备既能在家庭环境中使用,也可以在公共场景下使用,提高了语音设备的适用性,丰富了语音设备的应用场景。
[0133]
参见图4,为本发明实施例提供的又一种语音设备的控制方法的实施例流程图。如图4所示,该方法可包括以下步骤:
[0134]
步骤401、获取语音设备采集到的语音指令。
[0135]
步骤402、对语音指令进行语音识别,得到语音指令对应的用户意图。
[0136]
至于步骤401至步骤402的详细描述,可以参见上述图2实施例中步骤201至步骤202的相关描述,在此不再赘述。
[0137]
步骤403、确定用户意图所属的意图类型。在确定用户意图所属的意图类型为第一意图类型的情况下,执行步骤404;在确定用户意图所属的意图类型为第二意图类型的情况下,执行步骤407;在确定用户意图所属的意图类型为第三意图类型的情况下,执行步骤409。
[0138]
步骤404、确定目标控制策略为控制语音设备播放与用户意图对应的资源。
[0139]
405、确定用户意图对应的资源。
[0140]
406、将资源添加至语音设备对应的播放队列,并顺次从播放队列中获取资源下发给语音设备以由语音设备进行播放。
[0141]
下面对步骤404至步骤406进行统一描述:
[0142]
在本发明实施例中,云服务器在确定用户意图所属的意图类型为第一意图类型的情况下,根据第一意图类型(例如资源获取类),确定目标控制策略为控制语音设备播放与用户意图对应的资源。云服务器按照上述目标控制策略对语音设备进行控制。
[0143]
具体的,云服务器可先确定用户意图对应的资源,然后将资源添加至语音设备对应的播放队列,并顺次从播放队列中获取资源下发给语音设备以由语音设备进行播放。
[0144]
如此,通过引入流式资源播放控制方案,完成资源点播功能,同时采用流式资源下发至语音设备,不会打断语音设备当前播放的资源,优化了语音设备使用体验。
[0145]
在一可选的实施例中,在云服务器检测到播放队列不为空时,将本地记录的语音设备的状态置为资源播放状态;在云服务器检测到播放队列为空时,将本地记录的语音设备的状态置为空闲状态。
[0146]
由此,云服务器可实时更新语音设备的状态,为后续云服务器在语音设备的不同状态下,针对同一语音指令确定不同的控制策略提供基础。
[0147]
步骤407、确定目标控制策略为控制语音设备不执行与用户意图对应的设备控制操作。
[0148]
步骤408、控制语音设备不执行与用户意图对应的设备控制操作。
[0149]
下面对步骤407和步骤408进行统一描述:
[0150]
在本发明实施例中,云服务器在确定用户意图所属的意图类型为第二意图类型的情况下,根据第二意图类型(例如设备控制类),确定目标控制策略为控制语音设备不执行与用户意图对应的设备控制操作。
[0151]
云服务器按照上述目标控制策略对语音设备进行控制,即控制语音设备不执行与用户意图对应的设备控制操作。
[0152]
如此,可以实现不响应设备控制类意图的语音指令,有效避免了多用户对语音设备的反复控制,减少语音设备的性能损耗。
[0153]
步骤409、确定目标控制策略为控制语音设备根据当前状态播放与用户意图对应的设备状态参数。
[0154]
步骤410、确定语音设备的当前状态。若当前状态为空闲状态,则执行步骤411,若当前状态为资源播放状态,则执行步骤412。
[0155]
步骤411、控制语音设备播放与用户意图对应的设备状态参数。
[0156]
步骤412、控制语音设备不播放与用户意图对应的设备状态参数。
[0157]
下面对步骤409至步骤412进行统一描述:
[0158]
在本发明实施例中,云服务器在确定用户意图所属的意图类型为第三意图类型的情况下,根据第三意图类型(例如是状态查询类),确定目标控制策略为控制语音设备根据当前状态播放与用户意图对应的设备状态参数。云服务器按照上述目标控制策略对语音设备进行控制。
[0159]
具体的,云服务器可先确定语音设备的当前状态;若当前状态为空闲状态,控制语音设备播放与用户意图对应的设备状态参数。若当前状态为资源播放状态,则控制语音设备不播放与用户意图对应的设备状态参数。
[0160]
如此可以实现,仅在语音设备处于空闲状态的情况下,才对状态查询类的指令进行响应,避免打断语音设备当前播放的资源,提高了语音设备的智能性。
[0161]
可选的,若存在其他意图类型,可以依据是否会打断当前资源播放的标准来确定具体的控制策略。
[0162]
例如,若存在第四意图类型(如对话类),可以采取和第二意图类型相似的控制策略,控制语音设备不执行与用户意图对应的响应,以确保当前资源播放不会被打断。
[0163]
至此,完成图4所示流程的相关描述。
[0164]
通过图4所示流程可以看出,本发明实施例提供的技术方案,通过在确定用户意图所属的意图类型为第一意图类型的情况下,确定目标控制策略为控制语音设备播放与用户意图对应的资源,然后确定用户意图对应的资源,将资源添加至语音设备对应的播放队列,并顺次从播放队列中获取资源下发给语音设备以由语音设备进行播放。在确定用户意图所属的意图类型为第二意图类型的情况下,确定目标控制策略为控制语音设备不执行与用户
意图对应的设备控制操作,控制语音设备不执行与用户意图对应的设备控制操作。在确定用户意图所属的意图类型为第三意图类型的情况下,确定目标控制策略为控制语音设备根据当前状态播放与用户意图对应的设备状态参数,然后确定语音设备的当前状态,若当前状态为空闲状态,则控制语音设备播放与用户意图对应的设备状态参数;若当前状态为资源播放状态,则控制语音设备不播放与用户意图对应的设备状态参数。由于对资源获取类的语音指令进行响应,对设备控制类的语音指令不响应,仅在设备空闲状态下对状态查询类的语音指令进行响应,可以实现有效避免多用户反复控制带来的设备损耗与纠纷可能,避免了设备无差别实现控制指令与每次资源播放都打断当前内容,提高了语音设备的智能性,优化公共场景下的语音设备使用体验。
[0165]
参见图5,为本发明实施例提供的再一种语音设备的控制方法的实施例流程图。如图5所示,该方法可包括以下步骤:
[0166]
图5所示实施例可在具有语音设备的场景下生效,无论用户是否公共场景,都可以通过手机等关联终端的app(application,应用程序)接入语音设备并打开本实施例所示的方案生效开关。
[0167]
可选的,还可直接在语音设备上打开本实施例所示的方案生效开关按钮。
[0168]
当语音设备接收到用户语音输入的语音指令,云服务通过语音设备获取该语音指令,首先进行语音识别与语义解析。
[0169]
若语义解析失败,则丢弃输入的语音指令,判断语音指令为非用户意图;若语义解析成功,得到语音指令对应的nludata(natural language understandingdata,自然语言理解数据)。
[0170]
通过nludata判断语音指令对应的用户意图是否为设备控制类意图。
[0171]
如果是设备控制类意图(如:打开空调),则丢弃语音指令,不执行该语音指令。
[0172]
如果不是设备控制类意图,通过nludata判断语音指令对应的用户意图为状态查询类意图。如果是状态查询类意图(如:空调现在是什么状态),则检测语音设备状态是否处于空闲状态。
[0173]
如果语音设备处于资源播放状态,则丢弃语音指令,不执行该语音指令。如果设备处于空闲状态,则查询设备与云服务器的链接状态,生成该语音指令对应的响应,并将响应下发到语音设备进行播报。
[0174]
如果不是状态查询类意图,在通过nludata判断语音指令对应的用户意图是资源获取类意图的情况下,则获取语音指令对应的资源列表,加入云服务器播放队列,以使语音设备进行资源播放。
[0175]
此外,若从上述步骤中判断出该语音指令对应的用户意图不是设备控制类意图与状态查询类意图,可尝试依据该语音指令中的请求内容获取资源,若成功获取资源,则将资源加入云服务器播放队列,以下发资源;若未成功获取资源,则丢弃语音指令,不执行该语音指令。
[0176]
可以理解的是,如果判断出该语音指令对应的用户意图是其他类别意图,如闲聊、查天气这种对话类意图,可丢弃语音指令,不执行该语音指令,不作响应。
[0177]
具体的,可通过图6所示实施例提供的还一种语音设备的控制方法来控制语音设备资源播放。
[0178]
若云服务器的播放队列非空,或当云服务器的播放队列中有数据插入时,可确定语音设备与云服务器间是否处于保持链接状态。
[0179]
可选的,插入的数据可以是通过语音指令获取的资源,也可以是用户通过语音设备的关联终端(例如手机app端)上传至云服务器的资源。
[0180]
可利用现有技术,将云服务器、语音设备以及语音设备的关联终端对接。如此,还可实现用户能够在关联终端上配置语音设备,管理语音设备状态,点播资源下发。
[0181]
在语音设备与云服务器间未处于保持链接状态的情况下,先建立二者间的链接。语音设备与云服务器间处于保持链接状态时,依据顺序,获取语音设备状态下发资源至语音设备中,同时标记语音设备状态为资源播放状态。
[0182]
也即,云服务器通过流式下发资源的方式控制语音设备进行资源播报,若每次下发一个资源后,都会再次确定播放队列是否为空。
[0183]
若播放队列非空,则继续执行上述“依据顺序,获取语音设备状态下发资源至语音设备中,同时标记语音设备状态为资源播放状态”的步骤。
[0184]
若播放队列为空,则断开与语音设备的链接,并标记该语音设备状态为空闲状态。
[0185]
至此,完成图5所示流程的相关描述。
[0186]
上述实施例基于语音控制设备与云端数据解析应用服务,仅对资源类请求进行处理,并流式下发播放,完成资源点播功能,避免打断语音设备当前播放的资源,实现避免多用户同时反复的控制带来的设备性能损失与纠纷可能,优化公共场景下的语音设备使用体验。
[0187]
与前述语音设备的控制方法的实施例相对应,本发明还提供语音设备的控制装置的实施例。
[0188]
参见图7,为本发明实施例提供的一种语音设备的控制装置的实施例框图。如图7所示,该装置包括:
[0189]
指令获取模块71,用于获取语音设备采集到的语音指令;
[0190]
语音识别模块72,用于对所述语音指令进行语音识别,得到所述语音指令对应的用户意图;
[0191]
类型确定模块73,用于确定所述用户意图所属的意图类型;
[0192]
策略确定模块74,用于根据所述用户意图所属的意图类型,确定目标控制策略;
[0193]
控制模块75,用于按照所述目标控制策略对所述语音设备进行控制。
[0194]
在一个可能的实施方式中,所述装置还包括(图中未示出):
[0195]
模式确定模块,用于确定所述语音设备被配置的工作模式;
[0196]
第一执行模块,用于在确定所述语音设备被配置为第一工作模式的情况下,执行所述确定所述用户意图所属的意图类型的步骤。
[0197]
在一个可能的实施方式中,所述装置还包括(图中未示出):
[0198]
第二执行模块,用于在确定所述语音设备被配置为第二工作模式的情况下,生成与所述用户意图对应的控制指令,并向所述语音设备下发所述控制指令,以由所述语音设备执行所述控制指令。
[0199]
在一个可能的实施方式中,所述意图类型包括第一意图类型;
[0200]
所述策略确定模块74,具体用于:
[0201]
在确定所述用户意图所属的意图类型为第一意图类型的情况下,确定目标控制策略为控制所述语音设备播放与所述用户意图对应的资源;
[0202]
所述控制模块75,具体用于:
[0203]
在确定所述用户意图所属的意图类型为第一意图类型的情况下,确定所述用户意图对应的资源;
[0204]
将所述资源添加至所述语音设备对应的播放队列,并顺次从所述播放队列中获取资源下发给所述语音设备以由所述语音设备进行播放。
[0205]
在一个可能的实施方式中,所述装置还包括(图中未示出):
[0206]
第一状态模块,用于在检测到所述播放队列不为空时,将所述语音设备的状态置为资源播放状态;
[0207]
第二状态模块,用于在检测到所述播放队列为空时,将所述语音设备的状态置为空闲状态。
[0208]
在一个可能的实施方式中,所述意图类型包括第二意图类型;
[0209]
所述策略确定模块74,具体用于:
[0210]
在确定所述用户意图所属的意图类型为第二意图类型的情况下,确定目标控制策略为控制所述语音设备不执行与所述用户意图对应的设备控制操作;
[0211]
所述控制模块75,具体用于:
[0212]
在确定所述用户意图所属的意图类型为第二意图类型的情况下,控制所述语音设备不执行与所述用户意图对应的设备控制操作。
[0213]
在一个可能的实施方式中,所述意图类型包括第三意图类型;
[0214]
所述策略确定模块74,具体用于:
[0215]
在确定所述用户意图所属的意图类型为第三意图类型的情况下,确定目标控制策略为控制所述语音设备根据当前状态播放与所述用户意图对应的设备状态参数;
[0216]
所述控制模块75,具体用于:
[0217]
在确定所述用户意图所属的意图类型为第三意图类型的情况下,确定所述语音设备的当前状态;
[0218]
若所述当前状态为空闲状态,则控制所述语音设备播放与所述用户意图对应的设备状态参数;
[0219]
所述方法还包括:
[0220]
若所述当前状态为资源播放状态,则控制所述语音设备不播放与所述用户意图对应的设备状态参数。
[0221]
图8为本发明实施例提供的一种电子设备的结构示意图,图8所示的电子设备800包括:至少一个处理器801、存储器802、至少一个网络接口804和用户接口803。电子设备800中的各个组件通过总线系统805耦合在一起。可理解,总线系统805用于实现这些组件之间的连接通信。总线系统805除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图8中将各种总线都标为总线系统805。
[0222]
其中,用户接口803可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball))、触感板或者触摸屏等。
[0223]
可以理解,本发明实施例中的存储器802可以是易失性存储器或非易失性存储器,
specific integrated circuits,asic)、数字信号处理器(digital signal processing,dsp)、数字信号处理设备(dsp device,dspd)、可编程逻辑设备(programmable logic device,pld)、现场可编程门阵列(field-programmable gate array,fpga)、通用处理器、控制器、微控制器、微处理器、用于执行本技术所述功能的其它电子单元或其组合中。
[0234]
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
[0235]
本实施例提供的电子设备可以是如图8中所示的电子设备,可执行如图2-6中语音设备的控制方法的所有步骤,进而实现图2-6所示语音设备的控制方法的技术效果,具体请参照图2-6相关描述,为简洁描述,在此不作赘述。
[0236]
本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
[0237]
当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在电子设备侧执行的语音设备的控制方法。
[0238]
所述处理器用于执行存储器中存储的语音设备的控制程序,以实现以下在电子设备侧执行的语音设备的控制方法的步骤:
[0239]
获取语音设备采集到的语音指令;
[0240]
对所述语音指令进行语音识别,得到所述语音指令对应的用户意图;
[0241]
确定所述用户意图所属的意图类型;
[0242]
根据所述用户意图所属的意图类型,确定目标控制策略;
[0243]
按照所述目标控制策略对所述语音设备进行控制。
[0244]
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0245]
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
[0246]
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:


1.一种语音设备的控制方法,其特征在于,所述方法包括:获取语音设备采集到的语音指令;对所述语音指令进行语音识别,得到所述语音指令对应的用户意图;确定所述用户意图所属的意图类型;根据所述用户意图所属的意图类型,确定目标控制策略;按照所述目标控制策略对所述语音设备进行控制。2.根据权利要求1所述的方法,其特征在于,在所述确定所述用户意图所属的意图类型之前,还包括:确定所述语音设备被配置的工作模式;在确定所述语音设备被配置为第一工作模式的情况下,执行所述确定所述用户意图所属的意图类型的步骤。3.根据权利要求2所述的方法,其特征在于,在所述确定所述语音设备被配置的工作模式之后,还包括:在确定所述语音设备被配置为第二工作模式的情况下,生成与所述用户意图对应的控制指令,并向所述语音设备下发所述控制指令,以由所述语音设备执行所述控制指令;结束流程。4.根据权利要求1所述的方法,其特征在于,所述意图类型包括第一意图类型;所述根据所述用户意图所属的意图类型,确定目标控制策略,包括:在确定所述用户意图所属的意图类型为第一意图类型的情况下,确定目标控制策略为控制所述语音设备播放与所述用户意图对应的资源;所述按照所述目标控制策略对所述语音设备进行控制,包括:在确定所述用户意图所属的意图类型为第一意图类型的情况下,确定所述用户意图对应的资源;将所述资源添加至所述语音设备对应的播放队列,并顺次从所述播放队列中获取资源下发给所述语音设备以由所述语音设备进行播放。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:在检测到所述播放队列不为空时,将所述语音设备的状态置为资源播放状态;在检测到所述播放队列为空时,将所述语音设备的状态置为空闲状态。6.根据权利要求1所述的方法,其特征在于,所述意图类型包括第二意图类型;所述根据所述用户意图所属的意图类型,确定目标控制策略,包括:在确定所述用户意图所属的意图类型为第二意图类型的情况下,确定目标控制策略为控制所述语音设备不执行与所述用户意图对应的设备控制操作;所述按照所述目标控制策略对所述语音设备进行控制,包括:在确定所述用户意图所属的意图类型为第二意图类型的情况下,控制所述语音设备不执行与所述用户意图对应的设备控制操作。7.根据权利要求1所述的方法,其特征在于,所述意图类型包括第三意图类型;所述根据所述用户意图所属的意图类型,确定目标控制策略,包括:在确定所述用户意图所属的意图类型为第三意图类型的情况下,确定目标控制策略为控制所述语音设备根据当前状态播放与所述用户意图对应的设备状态参数;
所述按照所述目标控制策略对所述语音设备进行控制,包括:在确定所述用户意图所属的意图类型为第三意图类型的情况下,确定所述语音设备的当前状态;若所述当前状态为空闲状态,则控制所述语音设备播放与所述用户意图对应的设备状态参数;所述方法还包括:若所述当前状态为资源播放状态,则控制所述语音设备不播放与所述用户意图对应的设备状态参数。8.一种语音设备的控制装置,其特征在于,所述装置包括:指令获取模块,用于获取语音设备采集到的语音指令;语音识别模块,用于对所述语音指令进行语音识别,得到所述语音指令对应的用户意图;类型确定模块,用于确定所述用户意图所属的意图类型;策略确定模块,用于根据所述用户意图所属的意图类型,确定目标控制策略;控制模块,用于按照所述目标控制策略对所述语音设备进行控制。9.一种电子设备,其特征在于,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的语音设备的控制程序,以实现权利要求1~7中任一项所述的语音设备的控制方法。10.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1~7中任一项所述的语音设备的控制方法。

技术总结


本发明实施例涉及一种语音设备的控制方法、装置、电子设备及存储介质,所述方法包括:获取语音设备采集到的语音指令;对所述语音指令进行语音识别,得到所述语音指令对应的用户意图;确定所述用户意图所属的意图类型;根据所述用户意图所属的意图类型,确定目标控制策略;按照所述目标控制策略对所述语音设备进行控制。由此,可以实现有效减少语音设备的性能损耗,提高了语音设备的智能性,丰富了语音设备的应用场景。备的应用场景。备的应用场景。


技术研发人员:

蒋朵拉 李绍斌 宋德超 贾巨涛 张鹏

受保护的技术使用者:

珠海联云科技有限公司

技术研发日:

2022.06.30

技术公布日:

2022/10/11

本文发布于:2024-09-24 05:31:14,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/27830.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:意图   所述   语音   设备
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议