语音信息的识别方法、系统、设备和存储介质与流程



1.本技术涉及车联网领域,尤其涉及一种语音信息的识别方法、系统、设备和存储介质。


背景技术:



2.目前,为了使驾驶员在使用车载设备时更加的安全便捷,一些车载设备中增加了语音识别系统,通过使用语音唤醒指令词与车载设备进行交互,驾驶员可以避免对设备进行手动控制,从而避免注意力的分散,降低行驶过程中的安全隐患。比如在汽车智能控制装置中通过对应的控制语音唤醒指令词控制汽车中的空调等设备,或者通过语音指令控制车载终端和手机终端协同工作,使车载终端能共享手机终端中的资源。
3.在现有技术中,车载终端均保存有用户对车机操作相关的全部指令词。在当前的语音识别技术中,车载终端存储有用户平常使用的全部指令,车载终端将根据用户的语音指令从本地的指令库中搜寻适配的指令,了解用户的期望执行的操作后执行所述操作;然而,由于用户操作需求的日益繁杂和不同车载终端性能的差异,指令数量的不断增加对车载终端的性能提出了巨大的挑战;此外,由于车载终端本地的指令库中存储了大量的指令词,在用户的使用过程中极可能出现误响应的情况(比如用户在与他人交谈中说出了“调高声音”这类指令词,但用户并不是对车机发语音指令时,车机还是会响应所述指令词从而对设备声音进行调节),这样的语音指令的方式极大地浪费了车机的资源,降低了用户体验。因此,需要研究更为合理的语音信息的识别方法。


技术实现要素:



4.本技术的一个目的在于提供一种语音信息的识别方法系统、设备和存储介质,其优势在于对用户的语音信息进行识别时,通过判断语音信息是否包含唤醒词,来为所述语音信息选择合适的指令库进行指令匹配,有效避免车机被误唤醒的情况发生,极大地提升了用户体验。
5.本技术的另一个目的在于提供一种语音信息的识别方法系统、设备和存储介质,其优势在于将与车机操作相关的热词按照用户的使用频率进行区分,将用户常用的指令词和用户不常用的指令词进行分布存储,将用户常用的指令词存储于车载终端本地指令库中,将用户不常用的指令词存储于云端指令库中,既降低了车载终端性能的消耗,又能有效避免车机被误唤醒的情况发生,极大地提升了用户体验。
6.为实现所述目的,第一方面,本技术实施例提供了一种语音信息的识别方法,所述方法包括以下步骤:获取用户的语音信息;根据所述语音信息是否包含唤醒词,选择不同方式获取用户需求;根据所述用户需求,获取操作指令;根据所述操作指令,执行相应操作。
7.在本方法中,通过判断语音信息是否包含唤醒词来为所述语音信息选择具体的识别终端,语音信息所对应的热词不再只从车载终端的热词库中提取,而是针对语音信息是否包含唤醒词为所述语音信息选择合适的识别终端,避免了误响应的情况,提高了语音信
息的识别效率。
8.云端所述在第一方面一个可选的实施方式中,所述方法还包括:周期性检测所述本地热词库和所述云端热词库中热词的使用频次;在所述本地热词库中的本地热词在目标周期内的使用频次不大于目标阈值的情况下,将所述本地热词从所述本地热词库中删除,并将所述热词存储于所述云端热词库中,所述云端热词库中的热词包括用户使用频次不大于所述目标阈值的热词;在所述云端热词库中的云端热词在目标周期内的使用频次大于所述目标阈值的情况下,将所述云端热词存储于所述本地热词库中,所述本地热词库中任一热词为用户使用频次大于所述目标阈值的热词。
9.应理解,所述本地热词库中存储的热词为用户使用频次大于目标阈值的热词,所述云端热词库中存储的热词不仅包括了用户使用频次大于目标阈值的热词,还包括用户使用频次不大于目标阈值的热词。因此,在保证高频热词能顺利响应的同时,又降低了低频热词被误响应的情况。此外,不同的用户在不通的时期可能有不同的使用偏好习惯。例如,有时用户在驾驶时可能经常需要在车上进行通话,而有时用户可能需要在车上经常对车上的硬件设备进行调节。因此,在本技术实施例中,通过周期性检测热词的使用频率,及时根据所述本地热词库和所述云端热词库中的热词,能确保用户语音信息的识别效率的持续高效性。
10.第二方面,本技术实施例提供了一种语音信息的识别系统,所述系统包括:车载终端、云端,其中,所述车载终端、所述云端通信连接,所述车载终端,获取用户的语音信息;判断所述语音信息是否包含唤醒词;若所述语音信息不包含唤醒词,所述车载终端通过识别与所述语音信息匹配的本地热词来获取用户需求,获取与所述用户需求对应的操作指令;若所述语音信息包含唤醒词,所述车载终端通过发送所述语音信息至云端;所述云端,接收所述语音信息,通过识别与所述语音信息匹配的云端热词来获取用户需求,发送与所述用户需求对应的操作指令至所述车载终端;所述车载终端,根据获取的操作指令,执行相应操作。
11.在第二方面一个可能的实现方式中,若所述语音信息包含唤醒词,所述车载终端,通过识别与所述语音信息匹配的本地热词来获取用户需求,获取与所述用户需求对应的操作指令。
12.应理解,在所述车载终端的存储性能和识别性能高于一定水平时,所述车载终端可以独立完成热词的存储以语音信息的识别。因此,在本技术实施例中,所述车载终端的存储性能和识别性能足以满足单独完成热词的存储以语音信息的识别的过程,所述系统无需再由云端协同工作,也就减少了数据转发的过程,语音信息的识别效率进一步提高。
13.第三方面,本技术实施例提供另一种语音信息的识别系统,所述系统包括:车载终端、云端以及智能终端,其中,所述车载终端、所述云端以及所述智能终端通信连接,所述车载终端,获取用户的语音信息;判断所述语音信息是否包含唤醒词;若所述语音信息不包含唤醒词,所述车载终端通过识别与所述语音信息匹配的本地热词来获取用户需求,获取与所述用户需求对应的操作指令,发送与所述用户需求对应的操作指令至所述智能终端;若所述语音信息包含唤醒词,所述车载终端发送所述语音信息至所述智能终端;所述智能终端发送所述语音信息至云端;所述云端,接收所述语音信息,通过识别与所述语音信息匹配的云端热词来获取用户需求,发送与所述用户需求对应的操作指令至所述智能终端;所述
智能终端,根据获取的操作指令,执行相应操作。
14.在第三方面一个可能的实现方式中,若所述语音信息包含唤醒词,所述车载终端,通过识别与所述语音信息匹配的本地热词来获取用户需求,获取与所述用户需求对应的操作指令,以及将所述操作指令发送至所述智能终端;
15.或者,若所述语音信息包含唤醒词,所述车载终端发送所述语音信息至所述智能终端;所述智能终端通过识别与所述语音信息匹配的所述智能终端的本地热词来获取用户需求,获取与所述用户需求对应的操作指令。
16.应理解,在所述车载终端和所述智能终端的存储性能和识别性能高于一定水平时,所述车载终端和所述智能终端均可以单独完成热词的存储以语音信息的识别。因此,在本技术实施例中,所述车载终端和所述智能终端的存储性能和识别性能足以满足单独完成热词的存储以语音信息的识别的过程,所述系统无需再由云端协同工作,也就减少了数据转发的过程,语音信息的识别效率进一步提高。
17.第四方面,本技术实施例提供了一种电子设备,包括:存储器,用于存储程序;处理器,用于执行所述存储器存储的所述程序,当所述程序被执行时,所述处理器用于执行如所述第一方面及任一种可选的实现方式的方法的步骤。
18.第五方面,本技术实施例提供了一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如所述第一方面及任一种可选的实现方式的方法的步骤。
附图说明
19.为了更清楚地说明本技术实施例或背景技术中的技术方案,下面将对本技术实施例或背景技术中所需要使用的附图作简单的介绍。
20.图1为本技术实施例提供的一种语音信息的识别方法的流程图;
21.图2为本技术实施例提供的一种热词注册和响应的过程示意图;
22.图3为本技术实施例提供的一种语音信息的识别方法的交互流程图;
23.图4为本技术实施例提供的一种语音信息的识别系统的结构示意图;
24.图5为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
25.为了使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术作进一步地描述。
26.本技术的说明书、权利要求书及附图中的术语“第一”和“第二”等仅用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备等,没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元等,或可选地还包括对于这些过程、方法、产品或设备等固有的其它步骤或单元。
27.在本文中提及的“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现所述短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员可以
显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
28.在本技术中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上,“至少两个(项)”是指两个或三个及三个以上,“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”。
29.本发明实施例提供了语音信息的识别方法及相关装置。为更清楚的描述本发明的方案,下面先介绍一些本技术实施例提供的语音信息的识别的方法及相关装置所涉及的知识。
30.热词注册:热词是指用户在与智能设备的语音交互中用于对智能设备进行语音控制的指令词,而热词注册指的是将这些热词统一存储于某一指令库中,并为指令库中的热词和用户语音信息转化而来的文本信息设定相应的匹配规则。
31.唤醒词:对于目前市面上常见的语音交互产品来说,一个眼神或者一个动作还不能引起它的注意,因此需要定义一个将产品从待机状态切换到工作状态的词语,即所谓的“唤醒词”。
32.在当今的技术中,基于场景的热词都是车机云端同步注册,由于车机性能的限制热词会有上限的限制,如果将大量的话术都注册到车机端,车机端在处理话术识别的时候性能消耗会大大增加,同时由于车机注册的热词比较多,用户在车上交流时的无意间的话语可能就会误唤醒车机,然后执行响应的操作,影响用户的体验。
33.为解决当今技术中存在的问题,本技术实施里提供了一种语音信息的识别方法,所述方法通过判断语音信息是否包含唤醒词来为所述语音信息选择合适的智能终端进行指令匹配。此外,本方法还将与车机操作相关的语音指令词按照用户的使用频率进行区分,将用户常用的指令词和用户不常用的指令词进行分布存储,将用户常用的指令词存储于车载终端本地指令库中,将用户不常用的指令词存储于云端指令库中。本方法既降低了车载终端性能的消耗,又能有效避免车机被误唤醒的情况发生,极大地提升了用户体验。具体请参阅图1。
34.图1为本技术实施例提供的一种语音信息的识别方法的流程图。如图1所示,所述方法包括一下步骤:
35.101、获取用户的语音信息。
36.车载终端实时监听周围环境的声音,当监听到环境中用户发出的语音信息后,所述车载终端获取所述用户的语音信息。所述车载终端可以是车辆、车载设备(例如车载单元(on board unit,obu))、无人驾驶(self driving)中的无线终端、运输安全(transportation safety)中的终端等,但凡可以与路侧装置、或者车辆、或者车辆管理平台等通信的设备,均落入车载终端的保护范围。
37.102、根据所述语音信息是否包含唤醒词,选择不同方式获取用户需求。
38.在所述车载终端获取收到所述语音信息之后,所述车载终端将判断所述语音信息中是否存在唤醒词。
39.在所述语音信息不包含唤醒词的情况下,所述车载终端将获取所述用户需求。
40.在所述语音信息包含唤醒词的情况下,所述车载终端将所述语音信息发送至智能终端,再由所述智能终端转发至云端,由所述云端对所述语音信息进行识别,获取所述用户需求。所述智能终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。所述云端可以独立的物理服务器,也可以是多个物理服务器构成的服务器集或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器。所述智能终端以及所述云端可以通过有线或无线通信方式进行直接或间接地连接,本技术在此不做限制。应理解,在一些实施例中,用户所发出的语音信息以特定的唤醒词开始,例如苹果手机的特定唤醒词“hi,siri”、以及华为手机的特定唤醒词“小艺小艺”等,当车载终端监听到所述唤醒词后,所述车载终端开始接收用户后续的语音信息。
41.103、根据所述用户需求,获取操作指令。
42.当所述语音信息不包含唤醒词时,所述车载终端在完成所述语音信息的接收后,所述车载终端将所述语音信息中的词汇内容转换为计算机可读的输入,例如文本内容。在对语音信息识别并获取到识别结果后(即所述文本内容),所述车载终端将根据所述文本内容从本地热词库中搜寻与所述文本内容相匹配的热词,得到所述操作指令。
43.当所述语音信息包含唤醒词时,所述车载终端在完成所述语音信息的接收后,所述车载终端将所述语音信息发送至所述智能终端,在由所述智能终端转发至所述云端中,由所述云端将所述语音信息中的词汇内容转换为计算机可读的输入,例如文本内容。在对语音信息识别并获取到识别结果后(即所述文本内容),所述云端将根据所述文本内容从云端热词库中搜寻与所述文本内容相匹配的热词,得到所述操作指令。
44.在一些实施例中,当所述语音信息包含唤醒词时,所述车载终端在完成所述语音信息的接收后,将所述语音信息中的词汇内容转换为计算机可读的输入,例如文本内容,在将所述文本内容发送至所述智能终端,并由所述智能终端转发至所述云端,所述云端可直接利用所述文本内容从云端热词中搜寻与所述文本内容相匹配的热词,得到所述操作指令。
45.104、根据所述操作指令,执行相应操作。
46.应理解所述操作指令的执行端可能为所述车载终端(例如所述操作指令为操控车辆相关的硬件设备的指令),也可能为所述智能终端(例如所述操作指令为打开手机中安装的app的指令)。因此,无论所述操作指令的获取是由所述车载终端或所述云端完成,均需对所述操作指令的执行端进行判断。
47.当所述操作指令由所述车载终端获取时(即所述语音信息不包含唤醒词的情况下),所述车载终端将判断所述操作指令的执行端。在所述操作指令的执行端为所述车载终端时,所述车载终端将直接执行所述操作指令;在所述操作指令的执行端为所述智能终端时,所述车载终端将所述操作指令转发至所述智能终端,所述智能终端接收到所述操作指令后执行所述操作指令。
48.当所述操作指令由所述云端获取时(即所述语音信息包含唤醒词的情况下),所述云端将所述操作指令发送至所述智能终端,所述智能终端判断所述操作指令的执行端。在所述操作指令的执行端为所述智能终端时,所述智能终端接收所述操作指令后直接执行所
述操作指令;在所述操作指令的执行端为所述车载终端时,所述智能终端将所述操作指令转发至所述车载终端,所述车载终端接收到所述操作指令后执行所述操作指令。
49.在一个可选的实施方式中,所述车载终端和所述云端直接通信连接,当所述语音信息包含唤醒词时,所述车载终端在完成所述语音信息的接收后,所述车载终端将所述语音信息发送至所述云端中,由所述云端将所述语音信息中的词汇内容转换为计算机可读的输入,例如文本内容。所述云端在对语音信息识别并获取到识别结果后(即所述文本内容),将根据所述文本内容从云端热词库中搜寻与所述文本内容相匹配的热词,得到所述操作指令,并将所述操作指令发送至所述车载终端。所述车载终端,根据所述操作指令,完成相应操作。
50.应理解,在本技术实施例中,所述车载终端中的本地热词库中的热词均为用户使用频次大于目标阈值的热词,所述云端中的云端热词库中存储的热词不仅包括了用户使用频次大于目标阈值的热词,还包括用户使用频次不大于目标阈值的热词。因此,在保证高频热词能顺利响应的同时,又降低了低频热词被误响应的情况。此外,不同的用户在不通的时期可能有不同的使用偏好习惯。例如,有时用户在驾驶时可能经常需要在车上进行通话,而有时用户可能需要在车上经常对车上的硬件设备进行调节。因此,优选地,在一些实施例中,所述车载终端和所述云端将周期性检测其存储的热词在某个周期内的使用频次,当所述本地热词库中的某个本地热词在目标周期内的使用频次不大于目标阈值的情况下,则可认为所述热词为用户近期较少使用的低频热词,则将所述本地热词从所述本地热词库中删除,并将所述热词存储于所述云端热词库中;当所述云端热词库中的某个热词在目标周期内的使用频率大于所述目标阈值时,则可认为所述热词为用户近期较频繁使用的高频热词,则将所述热词存储值所述本地热词库中。
51.为对所述本地热词库和所述云端热词库中热词的注册方式和响应方式进一步进行说明,本技术实施例提供了一种热词的注册和响应的过程示意图,具体请参阅图2。
52.图2为本技术实施例提供的一种热词注册和响应的过程示意图,如图2所示,在本技术实施例中,在热词注册时,用户日常使用的热词将根据车辆网行业统计的数据分为用户使用频率高于预设的目标阈值的热词(即图2中的高频热词)和用户使用频率低于前述预设的目标阈值的热词(即低频热词,图2中未体现)。其中,高频热词注册于车载终端中的本地热词库中,所述车载终端可以是前述对图1说明中的车载终端;低频热词的在云端注册,所述云端可以是前述对图2说明中的云端。也就是说,在所述车载终端和所述云端出厂时,所述车载终端和云端中已经按热词的使用频率进行了分布存储。
53.在一些实施例中,所述云端热词库中存储的热词除了包括用户使用频率低于目标阈值的热词(以下称为低频热词)之外,还包括用户使用频率高于目标阈值的热词(即所述高频热词)。也就是说,当用户无法判别自己期待的操作所对应的热词为低频热词还是高频热词时,可以直接说出包含唤醒词和该热词的语音信息,使语音信息能成功被响应。
54.应理解,不同的用户有不同的使用偏好习惯,同一用户在不通的时期也可能有不同的使用偏好习惯。例如,有时用户在驾驶时可能经常需要在车上进行通话,而有时用户可能需要在车上经常对车上的硬件设备进行调节。因此,所述车载终端和所述云端将周期性检测其存储的热词在某个周期内的使用频次,当所述本地热词库中的某个本地热词在目标周期内的使用频次不大于目标阈值的情况下,则可认为所述热词为用户近期较少使用的低
频热词,则将所述本地热词从所述本地热词库中删除,并将所述热词存储于所述云端热词库中;当所述云端热词库中的某个热词在目标周期内的使用频率大于所述目标阈值时,则可认为所述热词为用户近期较频繁使用的高频热词,则将所述热词存储值所述本地热词库中。
55.在实际的使用过程中,当车载终端获取到用户的语音信息后,将判断所述语音信息是否包含唤醒词。当所述语音信息不包含唤醒词时,则所述语音信息将由所述车载终端响应,从所述本地热词库中获取与所述语音信息相匹配的本地热词,得到与所述本地热词对应的操作指令;当所述语音信息包含唤醒词时,则所述语音信息将由所述车载终端发送至所述云端响应,从所述云端热词库中获取与所述语音信息相匹配的云端热词,得到与所述云端热词对应的操作指令。
56.在获取到所述操作指令后,接着判断所述云端热词或所述本地热词的执行设备(即图2中的智能终端),由所述智能终端处理热词的响应逻辑。所述智能终端为所述车载终端或者所述智能终端。
57.应理解,所述热词包含的操作指令可能需要所述车载终端执行,也可能需要所述智能终端执行。当所述操作指令由所述车载终端获取时(即所述语音信息不包含唤醒词的情况下),所述车载终端将判断所述操作指令的执行端。在所述操作指令的执行端为所述车载终端时(此时所述智能终端为所述车载终端),所述车载终端将直接执行所述操作指令;在所述操作指令的执行端为所述智能终端时(此时所述智能终端为所述智能终端),所述车载终端将所述操作指令转发至所述智能终端,所述智能终端接收到所述操作指令后执行所述操作指令。
58.当所述操作指令由所述云端(即所述语音信息包含唤醒词的情况下)获取时,所述云端将所述操作指令发送至所述智能终端,所述智能终端判断所述操作指令的执行端。在所述操作指令的执行端为所述智能终端时(此时所述智能终端为所述智能终端),所述智能终端接收所述操作指令后直接执行所述操作指令;在所述操作指令的执行端为所述车载终端时(此时所述智能终端为所述车载终端),所述智能终端将所述操作指令转发至所述车载终端,所述车载终端接收到所述操作指令后执行所述操作指令。结合对图2中所示的语音信息的识别方法的说明,本技术实施例提供了一种语音信息的识别方法的交互流程图。请参阅图3。
59.图3为本技术实施例提供的一种语音信息的识别方法的交互流程图,所述方法涉及车载终端、智能终端和云端,具体的,所述车载终端、智能终端和云端可以是前述对图1和图2说明中的车载终端、智能终端和云端。所述方法包括但不限于以下步骤:
60.301、车载终端注册常用热词。
61.在车载终端出厂时,将用户使用频次高于预设阈值热词存储于所述车载终端的本地热词库中,完成车载终端的热词注册。
62.302、云端注册所有热词。
63.将用户使用频率高于所述预设阈值的热词以及用户使用频率不高于所述预设阈值的热词全部存储于所述云端的云端热词库中,完成云端的热词注册。
64.303、车载终端获取语音信息。
65.在用户的驾驶过程中,车载终端持续监听周围环境的语音流,获取所述语音信息。
66.304、在语音信息不包含唤醒词时,车载终端识别语音信息,得到操作指令。
67.在所述语音信息不包含唤醒词时,所述车载终端在完成所述语音信息的获取后,所述车载终端将所述语音信息中的词汇内容转换为计算机可读的输入,例如文本内容。在对语音信息识别并获取到识别结果后(即所述文本内容),所述车载终端将根据所述文本内容从本地热词库中搜寻与所述文本内容相匹配的热词,得到与所述热词匹配的所述操作指令。
68.3041、车载终端判断操作指令的执行端。
69.应理解所述操作指令的执行端可能为所述车载终端(例如所述操作指令为操控车辆相关的硬件设备的指令),也可能为所述智能终端(例如所述操作指令为打开手机中安装的app的指令)。因此,所述车载终端将对所述操作指令的执行端进行判断。
70.3042、车载终端执行操作指令。
71.在所述操作指令的执行端为所述车载终端时,所述车载终端将直接执行所述操作指令。
72.3043、智能终端执行操作指令。
73.在所述操作指令的执行端为所述智能终端时,所述车载终端将所述操作指令转发至所述智能终端,所述智能终端接收到所述操作指令后执行所述操作指令。
74.305、在语音信息包含唤醒词时,车载终端发送语音信息至云端。
75.在所述语音信息包含唤醒词的情况下,所述车载终端将所述语音信息发送至智能终端,再由所述智能终端转发至云端,由所述云端对所述语音信息进行识别,获取所述用户需求。
76.应理解,在一些实施例中,用户所发出的语音信息以特定的唤醒词开始,例如苹果手机的特定唤醒词“hi,siri”、以及华为手机的特定唤醒词“小艺小艺”等,当车载终端监听到所述唤醒词后,所述车载终端开始接收用户后续的语音信息。
77.306、云端识别语音信息,得到操作指令。
78.所述云端将所述语音信息中的词汇内容转换为计算机可读的输入,例如文本内容。在对语音信息识别并获取到识别结果后(即所述文本内容),所述云端将根据所述文本内容从本地热词库中搜寻与所述文本内容相匹配的热词,得到与所述热词对应的所述操作指令。
79.3061、智能终端判断操作指令的执行端。
80.同理,所述操作指令的执行端可能为所述车载终端,也可能为所述智能终端。因此,所述云端将所述操作志林发送给所述智能终端后,所述智能终端将判断所述操作指令的执行端。
81.3062、智能终端执行操作指令。
82.在所述操作指令的执行端为所述智能终端时,所述智能终端接收所述操作指令后直接执行所述操作指令;
83.3063、车载终端执行操作指令。
84.在所述操作指令的执行端为所述车载终端时,所述智能终端将所述操作指令转发至所述车载终端,所述车载终端接收到所述操作指令后执行所述操作指令。
85.应理解,在图3中,步骤301和步骤302为热词注册的步骤,此过程在语音信息识别
之前就已经完成,在后续的语音识别过程中,不会再重复执行,但车载终端中的热词和云端的热词可以进行更新。在一些实施例中,所述车载终端和所述云端将周期性检测其存储的热词在某个周期内的使用频次,当所述本地热词库中的某个本地热词在目标周期内的使用频次不大于目标阈值的情况下,则可认为所述热词为用户近期较少使用的低频热词,则将所述本地热词从所述本地热词库中删除,并将所述热词存储于所述云端热词库中;当所述云端热词库中的某个热词在目标周期内的使用频率大于所述目标阈值时,则可认为所述热词为用户近期较频繁使用的高频热词,则将所述热词存储值所述本地热词库中。
86.此外,需注意,在具体的识别过程中,图3中的并非所有的步骤均需执行。其中,步骤303、步骤304、步骤3041、步骤3042可以作为一个完整的语音信息的识别和响应过程,其对应的应用场景为用户的语音信息不包含唤醒词,且所述语音信息对应的指令的执行端为所述车载终端,而步骤303、步骤304、步骤3041、步骤3043也可以作为一个完整的语音信息的识别和响应过程,其对应的应用场景为用户的语音信息不包含唤醒词,且所述语音信息对应的指令的执行端为所述智能终端。此外,步骤303、步骤305、步骤306、步骤3061、步骤3062可以作为一个完整的语音信息的识别和响应过程,其对应的应用场景为用户的语音信息包含唤醒词,且所述语音信息对应的指令的执行端为所述智能终端,步骤303、步骤305、步骤306、步骤3061、步骤3063也可以作为一个完整的语音信息的识别和响应过程,其对应的应用场景为用户的语音信息包含唤醒词,且所述语音信息对应的指令的执行端为所述车载终端。也就是说,用户的语音信息的具体执行终端可以按语音信息的识别设备和操作指令的执行设备分为四种情况,具体可参照下列表1:
87.表1
[0088][0089]
[0090]
在一个可选的实施方式中,所述车载终端和所述云端直接通信连接,当所述语音信息包含唤醒词时,所述车载终端在完成所述语音信息的接收后,所述车载终端将所述语音信息发送至所述云端中,由所述云端将所述语音信息中的词汇内容转换为计算机可读的输入,例如文本内容。所述云端在对语音信息识别并获取到识别结果后(即所述文本内容),将根据所述文本内容从云端热词库中搜寻与所述文本内容相匹配的热词,得到所述操作指令,并将所述操作指令发送至所述车载终端(无需再判断操作指令的执行端)。所述车载终端,根据所述操作指令,完成相应操作。在一些实施例中,若所述车载终端的存储性能和识别性能高于一定水平,所述车载终端可以独立完成热词的存储以语音信息的识别。因此,若所述语音信息包含唤醒词,所述车载终端也可以通过识别与所述语音信息匹配的本地热词来获取用户需求,获取与所述用户需求对应的操作指令。所述车载终端的存储性能和识别性能足以单独完成热词的存储以语音信息的识别的过程,所述系统无需再由云端协同工作,也就减少了数据转发的过程,语音信息的识别效率进一步提高。
[0091]
在一个可选的实施方式中,当所述车载终端和所述智能终端的存储性能和识别性能高于一定水平时,所述车载终端和所述智能终端均可以独立完成热词的存储以语音信息的识别。因此,在本技术实施例中,所述车载终端和所述智能终端的存储性能和识别性能足以单独完成热词的存储以语音信息的识别的过程,此时所述智能终端中的热词库(以下称为智能指令库)中也存储有与操作指令相关的热词,所述系统则无需再由云端协同工作。此时,所述车载终端在获取用户的语音信息后,所述车载终端通过识别与所述语音信息匹配的本地热词来获取用户需求,并获取与所述用户需求对应的操作指令,并将所述操作指令发送给所述智能终端。或者,所述车载终端在获取用户的语音信息后,将所述语音信息发送给所述智能终端,所述智能终端接收所述语音信息后,所述智能终端识别所述语音信息,并从所述智能指令库中获取与所述语音信息匹配的本地热词来获取用户需求,并获取与所述用户需求对应的操作指令。
[0092]
接下来介绍本技术实施例提供的一种语音信息的识别系统的结构示意图,请参阅图4。前述语音识别的方法可基于图4所示的系统实现。如图4所示,所述系统包括:
[0093]
车载终端401、智能终端402以及云端403,且所述智能终端402与所述车载终端401和云端403通信连接。
[0094]
所述车载终端401可以是车载设备(例如车载单元(on board unit,obu))、无人驾驶(self driving)中的无线终端、运输安全(transportation safety)中的终端等,但凡可以与路侧装置、或者车辆、或者车辆管理平台等通信的设备,均落入车载终端401的保护范围。所述智能终端402可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。所述云端403可以独立的物理服务器,也可以是多个物理服务器构成的服务器集或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器。所述智能终端402以及所述云端403可以通过有线或无线通信方式进行直接或间接地连接,本技术在此不做限制。具体的,所述车载终端401、智能终端402以及云端403可是时前述语音信息的识别方法中的车载终端、智能终端以及云端。在一个可选的实现方式中,所述智能终端402可通过网络与云端403进行数据通信。在执行前述数据语音信息的识别方法时,所述智能终端402可以将前述文本信息传送至云端403,并接
收云端403返回的操作指令。所述网络可以是外部网络,比如因特网,也可以是内部网络,比如以太网或者虚拟私人网络。可选的,所述网络还可以是无线网络,比如wifi网络,蜂窝网络等。
[0095]
在执行前述数据语音信息的识别方法时,所述车载终端401,获取用户的语音信息,并判断所述语音信息是否包含唤醒词;若所述语音信息不包含唤醒词,所述车载终端401通过识别与所述语音信息匹配的本地热词来获取用户需求,获取与所述用户需求对应的操作指令;若所述语音信息包含唤醒词,所述车载终端401通过发送所述语音信息至云端403;所述云端403,接收所述语音信息,通过识别与所述语音信息匹配的云端热词来获取用户需求,发送与所述用户需求对应的操作指令至所述车载终端401;所述车载终端401,根据获取的操作指令,执行相应操作。
[0096]
或,所述车载终端401,获取用户的语音信息,并判断所述语音信息是否包含唤醒词;若所述语音信息不包含唤醒词,所述车载终端401通过识别与所述语音信息匹配的本地热词来获取用户需求,获取与所述用户需求对应的操作指令,所述车载终端401,将获取的操作指令发送至所述智能终端402,所述智能终端402,根据操作指令,执行相应操作。若所述语音信息包含唤醒词,所述车载终端401通过发送所述语音信息至云端403;所述云端403,接收所述语音信息,通过识别与所述语音信息匹配的云端热词来获取用户需求,发送与所述用户需求对应的操作指令至所述智能终端402;所述智能终端402,根据获取的操作指令,执行相应操作。
[0097]
在一个可选的实施方式中,当所述车载终端401和所述智能终端402的存储性能和识别性能高于一定水平时,所述车载终端401和所述智能终端402均可以独立完成热词的存储以语音信息的识别。因此,在本技术实施例中,所述车载终端401和所述智能终端402的存储性能和识别性能足以单独完成热词的存储以语音信息的识别的过程,此时所述智能终端402中的热词库(以下称为智能指令库)中也存储有与操作指令相关的热词,所述系统则无需再由云端协同工作。此时,所述车载终端401在获取用户的语音信息后,所述车载终端401通过识别与所述语音信息匹配的本地热词来获取用户需求,并获取与所述用户需求对应的操作指令,并将所述操作指令发送给所述智能终端402。或者,所述车载终端401在获取用户的语音信息后,将所述语音信息发送给所述智能终端402,所述智能终端402接收所述语音信息后,所述智能终端402识别所述语音信息,并从所述智能指令库中获取与所述语音信息匹配的本地热词来获取用户需求,并获取与所述用户需求对应的操作指令。
[0098]
在一个可选的实施方式中,所述车载终端401和所述云端403直接通信连接,当所述语音信息包含唤醒词时,所述车载终端401在完成所述语音信息的接收后,所述车载终端401将所述语音信息发送至所述云端403中,由所述云端403将所述语音信息中的词汇内容转换为计算机可读的输入,例如文本内容。所述云端403在对语音信息识别并获取到识别结果后(即所述文本内容),将根据所述文本内容从云端热词库中搜寻与所述文本内容相匹配的热词,得到所述操作指令,并将所述操作指令发送至所述车载终端401。所述车载终端401,根据所述操作指令,完成相应操作。在一些实施例中,若所述车载终端401的存储性能和识别性能高于一定水平,所述车载终端401可以独立完成热词的存储以语音信息的识别。因此,若所述语音信息包含唤醒词,所述车载终端401也可以通过识别与所述语音信息匹配的本地热词来获取用户需求,获取与所述用户需求对应的操作指令,所述系统无需再与云
端403协同工作,也就减少了数据转发的过程,语音信息的识别效率进一步提高。
[0099]
在一个可选的实现方式中,所述车载终端401将周期性检测车载终端401中的本地热词库和云端403中的云端热词库中热词的使用频次;在所述本地热词库中的本地热词在目标周期内的使用频次不大于目标阈值的情况下,将所述本地热词从所述本地热词库中删除,并将所述热词存储于所述云端热词库中,所述云端热词库中的热词包括用户使用频次不大于所述目标阈值的热词;在所述云端热词库中的云端热词在目标周期内的使用频次大于所述目标阈值的情况下,将所述云端热词存储于所述本地热词库中,所述本地热词库中任一热词为用户使用频次大于所述目标阈值的热词。在保证高频热词能顺利响应的同时,又降低了低频热词被误响应的情况,能确保用户语音信息的识别效率的持续高效性。
[0100]
在一些实施例中,所述云端热词库中存储的热词除了包括用户使用频率低于目标阈值的热词(以下称为低频热词)之外,还包括用户使用频率高于目标阈值的热词(即所述高频热词)。也就是说,当用户无法判别自己期待的操作所对应的热词为低频热词还是高频热词时,可以直接说出包含唤醒词和该热词的语音信息,使语音信息能成功被响应。图5为本技术实施例提供的一种电子设备的结构示意图。如图5所示,所述电子设备50包括处理器501、存储器502和通信接口503;所述处理器501、存储器502和通信接口503通过总线504相互连接。图5中的电子设备可以实现前述实施例中语音信息的识别方法。
[0101]
存储器502包括但不限于是随机存储记忆体(random access memory,ram)、只读存储器(read-only memory,rom)、可擦除可编程只读存储器(erasable programableread only memory,eprom)、或便携式只读存储器(compact disc read-only memory,cdrom),所述存储器502用于相关指令及数据。通信接口503用于接收和发送数据。
[0102]
处理器501可以是一个或多个中央处理器(central processing unit,cpu),在处理器501是一个cpu的情况下,所述cpu可以是单核cpu,也可以是多核cpu。所述实施例中由语音信息的处理系统所执行的步骤可以基于所述图5所示的电子设备的结构。
[0103]
所述电子设备50中的处理器501用于读取所述存储器502中存储的程序代码,执行前述实施例中的语音信息的处理方法。
[0104]
在本技术的实施例中提供另一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现:获取用户的语音信息;根据所述语音信息是否包含唤醒词,选择不同方式获取用户需求;根据所述用户需求,获取操作指令;根据所述操作指令,执行相应操作。
[0105]
本技术实施例提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行前述实施例所提供的语音信息的识别方法。
[0106]
以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。

技术特征:


1.一种语音信息的识别方法,其特征在于,包括以下步骤:获取用户的语音信息;根据所述语音信息是否包含唤醒词,选择不同方式获取用户需求;根据所述用户需求,获取操作指令;根据所述操作指令,执行相应操作。2.根据权利要1所述的方法,所述根据所述语音信息是否包含唤醒词,选择不同方式识别用户需求,包括:在所述语音信息不包含唤醒词的情况下,识别所述语音信息,获取所述用户需求;所述根据所述用户需求,获取操作指令,包括:在所述语音信息不包含唤醒词的情况下,识别与所述用户需求匹配的本地热词,获取与所述本地热词对应的操作指令,所述本地热词存储于本地热词库中。3.根据权利要求1或2所述的方法,所述根据所述语音信息是否包含唤醒词,选择不同方式识别用户需求,包括:在所述语音信息包含唤醒词的情况下,识别所述语音信息,获取所述用户需求;所述根据所述用户需求,获取操作指令,包括:在所述语音信息包含唤醒词的情况下,识别与所述用户需求匹配的云端热词,获取与所述云端热词对应的操作指令,所述云端热词存储于云端热词库中。4.根据权利要求3所述的方法,所述根据所述操作指令,执行相应操作,包括:发送所述操作指令至智能终端;所述智能终端根据所述操作指令,执行相应操作。5.根据权利要求3所述的方法,所述方法还包括:周期性检测所述本地热词库和所述云端热词库中热词的使用频次;在所述本地热词库中的本地热词在目标周期内的使用频次不大于目标阈值的情况下,将所述本地热词从所述本地热词库中删除,并将所述热词存储于所述云端热词库中,所述云端热词库中的热词包括用户使用频次不大于所述目标阈值的热词;在所述云端热词库中的云端热词在目标周期内的使用频次大于所述目标阈值的情况下,将所述云端热词存储于所述本地热词库中,所述本地热词库中任一热词为用户使用频次大于所述目标阈值的热词。6.一种语音信息的识别系统,其特征在于,所述系统包括:车载终端、云端,其中,所述车载终端、所述云端通信连接,所述车载终端,获取用户的语音信息;判断所述语音信息是否包含唤醒词;若所述语音信息不包含唤醒词,所述车载终端通过识别与所述语音信息匹配的本地热词来获取用户需求,获取与所述用户需求对应的操作指令;若所述语音信息包含唤醒词,所述车载终端通过发送所述语音信息至云端;所述云端,接收所述语音信息,通过识别与所述语音信息匹配的云端热词来获取用户需求,发送与所述用户需求对应的操作指令至所述车载终端;所述车载终端,根据获取的操作指令,执行相应操作。7.根据权利要求6所述的系统,若所述语音信息包含唤醒词,所述车载终端,通过识别与所述语音信息匹配的本地热词来获取用户需求,获取与所
述用户需求对应的操作指令。8.一种语音信息的识别系统,其特征在于,所述系统包括:车载终端、云端以及智能终端,其中,所述车载终端、所述云端以及所述智能终端通信连接,所述车载终端,获取用户的语音信息;判断所述语音信息是否包含唤醒词;若所述语音信息不包含唤醒词,所述车载终端通过识别与所述语音信息匹配的本地热词来获取用户需求,获取与所述用户需求对应的操作指令,发送与所述用户需求对应的操作指令至所述智能终端;若所述语音信息包含唤醒词,所述车载终端发送所述语音信息至所述智能终端;所述智能终端发送所述语音信息至所述云端;所述云端,接收所述语音信息,通过识别与所述语音信息匹配的云端热词来获取用户需求,发送与所述用户需求对应的操作指令至所述智能终端;所述智能终端,根据获取的操作指令,执行相应操作。9.根据权利要求8所述的系统,若所述语音信息包含唤醒词,所述车载终端,通过识别与所述语音信息匹配的本地热词来获取用户需求,获取与所述用户需求对应的操作指令,以及将所述操作指令发送至所述移动终端;或者,所述车载终端发送所述语音信息至所述智能终端;所述智能终端通过识别与所述语音信息匹配的所述智能终端的本地热词来获取用户需求,获取与所述用户需求对应的操作指令。10.根据权利要求8所述的系统,所述智能终端,根据获取的操作指令,执行相应操作之前,所述智能终端,判断所述操作指令的执行端;所述智能终端,根据获取的操作指令,执行相应操作,包括:在所述执行端为所述智能终端的情况下,所述智能终端,根据获取的操作指令,执行相应操作;在所述执行端为所述车载终端的情况下,所述智能终端发送所述操作指令至所述车载终端;所述车载终端,根据获取的操作指令,执行相应操作。11.根据权利要求8所述的系统,所述本地热词存储于所述车载终端的本地热词库中,所述本地热词库中任一热词为用户使用频次大于目标阈值的热词;所述云端热词存储于所述云端的云端热词库中,所述云端热词库中的热词包括用户使用频次不大于所述目标阈值的指令;所述车载终端:周期性检测所述本地热词库和所述云端热词库中热词的使用频次;在所述本地热词库中的本地热词在目标周期内的使用频次不大于目标阈值的情况下,将所述本地热词从所述本地热词库中删除,并将所述热词存储于所述云端热词库中;在所述云端热词库中的云端热词在目标周期内的使用频次大于所述目标阈值的情况下,将所述云端热词存储于所述本地热词库中。12.一种电子设备,其特征在于,包括:存储器,用于存储程序;处理器,用于执行所述存储器存储的所述程序,当所述程序被执行时,所述处理器用于执行如权利要求1至5中任一项所述的方法的步骤。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序在一个或多个处理器上运行时,执行如权利要求1至5中任一项所述的方法的步骤。

技术总结


本申请实施例公开了一种语音信息的识别方法、系统、设备和存储介质。所述方法通过判断语音信息是否包含唤醒词来为所述语音信息选择合适的智能终端进行指令匹配;此外,本方法还将与车机操作相关的语音指令词按照用户的使用频率进行区分,将用户常用的指令词和用户不常用的指令词进行分布存储,将用户常用的指令词存储于车载终端本地指令库中,将用户不常用的指令词存储于云端指令库中,既降低了车载终端性能的消耗,又能有效避免车机被误唤醒的情况发生,极大地提升了用户体验。极大地提升了用户体验。极大地提升了用户体验。


技术研发人员:

王峰

受保护的技术使用者:

上海博泰悦臻网络技术服务有限公司

技术研发日:

2021.04.27

技术公布日:

2022/10/27

本文发布于:2024-09-20 22:34:21,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/19672.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   终端   语音   指令
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议