语音识别结果的纠错方法、装置、终端设备及存储介质与流程



1.本发明涉及语音识别纠错技术领域,尤其涉及一种语音识别结果的纠错方法、装置、终端设备及存储介质。


背景技术:



2.随着人工智能领域中自动语音识别(asr)技术和自然语言理解(nlp)技术的发展,人机对话(如聊天机器人)也被运用在各种终端设备中。终端设备在进行对话的流程是通过自动语音识别算法(asr)将用户的语音转换成文本,进而用自然语音理解算法来识别用户的意图和关键信息,最后执行用户的语音指令或者返回需要的信息。但是,由于设备本身的缺陷或者用户方言口音,容易导致语音转换成的文本发生错误,进而影响意图理解和关键信息的识别,最后不能返回正确的语音识别结果。
3.因此,现有技术还有待改进和提高。


技术实现要素:



4.本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种语音识别结果的纠错方法、装置、终端设备及存储介质,旨在解决现有技术中在进行语音识别时,容易出现是识别错误,影响意图理解和关键信息的识别的问题。
5.为了解决上述技术问题,本发明所采用的技术方案如下:
6.第一方面,本发明提供一种语音识别结果的纠错方法,其中,所述方法包括:
7.获取语音识别结果,并确定所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词
8.根据所述初始关键词,确定与所述初始关键词匹配的目标关键词;
9.将所述目标关键词替换所述初始关键词,并与所述意图信息关联,形成所述意图信息与所述目标关键词之间的对应关系,得到纠错后的语音识别结果。
10.在一种实现方式中,所述获取语音识别结果,并确定所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词,包括:
11.获取语音请求信息,并根据所述语音请求信息,确定与所述语音请求信息所对应的文本信息;
12.根据所述文本信息,确定所述语音识别结果;
13.对所述语音识别结果进行分词处理,得到分词结果;
14.根据所述分词结果,得到所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词。
15.在一种实现方式中,所述根据所述初始关键词,确定与所述初始关键词匹配的目标关键词,包括:
16.将所述初始关键词与预设的映射文件匹配,所述映射文件中设置有与所述初始关键词对应的目标关键词;
17.若匹配成功,则获取与所述初始关键词对应的目标关键词。
18.在一种实现方式中,所述根据所述初始关键词,确定与所述初始关键词匹配的目标关键词,包括:
19.若匹配不成功,则根据所述初始关键词,获取与所述初始关键词关联的历史行为数据;
20.获取历史行为数据中使用频率大于预设阈值的文字内容,并将所述文字内容作为所述目标关键词。
21.在一种实现方式中,所述根据所述初始关键词,确定与所述初始关键词匹配的目标关键词,包括:
22.根据所述初始关键词,获取与所述初始关键词关联的词条信息;
23.对所述词条信息进行权重分析,确定所述目标关键词。
24.在一种实现方式中,所述根据所述初始关键词,获取与所述初始关键词关联的词条信息,包括:
25.分别获取所述初始关键词对应的拼音信息、文字信息以及字符串信息;
26.分别根据所述拼音信息、所述文字信息以及所述字符串信息,搜索出与所述拼音信息对应的第一词条信息、与所述文字信息对应的第二词条信息以及与所述字符串信息对应的第三词条信息。
27.在一种实现方式中,所述对所述词条信息进行权重分析,确定所述目标关键词,包括:
28.对所述第一词条信息、所述第二词条信息以及所述第三词条信息进行去重处理,得到候选词条信息;
29.获取所述候选词条信息对应的权重,并计算每一个候选词条信息的分数信息;
30.根据所述分数信息,从所述候选词条信息中确定出目标词条信息,并将所述目标词条信息作为所述目标关键词。
31.在一种实现方式中,所述方法还包括:
32.获取历史行为数据,并统计所述历史行为数据中每一个目标关键词的使用记录;
33.根据所述使用记录,确定每一个目标关键词所对应的意图信息的取消次数,所述取消次数用于反映所述意图信息所对应的操作被取消执行的次数;
34.若所述取消次数超过次数阈值,则断开所述取消次数超过次数阈值的目标关键词与意图信息之间的关联。
35.第二方面,本发明实施例还提供一种语音识别结果的纠错装置,其中,包括:
36.初始关键词确定模块,用于获取语音识别结果,并确定所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词;
37.目标关键词确定模块,用于根据所述初始关键词,确定与所述初始关键词匹配的目标关键词;
38.语音识别结果纠错模块,用于将所述目标关键词替换所述初始关键词,并与所述意图信息关联,形成所述意图信息与所述目标关键词之间的对应关系,得到纠错后的语音识别结果。
39.第三方面,本发明实施例还提供一种终端设备,其中,所述终端设备包括存储器、
处理器及存储在所述存储器中并可在所述处理器上运行的语音识别结果的纠错程序,所述处理器执行所述语音识别结果的纠错程序时,实现上述方案中任一项所述的语音识别结果的纠错方法的步骤。
40.第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有语音识别结果的纠错程序,所述语音识别结果的纠错程序被处理器执行时,实现上述方案中任一项所述的语音识别结果的纠错方法的步骤
41.有益效果:与现有技术相比,本发明提供了一种语音识别结果的纠错方法,本发明首先获取语音识别结果,并确定所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词。此时确定出的初始关键词是直接根据语音识别结果得到的,由于语音识别可能存在误差,因此该初始关键词可能不能完全匹配该意图信息。为了准确地执行语音指令,需要对初始关键词进行纠错,而由于初始关键词是从语音识别结果中得到,因此该初始关键词并不是与意图信息完全不匹配,而是可能存在一些语音识别错误导致该初始关键词与意图信息之间存在偏差。因此,本实施例可根据该初始关键词,确定出对应的目标关键词,该目标关键词就是对初始关键词进行纠错后得到的,该目标关键词可消除初始关键词与意图信息之间的偏差,并且与意图信息完美匹配。当得到所述目标关键词后,本发明即可将所述目标关键词替换所述初始关键词,并与所述意图信息关联,形成所述意图信息与所述目标关键词之间的对应关系,得到纠错后的语音识别结果,从而完成所述语音识别结果的纠错,这样就可以准确地执行语音指令,提高了语音识别的准确性。
附图说明
42.图1为本发明实施例提供的语音识别结果的纠错方法的具体实施方式的流程图。
43.图2为本发明实施例提供的语音识别结果的纠错方法中确定初始关键词的流程图。
44.图3为本发明实施例提供的语音识别结果的纠错方法中确定目标关键词的第一实施例的流程图。
45.图4为本发明实施例提供的语音识别结果的纠错方法中确定目标关键词的第二实施例的流程图。
46.图5是本发明实施例提供的语音识别结果的纠错装置的原理框图。
47.图6是本发明实施例提供的终端设备的内部结构原理框图。
具体实施方式
48.为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
49.随着人工智能领域中自动语音识别(asr,automatic speech recognition)技术和自然语言理解(nlp,natural langunge possns)技术的发展,人机对话(如聊天机器人)也被运用在各种终端设备中。用户可以通过“说”的方式,用语音控制各种设备,完成设定的任务并且能够与设备无目的性地“聊天”。终端设备在进行对话的流程是通过自动语音识别算法(asr)将用户的语音转换成文本,进而用自然语音理解算法来识别用户的意图和关键
信息,最后执行用户的语音指令或者返回需要的信息。但是,由于设备本身的缺陷或者用户方言口音,容易导致语音转换成的文本发生错误,进而影响意图理解和关键信息的识别,最后不能返回正确的语音识别结果。
50.为了解决现有技术的问题,本实施例提供一种语音识别结果的纠错方法,通过本实例的方法,可在对用户发出的语音指令进行识别后,对语音识别结果进行纠错,从而可以准确地执行语音指令,提高了语音识别的准确性。具体实施时,本实施例首先获取语音识别结果,并确定所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词。此时确定出的初始关键词是直接根据语音识别结果得到的,由于语音识别可能存在误差,因此该初始关键词可能不能完全匹配该意图信息。为了准确地执行语音指令,需要对初始关键词进行纠错,而由于初始关键词是从语音识别结果中得到,因此该初始关键词并不是与意图信息完全不匹配,而是可能存在一些语音识别错误导致该初始关键词与意图信息之间存在偏差。因此,本实施例可根据该初始关键词,确定出对应的目标关键词,该目标关键词就是对初始关键词进行纠错后得到的,该目标关键词可消除初始关键词与意图信息之间的偏差,并且与意图信息完美匹配。当得到所述目标关键词后,本实施例即可将所述目标关键词替换所述初始关键词,并与所述意图信息关联,形成所述意图信息与所述目标关键词之间的对应关系,从而完成所述语音识别结果的纠错。
51.比如,当用户向智能音箱发出的语音指令为“我要听张学友的歌”。而语音识别结果为“我要听张雪友的歌”。从语音识别结果中得到意图信息为“听歌”、初始关键词为“张雪友”。而“张雪友”并不是个歌手,因此智能音箱是无法搜索出“张雪友”的歌。因此需要对“张雪友”进行纠错。智能音箱可以根据“张雪友”判断出,其真正对应的应该是“张学友”,即“张学友”是目标关键词,因此就将目标关键词“张学友”与意图信息“听歌”进行关联,即可得到目标关键词“张学友”与意图信息“听歌”之间的对应关系,因此新的语音识别结果即为“听张学友的歌”,实现了对语音识别结果的纠错,这样智能音箱就可以向用户播放张学友的歌曲。
52.示例性方法
53.本实施例中的语音识别结果的纠错方法可应用于终端设备中,比如应用与智能手机、智能音箱以及智能电视等设备中。具体如图1中所示,该方法具体包括如下步骤:
54.步骤s100、获取语音识别结果,并确定所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词。
55.由于本实施例是对语音识别结果进行纠错,因此需要首先获取该语音识别结果。在本实施例中,所述语音识别结果是对用户发出的语音指令进行识别后得到的,其中包括有意图信息以及与该意图信息对应的初始关键词。所述意图信息指的是该语音识别结果中所表达的用户意图,即反映的用户的需求,比如上述举例中,语音识别结果为“我想听张雪友的歌”,则意图信息即为“听歌”。所述初始关键词是直接根据该语音识别结果得到的,并且该初始关键词是与意图信息对应的。所述初始关键词指的是用户意图对应需要执行的内容,相当于图6中的槽位值。比如上述举例中,语音识别结果为“我想听张雪友的歌”,则初始关键词即为“张雪友”,也即是说,用户想要听歌手张雪友的歌。因此根据意图信息和初始关键词,即可得出用户发出的语音指令所反映的用户需求为
‑‑
听张雪友的歌。
56.在一种实现方式中,如图2中所示,所述步骤s100包括如下步骤:
57.步骤s101、获取语音请求信息,并根据所述语音请求信息,确定与所述语音请求信息所对应的文本信息;
58.步骤s102、根据所述文本信息,确定所述语音识别结果;
59.步骤s103、对所述语音识别结果进行分词处理,得到分词结果;
60.步骤s104、根据所述分词结果,得到所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词。
61.具体实施时,为了获取到语音识别结果,本实施例需要首先获取到用户所发出的语音指令,并对语音指令进行语音识别,从而得到语音识别结果。具体地,本实施例可首先获取语音请求信息,该语音请求信息即为用户发出的语音指令,表达就是该用户的需求。本实施例中,对于语音请求信息的获取可通过语音采集装置来采集,比如麦克风设备。当终端设备上的语音采集装置采集到语音请求信息后,该语音请求信息可为一句话或者一段话,即可对该语音请求信息进行语音识别,得到语音识别结果。在一种实现方式中,本实施例可通过语音识别模型(asr)将语音请求信息中的语音转化为文字,从而得到该与语音请求信息对应的文本信息。当得到该文本信息后,即完成了所述语音请求信息的识别。
62.接着,本实施例对该文本信息进行分词处理,得到所述意图信息以及关键词信息。由于文本信息是将语音请求信息转化成文字得到的,因此文本信息反映的是该语音请求信息中的一句话或者一段话。通过对该文本信息进行分词处理,可对该文本信息中文字内容进行切割,得到若干个单词或者词组,即得到分词结果,然后对这些单词或者词组进行语义识别,从而确定出该文本信息中所包括的意图信息以及初始关键词。比如,当语音请求信息对应的文本信息为:“我想看电影哪吒”,则对该文本信息进行分词处理后,即可得到分词结果:我、想看、电影、哪吒,进而就可以根据分词结果,得到意图信息为“看电影”,初始关键词为“哪吒”。当然,本实施例在进行分词处理后,可将得到的分词结果输入至预设的意图信息与关键词联合提取模型,该意图信息与关键词联合提取模型用于从分词得到的词汇进行意图信息与关键词的提取。比如,本实施例将得到的分词结果:我、想看、电影、哪吒输入至该意图信息与关键词联合提取模型,得到意图信息为“看电影”,初始关键词为“哪吒”63.在本实施例中,当得到文本信息后,本实施例可预先对该文本信息进行一次纠错,此次纠错是为对根据语音请求信息识别后得到文本信息中的错别字进行纠错,以确保该文本信息可以准确地反映出用户的需求。在一种实现方式中,本实施例可使用预先训练好的纠错模型(比如soft-mask-bert模型)来对该文本信息进行纠错。如果该文本信息中没有错别字,则可直接对该文本信息进行分词处理,以得到所述意图信息以及初始关键词信息。而如果该文本信息中存在错别字,则需要对该错别字进行修改后,再对修改后的文本信息进行分词处理。
64.步骤s200、根据所述初始关键词,确定与所述初始关键词匹配的目标关键词。
65.由于在对语音请求信息进行语音识别时可能存在误差,因此该初始关键词可能不能完全匹配该意图信息。为了准确地执行语音指令,需要对初始关键词进行纠错,而由于初始关键词是从语音识别结果中得到,因此该初始关键词并不是与意图信息完全不匹配,而是可能存在一些语音识别错误导致该初始关键词与意图信息之间存在偏差。因此,本实施例可根据该初始关键词,确定出对应的目标关键词,该目标关键词就是对初始关键词进行纠错后得到的,该目标关键词指的是用户意图真正需要执行的内容,比如上述举例中,语音
识别结果为“我想听张雪友的歌”,则初始关键词即为“张雪友”,而“张雪友”并不是个歌手,因此终端设备是无法搜索出“张雪友”的歌。因此需要对“张雪友”进行纠错,根据“张雪友”判断出,其真正对应的应该是“张学友”,即“张学友”是目标关键词。本实施例中的目标关键词可消除初始关键词与意图信息之间的偏差,并且与意图信息完美匹配。
66.在一种实现方式中,如图3中所示,所述步骤s200具体包括如下步骤:
67.步骤s201、将所述初始关键词与预设的映射文件匹配,所述映射文件中设置有与所述初始关键词对应的目标关键词;
68.步骤s202、若匹配成功,则获取与所述初始关键词对应的目标关键词;
69.步骤s203、若匹配不成功,则根据所述初始关键词,获取与所述初始关键词关联的历史行为数据;
70.步骤s204、获取历史行为数据中使用频率大于预设阈值的文字内容,并将所述文字内容作为所述目标关键词。
71.具体实施时,当得到所述初始关键词后,本实施例首先判断是否需要对该初始关键词进行纠错,如果该初始关键词不需要纠错,则就可直接根据确定出的意图信息以及该初始关键词进行响应的操作。比如,若意图信息为指令类意图(比如打开、关闭音响等)时,由于指令类意图是明确的,不存在任何的歧义,因此就可直接执行语音识别结果,无需对该语音识别结果进行纠错。而如果意图信息是搜索类意图(比如影视搜索,音乐搜索,诗词搜索,外卖餐厅搜索,景点地名搜索等)时,由于搜索类意图内容丰富,并且存在歧义,因此不能直接对该语音识别结果进行执行,需要对初始关键词进行纠错。
72.在一种实现方式中,为了对所述初始关键词进行纠错,可采用预设得映射文件来实现,该映射文件中设置有与所述初始关键词对应的目标关键词,即一个初始关键词对应一个目标关键词。因此,当得到所述初始关键词后,即可将该初始关键词与所述映射文件进行匹配,如果匹配成功,则就获取匹配的目标关键词,即就到了该意图信息所真正对应的关键词。比如,映射文件中设置的初始关键词与目标关键词的映射关系包括有:
73.叶罗丽战士——精灵梦叶罗丽
ꢀꢀꢀꢀ
飞狗猫科——飞狗moco
74.知否——知否知否应是绿肥红瘦
ꢀꢀꢀ
抖森——汤姆
·
希德勒斯顿
75.这样,当得到初始关键词为“知否”时,则可得到与“知否”对应的为“知否知否应是绿肥红瘦”,因此“知否知否应是绿肥红瘦”即为目标关键词。
76.而当将该初始关键词和映射文件匹配后发现匹配不成功的,则就表明该映射文件中不存在与该初始关键词对应的目标关键词。此时,可根据历史行为数据来确定出该初始关键词信息匹配的目标关键词。具体实施时,本实施例首先获取终端设备中的历史行为数据,然后从这些历史行为数据中获取到与该初始关键词信息关联的历史行为数据。所述历史行为数据反映的该终端设备在过去一段时间内所执行的操作,即反映的是过去一段时间内所接受并执行语音指令,其中就包括了意图信息以及对应的文字内容(即意图信息对应的关键词)。而由于本实施例分析的是与该初始关键词对关联的历史行为数据,也就是说这些历史行为数据都是和初始关键词存在一定的联系,比如这些历史行为数据中存在某些文字内容与该初始关键词是谐音相同或者音节相似,因此这些文字内容就与初始关键词是有关联的。如果在该历史行为数据中,某个文字内容的使用频率大于预设阈值,则就表明该终端设备在执行初始关键词对应的意图信息时所用到的是这些“使用频率大于预设阈值”的
文字内容,因此就可得出,这些“使用频率大于预设阈值”的文字内容是和初始关键词匹配的,这些“使用频率大于预设阈值”的文字内容才应该和意图信息对应,因此就将这些
““
使用频率大于预设阈值
””
的文字内容作为所述目标关键词。
77.举例说明,当语音识别结果为:我要看电影奶奶的饺子馆。其中意图信息为:看电影。初始关键词为:奶奶的饺子馆。而映射文件中并没有与“奶奶的饺子馆”对应的目标关键词。此时就获取终端设备的历史行为数据,而该历史行为数据中存在“姥姥的饺子馆”,“姥姥的饺子馆”与“奶奶的饺子馆”音节相似。该“姥姥的饺子馆”影片被用户观看了10次以上,并且每一次都观看了20%以上片长,则说明“姥姥的饺子馆”的使用频率超过阈值,因此就说明“姥姥的饺子馆”与“奶奶的饺子馆”是匹配的,即表明终端设备在响应“我要看电影奶奶的饺子馆”的语音识别结果时,所用到的关键词为“姥姥的饺子馆”,因此就可以将“姥姥的饺子馆”作为所述目标关键词。
78.在另一种实现方式中,如图4中所示,本实施例中的步骤s200还可以包括:
79.步骤s21、根据所述初始关键词,获取与所述初始关键词关联的词条信息;
80.步骤s22、对所述词条信息进行权重分析,确定所述目标关键词。
81.由于用户在发出语音请求信息是随机的,请求的内容也是随机的,因此终端设备中并不一定可以直接根据映射文件来确定出识别出初始关键词所对应的目标关键词,为此本实施例需要临时设置该初始关键词对应的目标关键词。具体实施时,本实施例首先根据所述初始关键词,获取与所述初始关键词关联的词条信息。本实施例中,可分别获取所述初始关键词对应的拼音信息、文字信息以及字符串信息;分别根据所述拼音信息、所述文字信息以及所述字符串信息,搜索出与所述拼音信息对应的第一词条信息以及与所述文字信息对应的第二词条信息,与所述字符串信息对应的第三词条信息。也就是说,本实施例可提供三种搜索词条信息的方式,分别可根据初始关键词的拼音信息、文字信息以及字符串信息进行搜索,从而得到第一词条信息、第二词条信息以及第三词条信息。
82.例如,当初始关键词为:森林奇镜,则根据拼音信息搜索到的词条信息为:身临其境。
83.当初始关键词为:桥边的姑娘,则根据文字信息搜索到的词条信息为:桥边姑娘。
84.初始关键词为:天琪解说我的世界,则根据字符串信息搜索到的词条信息为:我的世界天琪解说。其中,“天琪解说我的世界”和“我的世界天琪解说”具有相同的字符串。
85.当搜索到所述词条信息后,本实施例可对该词条信息进行权重分析,确定所述目标关键词。在一种实现方式中,本实施例首先可对所述第一词条信息、所述第二词条信息以及所述第三词条信息进行去重处理,防止重复的词条信息,得到候选词条信息。然后,获取所述候选词条信息对应的权重,并计算每一个候选词条信息的分数信息。最后根据所述分数信息,从所述候选词条信息中确定出目标词条信息,并将所述目标词条信息作为所述目标关键词。具体地,由于本实施例可预先设置根据初始关键词的拼音信息、文字信息以及字符串信息进行词条信息搜索的权重,分别为wx,wy,wz,而每一个候选词条信息是基于上述三种搜索方式搜索出来的,因此本实施例可获取到该权重,即为所述候选词条信息所对应的权重。并且每一种搜索词条信息的方式都会有各自的排序方式。本实施例可根据搜索出的词条信息的准确性(即搜索词条信息与初始关键词之间的相似度)来进行排序。而每一个候选词条信息是基于不同的搜索方式搜索出来的,因此本实施例可首先对每一个候选词条
信息在基于上述三种搜索方式被搜索的准确性进行排序,得到各自的排序值(即用于衡量准确性),进而再根据每一种搜索方式的权重,就可以计算出每一个候选词条信息基于上述搜索方式被搜索的分数信息。公式如下:
86.score(a)=(wx*xa+wy*ya+wz*za)/(wx+wy+wz),
87.其中,xa为候选词条信息a在根据拼音信息搜索时准确性排序的排序值;其中,ya为候选词条信息a在根据文字信息搜索时准确性排序的排序值;其中,za为候选词条信息a在根据字符串信息搜索时准确性排序的排序值。
88.当通过计算方式,可得到每一个候选词条信息的分数信息,根据所述分数信息,本实施例即可确定出分数最高的目标词条信息,该目标词条信息即为与所述初始关键词最为接近,且是与意图信息对应的信息,因此本实施例就将该目标词条信息作为所述目标关键词。在一种实现方式中,本实施例中的权重可自定义各个维度信息来设置,以便更为准确地对候选词条信息进行排序,比如,在影视搜索时,该权重可根据影片的上映时间、点击量、影片评分等信息来设置,从多个维度来对每一个候选词条信息进行分析,以便筛选出最能与意图信息匹配的目标关键词,以便实现更为准确地对初始关键词进行纠错。此外,当通过上述方法确定出该目标关键词后,由于映射文件一开始是不存在与出初始关键词对应的目标关键词的,因此本实施例可将确定出的目标关键词以及与之匹配的初始关键词之间的对应关系添加至所述映射文件中,以使得在后续步骤中可直接使用。比如,若初始关键词为“和老鼠”,当经过上述三种搜索方式并进行权重分析以后,确定出的目标关键词为“猫和老鼠”,这样就可以将“和老鼠”以及“猫和老鼠”之间的对应关系添加至映射文件中,当后续步骤中如果对“和老鼠”的初始关键词进行纠错时,可直接获取到与之匹配的目标关键词即为“猫和老鼠”。
89.步骤s300、将所述目标关键词替换所述初始关键词,并与所述意图信息关联,形成所述意图信息与所述目标关键词之间的对应关系,得到纠错后的语音识别结果。
90.当确定出所述目标关键词后,由于该目标关键词是对初始关键词进行纠错后得到的,该目标关键词反映的是用户意图真正需要执行的内容。而从语音识别结果中得到的意图信息与初始关键词的对应关系,但是由于语音识别的误差,导致该初始关键词无法完全与意图信息匹配,而经过分析后得出,初始关键词对应的目标关键词是与该意图信息匹配的,因此本实施例为了实现对语音识别结果的纠错,将所述目标关键词替换所述初始关键词,并将所述目标关键词与所述意图信息进行关联,得到所述目标关键词与所述意图信息之间的对应关系,这样语音识别结果中就有意图信息与所述目标关键词之间的对应关系,终端设备就可以根据该意图信息以及所述目标关键词执行对应的操作。
91.此外,本实施例在构建目标关键词与意图信息之间的对应关系后,本实施例可获取历史行为数据,该历史行为数据中记录有一段时间内所有执行过的意图信息以及对应的关键词。因此本实施例可统计出所述历史行为数据中每一个目标关键词的使用记录;然后根据所述使用记录,确定每一个目标关键词所对应的意图信息的取消次数,所述取消次数用于反映所述意图信息所对应的操作被取消执行的次数。比如,若终端设备根据目标关键词去搜索意图信息相应内容后,用户发出退出指令,则说明此时取消了执行用该目标关键词去搜索意图信息所需要的内容的操作,即表示通过目标关键词所搜索出的内容可能并不是用户想要的。而如果所述取消次数超过次数阈值(比如三次),则就说明该目标关键词无
法搜索出意图信息所需要的内容,即表示该目标关键词与该意图信息并不是完全匹配,因此本实施例就会断开所述取消次数超过次数阈值的目标关键词与意图信息之间的关联,并且还会将该目标关键词与初始关键词之间的对应关系从映射文件中删除,以保证更为准确地根据语音识别结果执行对应的操作。
92.综上,本实施例提供了一种语音识别结果的纠错方法,本实施例首先获取语音识别结果,并确定所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词。此时确定出的初始关键词是直接根据语音识别结果得到的,由于语音识别可能存在误差,因此该初始关键词可能不能完全匹配该意图信息。为了准确地执行语音指令,需要对初始关键词进行纠错,而由于初始关键词是从语音识别结果中得到,因此该初始关键词并不是与意图信息完全不匹配,而是可能存在一些语音识别错误导致该初始关键词与意图信息之间存在偏差。因此,本实施例可根据该初始关键词,确定出对应的目标关键词,该目标关键词就是对初始关键词进行纠错后得到的,该目标关键词可消除初始关键词与意图信息之间的偏差,并且与意图信息完美匹配。当得到所述目标关键词后,本发明即可将所述目标关键词替换所述初始关键词,并与所述意图信息关联,形成所述意图信息与所述目标关键词之间的对应关系,从而完成所述语音识别结果的纠错,这样就可以准确地执行语音指令,提高了语音识别的准确性。
93.示例性设备
94.如图5中所示,本发明实施例提供一种语音识别结果的纠错装置,该装置包括:初始关键词确定模块10、目标关键词确定模块20、语音识别结果纠错模块30。具体地,初始关键词确定模块10,用于获取语音识别结果,并确定所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词。目标关键词确定模块20,用于根据所述初始关键词,确定与所述初始关键词匹配的目标关键词。语音识别结果纠错模块30,用于将所述目标关键词与所述意图信息关联,形成所述意图信息与所述目标关键词之间的对应关系,得到纠错后的语音识别结果。
95.在一种实现方式中,初始关键词确定模块10包括:
96.文本信息获取单元,用于获取语音请求信息,并根据所述语音请求信息,确定与所述语音请求信息所对应的文本信息;
97.识别结果确定单元,用于根据所述文本信息,确定所述语音识别结果;
98.分词结果获取单元,用于对所述语音识别结果进行分词处理,得到分词结果;
99.初始关键词确定单元,用于根据所述分词结果,得到所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词。
100.在一种实现方式中,目标关键词确定模块20包括:
101.映射文件匹配单元,用于将所述初始关键词与预设的映射文件匹配,所述映射文件中设置有与所述初始关键词对应的目标关键词;
102.目标关键词确定单元,用于若匹配成功,则获取与所述初始关键词对应的目标关键词。
103.在一种实现方式中,目标关键词确定模块20还包括:
104.词条信息获取单元,用于根据所述初始关键词,获取与所述初始关键词关联的词条信息;
105.权重分析单元,用于对所述词条信息进行权重分析,确定所述目标关键词。
106.基于上述实施例,本发明还提供了一种终端设备,其原理框图可以如图6所示。该终端设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏、温度传感器。其中,该终端设备的处理器用于提供计算和控制能力。该终端设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该终端设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音识别结果的纠错方法。该终端设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该终端设备的温度传感器是预先在终端设备内部设置,用于检测内部设备的运行温度。
107.本领域技术人员可以理解,图6中示出的原理框图,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的终端设备的限定,具体的终端设备以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
108.在一个实施例中,提供了一种终端设备,终端设备包括存储器、处理器及存储在存储器中并可在处理器上运行的语音识别结果的纠错程序,处理器执行语音识别结果的纠错程序时,实现如下操作指令:
109.获取语音识别结果,并确定所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词;
110.根据所述初始关键词,确定与所述初始关键词匹配的目标关键词;
111.将所述目标关键词替换所述初始关键词,并与所述意图信息关联,形成所述意图信息与所述目标关键词之间的对应关系,得到纠错后的语音识别结果。
112.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
113.综上,本发明公开了一种语音识别结果的纠错方法、装置、终端设备及存储介质,所述方法包括:获取语音识别结果,并确定所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词;根据所述初始关键词,确定与所述初始关键词匹配的目标关键词;将所述目标关键词替换所述初始关键词,并与所述意图信息关联,形成所述意图信息与所述目标关键词之间的对应关系,得到纠错后的语音识别结果。本发明可对语音识别结果中意图信息所对应的初始关键词进行纠错,确定出该意图信息所对应的目标关键词,并将目标关键词与意图信息进行关联,从而实现纠错,以方便更为准确地执行语音执行。
114.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可
以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术特征:


1.一种语音识别结果的纠错方法,其特征在于,所述方法包括:获取语音识别结果,并确定所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词;根据所述初始关键词,确定与所述初始关键词匹配的目标关键词;将所述目标关键词替换所述初始关键词,并与所述意图信息关联,形成所述意图信息与所述目标关键词之间的对应关系,得到纠错后的语音识别结果。2.根据权利要求1所述的语音识别结果的纠错方法,其特征在于,所述获取语音识别结果,并确定所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词,包括:获取语音请求信息,并根据所述语音请求信息,确定与所述语音请求信息所对应的文本信息;根据所述文本信息,确定所述语音识别结果;对所述语音识别结果进行分词处理,得到分词结果;根据所述分词结果,得到所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词。3.根据权利要求1所述的语音识别结果的纠错方法,其特征在于,所述根据所述初始关键词,确定与所述初始关键词匹配的目标关键词,包括:将所述初始关键词与预设的映射文件匹配,所述映射文件中设置有与所述初始关键词对应的目标关键词;若匹配成功,则获取与所述初始关键词对应的目标关键词。4.根据权利要求3所述的语音识别结果的纠错方法,其特征在于,所述根据所述初始关键词,确定与所述初始关键词匹配的目标关键词,包括:若匹配不成功,则根据所述初始关键词,获取与所述初始关键词关联的历史行为数据;获取历史行为数据中使用频率大于预设阈值的文字内容,并将所述文字内容作为所述目标关键词。5.根据权利要求1所述的语音识别结果的纠错方法,其特征在于,所述根据所述初始关键词,确定与所述初始关键词匹配的目标关键词,包括:根据所述初始关键词,获取与所述初始关键词关联的词条信息;对所述词条信息进行权重分析,确定所述目标关键词。6.根据权利要求5所述的语音识别结果的纠错方法,其特征在于,所述根据所述初始关键词,获取与所述初始关键词关联的词条信息,包括:分别获取所述初始关键词对应的拼音信息、文字信息以及字符串信息;分别根据所述拼音信息、所述文字信息以及所述字符串信息,搜索出与所述拼音信息对应的第一词条信息、与所述文字信息对应的第二词条信息以及与所述字符串信息对应的第三词条信息。7.根据权利要求6所述的语音识别结果的纠错方法,其特征在于,所述对所述词条信息进行权重分析,确定所述目标关键词,包括:对所述第一词条信息、所述第二词条信息以及所述第三词条信息进行去重处理,得到候选词条信息;获取所述候选词条信息对应的权重,并计算每一个候选词条信息的分数信息;
根据所述分数信息,从所述候选词条信息中确定出目标词条信息,并将所述目标词条信息作为所述目标关键词。8.根据权利要求1-7任一项所述的语音识别结果的纠错方法,其特征在于,所述方法还包括:获取历史行为数据,并统计所述历史行为数据中每一个目标关键词的使用记录;根据所述使用记录,确定每一个目标关键词所对应的意图信息的取消次数,所述取消次数用于反映所述意图信息所对应的操作被取消执行的次数;若所述取消次数超过次数阈值,则断开所述取消次数超过次数阈值的目标关键词与意图信息之间的关联。9.一种语音识别结果的纠错装置,其特征在于,包括:初始关键词确定模块,用于获取语音识别结果,并确定所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词;目标关键词确定模块,用于根据所述初始关键词,确定与所述初始关键词匹配的目标关键词;语音识别结果纠错模块,用于将所述目标关键词替换所述初始关键词,并与所述意图信息关联,形成所述意图信息与所述目标关键词之间的对应关系,得到纠错后的语音识别结果。10.一种终端设备,其特征在于,所述终端设备包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的语音识别结果的纠错程序,所述处理器执行所述语音识别结果的纠错程序时,实现如权利要求1-8任一项所述的语音识别结果的纠错方法的步骤。11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有语音识别结果的纠错程序,所述语音识别结果的纠错程序被处理器执行时,实现如权利要求1-8任一项所述的语音识别结果的纠错方法的步骤。

技术总结


本发明公开了一种语音识别结果的纠错方法、装置、终端设备及存储介质,所述方法包括:获取语音识别结果,并确定所述语音识别结果中的意图信息以及与所述意图信息对应的初始关键词;根据所述初始关键词,确定与所述初始关键词匹配的目标关键词;将所述目标关键词替换所述初始关键词,并与所述意图信息关联,形成所述意图信息与所述目标关键词之间的对应关系,得到纠错后的语音识别结果。本发明可对语音识别结果中意图信息所对应的初始关键词进行纠错,确定出该意图信息所对应的目标关键词,并将目标关键词与意图信息进行关联,从而实现纠错,以方便更为准确地执行语音执行。以方便更为准确地执行语音执行。以方便更为准确地执行语音执行。


技术研发人员:

盛佳琦 任希佳

受保护的技术使用者:

深圳TCL新技术有限公司

技术研发日:

2020.12.24

技术公布日:

2022/6/28

本文发布于:2024-09-20 10:48:02,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/5967.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   关键词   信息   意图
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议