热词增强的语音识别方法以及装置、存储介质、电子装置与流程



1.本技术涉及语音识别领域,具体而言,涉及一种热词增强的语音识别方法以及装置、存储介质、电子装置。


背景技术:



2.语音识别作为智能语音和人机交互的重要一环,随着深度学习技术和芯片性能的发展,其识别准确率和计算能力取得了跨越式的进展,相关的语音识别应用如在线的语音输入和搜索也受到越来越多的关注。在实际应用中,不同领域有不同的专业词汇“领域热词”,不同用户也有不同的个性化需求,而且互联网和移动互联网的发展,使得新的热点话题和热点词汇不断的涌现,这些热点词汇由于时效性和特殊性,往往在原始的语言模型中没有覆盖,导致识别性能比较差。
3.相关技术中的热词增强方法,通常是把热词加入语料中,重新训练语言模型和构建解码资源,这种方式往往比较耗时并且有失时效性;或者是是构建热词网络,并把新构建的网络和原始的解码网络合并,或者是在解码过程中对用户添加的热词单元给与激励,这样的方式不需要重新构建解码资源,可以动态的更新热词信息。然而热词权重的大小和分配方式不仅会影响热词出现的频率,还会影响整个识别过程的准确率,热词权重太低,起不到热词增强的作用,热词权重太高,可能会使得正确路径被提前裁剪掉,降低识别率。
4.针对相关技术中热词增强方法效果不佳的问题,目前尚未提出有效的解决方案。


技术实现要素:



5.本技术的主要目的在于提供一种热词增强的语音识别方法以及装置、存储介质、电子装置,以解决热词增强方法效果不佳的问题。
6.为了实现上述目的,根据本技术的一个方面,提供了一种热词增强的语音识别方法。
7.根据本技术的热词增强的语音识别方法包括:根据预设解码网络对每一帧语音信号的声学特征进行解码,其中所述解码的过程包括多个解码路径;判断所述解码路径中是否包含热词,其中所述热词按照预设规则存入热词集合中,其中所述热词集合是根据用户自定义得到的;如果判断所述解码路径中包含所述热词,则按照预设衰减模型计算当前热词得分,其中所述预设衰减模型用于表征按照时间衰减的热词权重;根据所述当前热词得分更新对应的所述解码路径的累计得分,输出解码后的语音识别结果。
8.进一步地,还包括:按照所述热词权重随时间衰减的方式在所述预设解码网络中进行热词增强处理。
9.进一步地,所述时间衰减包括:基于时间的线性衰减、基于时间的指数衰减。
10.进一步地,所述热词增强处理包括:根据用户可上传和/或更新的热词列表,设置初始权重;对所述热词列表中的热词进行分词,进行热词权重的转换之后将所述初始权重转换为与所述预设解码网络中的语言得分属于同等量级的得分,以使在解码过程中权重会
随时间衰减。
11.进一步地,所述预设衰减模型用于表征按照时间衰减的热词权重,包括:
12.所述热词权重w
t
按照如下方式随时间衰减:
13.w
t
=-λt+w0ꢀꢀ
(1)
14.其中λ为衰减系数,w0为当前热词初始权重,t为该热词在解码路径中出现的相对时间,t=0为首次出现的时间,并且衰减过程中的权重满足如下关系,其中w为所有热词的原始权重:
15.w=w0+w1+...+w
t
ꢀꢀ
(2)
16.进一步地,所述根据预设解码网络对每一帧语音信号的声学特征进行解码,其中所述解码的过程包括多个解码路径,包括:目标音频在所述解码的过程中,计算当前帧解码路径的声学得分、语言得分,并更新所述解码路径的累计得分;所述如果判断所述解码路径中包含所述热词,则按照预设衰减模型计算当前热词得分,其中所述预设衰减模型用于表征按照时间衰减的热词权重,包括:按照预设衰减模型计算当前热词得分并为该路径设置热词匹配标志以及热词匹配的相对时间;将热词得分加到路径累计到得分里面,直到所述目标音频解码结束,再回溯解码路径,得到语音识别结果。
17.进一步地,还包括:所述语音识别的过程基于所述解码网络,并结合维特比算法、剪枝策略进行的。
18.为了实现上述目的,根据本技术的另一方面,提供了一种热词增强的语音识别装置。
19.根据本技术的热词增强的语音识别装置包括:特征解码模块,用于根据预设解码网络对每一帧语音信号的声学特征进行解码,其中所述解码的过程包括多个解码路径;判断模块,用于判断所述解码路径中是否包含热词,其中所述热词按照预设规则存入热词集合中,其中所述热词集合是根据用户自定义得到的;热词得分计算模块,用于如果判断所述解码路径中包含所述热词,则按照预设衰减模型计算当前热词得分,其中所述预设衰减模型用于表征按照时间衰减的热词权重;输出模块,用于根据所述当前热词得分更新对应的所述解码路径的累计得分,输出解码后的语音识别结果。
20.为了实现上述目的,根据本技术的另一个方面,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
21.为了实现上述目的,根据本技术的再一个方面,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
22.在本技术实施例中热词增强的语音识别方法以及装置、存储介质、电子装置,采用根据预设解码网络对每一帧语音信号的声学特征进行解码,其中所述解码的过程包括多个解码路径的方式,通过判断所述解码路径中是否包含热词,其中所述热词按照预设规则存入热词集合中,其中所述热词集合是根据用户自定义得到的,如果判断所述解码路径中包含所述热词,则按照预设衰减模型计算当前热词得分,其中所述预设衰减模型用于表征按照时间衰减的热词权重,达到了根据所述当前热词得分更新对应的所述解码路径的累计得分,输出解码后的语音识别结果的目的,从而实现了热词得分的加入可以起到增强的同时
也有效的避免了热词的得分的突然引入带来裁剪上的误差的技术效果,进而解决了热词增强方法效果不佳的技术问题。
附图说明
23.构成本技术的一部分的附图用来提供对本技术的进一步理解,使得本技术的其它特征、目的和优点变得更明显。本技术的示意性实施例附图及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
24.图1是根据本技术实施例的热词增强的语音识别方法的硬件结构示意图;
25.图2是根据本技术实施例的热词增强的语音识别方法的流程示意图;
26.图3是根据本技术实施例的热词增强的语音识别装置示意图;
27.图4是根据本技术实施例的热词增强的解码的过程趋势图;
28.图5是根据本技术优选实施例的热词增强的语音识别方法的流程示意图。
具体实施方式
29.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
30.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
31.在本技术中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本技术及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
32.并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本技术中的具体含义。
33.此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本技术中的具体含义。
34.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
35.如图1所示,根据预设解码网络对每一帧语音信号的声学特征进行解码;判断所述
解码路径中是否包含热词;如果判断所述解码路径中包含所述热词,则按照预设衰减模型计算当前热词得分;根据所述当前热词得分更新对应的所述解码路径的累计得分,输出解码后的语音识别结果。
36.如图2所示,该方法包括如下的步骤s201至步骤s203:
37.步骤s201,根据预设解码网络对每一帧语音信号的声学特征进行解码,其中所述解码的过程包括多个解码路径;
38.步骤s202,判断所述解码路径中是否包含热词,其中所述热词按照预设规则存入热词集合中,其中所述热词集合是根据用户自定义得到的;
39.步骤s203,如果判断所述解码路径中包含所述热词,则按照预设衰减模型计算当前热词得分,其中所述预设衰减模型用于表征按照时间衰减的热词权重;
40.步骤s204,根据所述当前热词得分更新对应的所述解码路径的累计得分,输出解码后的语音识别结果。
41.从以上的描述中,可以看出,本技术实现了如下技术效果:
42.采用根据预设解码网络对每一帧语音信号的声学特征进行解码,其中所述解码的过程包括多个解码路径的方式,通过判断所述解码路径中是否包含热词,其中所述热词按照预设规则存入热词集合中,其中所述热词集合是根据用户自定义得到的,如果判断所述解码路径中包含所述热词,则按照预设衰减模型计算当前热词得分,其中所述预设衰减模型用于表征按照时间衰减的热词权重,达到了根据所述当前热词得分更新对应的所述解码路径的累计得分,输出解码后的语音识别结果的目的,从而实现了热词得分的加入可以起到增强的同时也有效的避免了热词的得分的突然引入带来裁剪上的误差的技术效果,进而解决了热词增强方法效果不佳的技术问题。
43.上述步骤s201中根据预设解码网络对每一帧语音信号的声学特征进行解码,语音识别的解码过程即在解码网络的基础上,结合维特比算法和剪枝策略展开的。每帧语音信号提取声学特征后,就输入到预设解码网络中。
44.作为本实施例中的优选,还包括:所述语音识别的过程基于所述解码网络,并结合维特比算法、剪枝策略进行的。
45.作为一种可选的实施方式,所述解码的过程包括多个解码路径。对于每个解码路径都会进行打分。
46.作为一种优选的实施方式,在解码过程中,对于当前帧活跃的路径计算其解码单元的声学得分、语言得分,并更新路径的累计得分。
47.上述步骤s202中判断所述解码路径中是否包含热词。对于每个时刻每条路径的解码单元来说,判断其输出是否包含热词集合中的热词,如果包含,则按照预设的热词权重衰减模型计算热词得分。
48.作为一种可选的实施方式,所述热词集合是根据用户自定义得到的。
49.作为一种优选的实施方式,根据用户自定义的方式,用户可上传和更新热词列表,并为上传的热词列表设置初始的权重。
50.上述步骤s203中如果判断所述解码路径中包含所述热词,则按照预设衰减模型计算当前热词得分。如果判断所述解码路径中不包含热词,则会直接更新各个路径中的得分。
51.作为本实施例中的优选,方法还包括:按照所述热词权重随时间衰减的方式在所
述预设解码网络中进行热词增强处理。
52.作为一种可选的实施方式,所述预设衰减模型用于表征按照时间衰减的热词权重,可以是线性的或者指数的。
53.作为一种优选的实施方式,在解码过程中,基于所述预设衰减模型的每个热词单元的权重会随时间不断的衰减,即热词增强的效果会随着时间的增长按照一定的规律影响到解码的过程。
54.上述步骤s204中根据所述当前热词得分更新对应的所述解码路径的累计得分,输出解码后的语音识别结果。所述解码路径包括了多种得分,比如声学得分、语言得分等。
55.作为本实施例中的优选,所述时间衰减包括:基于时间的线性衰减、基于时间的指数衰减。
56.作为本实施例中的优选,所述热词增强处理包括:根据用户可上传和/或更新的热词列表,设置初始权重;对所述热词列表中的热词进行分词,进行热词权重的转换之后将所述初始权重转换为与所述预设解码网络中的语言得分属于同等量级的得分,以使在解码过程中权重会随时间衰减。
57.作为本实施例中的优选,所述预设衰减模型用于表征按照时间衰减的热词权重,包括:用户设置的热词权重w
t
按照如下方式随时间衰减:
58.w
t
=-λt+w0ꢀꢀ
(1)
59.其中λ为衰减系数,w0为当前热词初始权重,t为该热词在解码路径中出现的相对时间,t=0为首次出现的时间,并且衰减过程中的权重满足如下关系,其中w为热词的原始权重:
60.w=w0+w1+...+w
t
ꢀꢀ
(2),
61.用户可上传和更新热词列表,并为上传的热词列表设置初始的权重,然后热词模块对用户上传的热词进行分词,进行热词权重的转换,将用户设置的权重w(比如3,范围为[-5,5])转换为跟解码网络中语言分同等量级的得分,该权重即为热词单元的原始权重w。
[0062]
进一步而言,在解码过程中,每个热词单元的权重会随时间不断的衰减,即热词增强的效果会随着时间的增长按照一定的规律影响到解码的过程。比如热词单元“北京”,其热词权重w
t
会按照如上述(1)的方式随时间衰减。
[0063]
作为本实施例中的优选,所述根据预设解码网络对每一帧语音信号的声学特征进行解码,其中所述解码的过程包括多个解码路径,包括:目标音频在所述解码的过程中,计算当前帧解码路径的声学得分、语言得分,并更新所述解码路径的累计得分;所述如果判断所述解码路径中包含所述热词,则按照预设衰减模型计算当前热词得分,其中所述预设衰减模型用于表征按照时间衰减的热词权重,包括:按照预设衰减模型计算当前热词得分并为该路径设置热词匹配标志以及热词匹配的相对时间;将热词得分加到路径累计到得分里面,直到所述目标音频解码结束,再回溯解码路径,得到语音识别结果。
[0064]
具体实施时,目标音频在所述解码的过程中,计算当前帧解码路径的声学得分、语言得分,并更新所述解码路径的累计得分。按照预设衰减模型计算当前热词得分并为该路径设置热词匹配标志以及热词匹配的相对时间;将热词得分加到路径累计到得分里面,直到所述目标音频解码结束,再回溯解码路径,得到语音识别结果。
[0065]
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的
计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0066]
根据本技术实施例,还提供了一种用于实施上述方法的热词增强的语音识别装置,如图3所示,该装置包括:
[0067]
特征解码模块301,用于根据预设解码网络对每一帧语音信号的声学特征进行解码,其中所述解码的过程包括多个解码路径;
[0068]
判断模块302,用于判断所述解码路径中是否包含热词,其中所述热词按照预设规则存入热词集合中,其中所述热词集合是根据用户自定义得到的;
[0069]
热词得分计算模块303,用于如果判断所述解码路径中包含所述热词,则按照预设衰减模型计算当前热词得分,其中所述预设衰减模型用于表征按照时间衰减的热词权重;
[0070]
输出模块304,用于根据所述当前热词得分更新对应的所述解码路径的累计得分,输出解码后的语音识别结果。
[0071]
上述特征解码模块301中根据预设解码网络对每一帧语音信号的声学特征进行解码,语音识别的解码过程即在解码网络的基础上,结合维特比算法和剪枝策略展开的。每帧语音信号提取声学特征后,就输入到预设解码网络中。
[0072]
作为本实施例中的优选,还包括:所述语音识别的过程基于所述解码网络,并结合维特比算法、剪枝策略进行的。
[0073]
作为一种可选的实施方式,所述解码的过程包括多个解码路径。对于每个解码路径都会进行打分。
[0074]
作为一种优选的实施方式,在解码过程中,对于当前帧活跃的路径计算其解码单元的声学得分、语言得分,并更新路径的累计得分。
[0075]
上述判断模块302中判断所述解码路径中是否包含热词。对于每个时刻每条路径的解码单元来说,判断其输出是否包含热词集合中的热词,如果包含,则按照预设的热词权重衰减模型计算热词得分。
[0076]
作为一种可选的实施方式,所述热词集合是根据用户自定义得到的。
[0077]
作为一种优选的实施方式,根据用户自定义的方式,用户可上传和更新热词列表,并为上传的热词列表设置初始的权重。
[0078]
上述热词得分计算模块303中如果判断所述解码路径中包含所述热词,则按照预设衰减模型计算当前热词得分。如果判断所述解码路径中不包含热词,则会直接更新各个路径中的得分。
[0079]
作为本实施例中的优选,方法还包括:按照所述热词权重随时间衰减的方式在所述预设解码网络中进行热词增强处理。
[0080]
作为一种可选的实施方式,所述预设衰减模型用于表征按照时间衰减的热词权重,可以是线性的或者指数的。
[0081]
作为一种优选的实施方式,在解码过程中,基于所述预设衰减模型的每个热词单元的权重会随时间不断的衰减,即热词增强的效果会随着时间的增长按照一定的规律影响到解码的过程。
[0082]
上述输出模块304中根据所述当前热词得分更新对应的所述解码路径的累计得分,输出解码后的语音识别结果。所述解码路径包括了多种得分,比如声学得分、语言得分
等。
[0083]
显然,本领域的技术人员应该明白,上述的本技术的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本技术不限制于任何特定的硬件和软件结合。
[0084]
为了更好的理解上述的热词增强的语音识别方法流程,以下结合优选实施例对上述技术方案进行解释说明,但不用于限定本发明实施例的技术方案。
[0085]
本技术实施例中热词增强的语音识别方法,通过对热词权重建立了一个简单的随时间逐步衰减的数学模型,其意义在于热词的加入可以随时间逐步的影响解码过程,一方面可以热词得分的加入可以起到增强的作用,另一方面也有效的避免了热词的得分的突然引入带来裁剪上的误差。
[0086]
如图4所示,在解码过程中,每个热词单元的权重会随时间不断的衰减,即热词增强的效果会随着时间的增长按照一定的规律影响到解码的过程。图4 为热词权重按照线性规律衰减的示例图,比如热词单元“北京”,其热词权重w
t
会按照如下方式随时间衰减:
[0087]wt
=-λt+w0ꢀꢀ
(1)
[0088]
其中λ为衰减系数,w0为初始权重,t为该热词单元在解码路径中出现的相对时间,t=0为首次出现的时间,并且衰减过程中的权重满足如下关系,其中w为热词的原始权重:
[0089]
w=w0+w1+...+w
t
ꢀꢀ
(2)
[0090]
线性衰减只是热词权重衰减方式的简单示例,在实际应用中热词衰减可以采用比如指数等其他衰减方式。
[0091]
如图5所示,是热词增强的语音识别方法的流程示意图,其具体包括:
[0092]
步骤s501,开始。
[0093]
步骤s502,音频是否结束。
[0094]
步骤s503,语音声学特征。
[0095]
步骤s504,解码网络。
[0096]
步骤s505,当前解码路径输出是否包含热词。
[0097]
步骤s506,更新解码路径的累计得分:历史得分+声学得分+语言得分。
[0098]
步骤s507,更新路径上热词匹配的相对时间。
[0099]
步骤s508,计算热词得分,更新解码路径得分,即路径累计得分加上热词得分。
[0100]
步骤s509,回溯解码路径,获得最佳的识别结果。
[0101]
步骤s510,结束。
[0102]
需要注意的是,所述预设解码网络是根据声学模型、语言模型和发音词典构建的识别资源,比如加权有限状态转换器(wfst)。
[0103]
具体而言,解码过程如图5所示,语音识别的解码过程即在解码网络的基础上,结合维特比算法和剪枝策略展开的。每帧语音信号提取声学特征后,就输入到解码网络中,在解码过程中,对于当前帧所有活跃的路径计算其解码单元的声学得分、语言得分,并更新路径的累计得分。对于每个时刻每条路径的解码单元来说,判断其输出是否包含热词集合中
的热词,如果包含,则按照上述的热词权重衰减模型计算热词得分,如线性衰减则按照公式(1)计算热词得分,并为该路径设置热词匹配标志和热词匹配的相对时间,然后把热词得分加到路径累计得分里面,重复上述过程,直到音频解码结束,再回溯解码路径,得到最终的识别结果。
[0104]
以上所述仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。

技术特征:


1.一种热词增强的语音识别方法,其特征在于,包括:根据预设解码网络对每一帧语音信号的声学特征进行解码,其中所述解码的过程包括多个解码路径;判断所述解码路径中是否包含热词,其中所述热词按照预设规则存入热词集合中,其中所述热词集合是根据用户自定义得到的;如果判断所述解码路径中包含所述热词,则按照预设衰减模型计算当前热词得分,其中所述预设衰减模型用于表征按照时间衰减的热词权重;根据所述当前热词得分更新对应的所述解码路径的累计得分,输出解码后的语音识别结果。2.根据权利要求1所述的方法,其特征在于,还包括:按照所述热词权重随时间衰减的方式在所述预设解码网络中进行热词增强处理。3.根据权利要求2所述的方法,其特征在于,所述时间衰减包括:基于时间的线性衰减、基于时间的指数衰减。4.根据权利要求2所述的方法,其特征在于,所述热词增强处理包括:根据用户可上传和/或更新的热词列表,设置初始权重;对所述热词列表中的热词进行分词,进行热词权重的转换之后将所述初始权重转换为与所述预设解码网络中的语言得分属于同等量级的得分,以使在解码过程中权重会随时间衰减。5.根据权利要求1所述的方法,其特征在于,所述预设衰减模型用于表征按照时间衰减的热词权重,包括:所述热词权重w
t
按照如下方式随时间衰减:w
t
=-λt+w0ꢀꢀ
(1)其中λ为衰减系数,w0为当前热词初始权重,t为该热词在解码路径中出现的相对时间,t=0为首次出现的时间,并且衰减过程中的权重满足如下关系,其中w为所有热词的原始权重:w=w0+w1+...+w
t
ꢀꢀ
(2)。6.根据权利要求1所述的方法,其特征在于,所述根据预设解码网络对每一帧语音信号的声学特征进行解码,其中所述解码的过程包括多个解码路径,包括:目标音频在所述解码的过程中,计算当前帧解码路径的声学得分、语言得分,并更新所述解码路径的累计得分;所述如果判断所述解码路径中包含所述热词,则按照预设衰减模型计算当前热词得分,其中所述预设衰减模型用于表征按照时间衰减的热词权重,包括:按照预设衰减模型计算当前热词得分并为该路径设置热词匹配标志以及热词匹配的相对时间;将热词得分加到路径累计到得分里面,直到所述目标音频解码结束,再回溯解码路径,得到语音识别结果。7.根据权利要求6所述的方法,其特征在于,还包括:所述语音识别的过程基于所述解码网络,并结合维特比算法、剪枝策略进行的。
8.一种热词增强的语音识别装置,其特征在于,包括:特征解码模块,用于根据预设解码网络对每一帧语音信号的声学特征进行解码,其中所述解码的过程包括多个解码路径;判断模块,用于判断所述解码路径中是否包含热词,其中所述热词按照预设规则存入热词集合中,其中所述热词集合是根据用户自定义得到的;热词得分计算模块,用于如果判断所述解码路径中包含所述热词,则按照预设衰减模型计算当前热词得分,其中所述预设衰减模型用于表征按照时间衰减的热词权重;输出模块,用于根据所述当前热词得分更新对应的所述解码路径的累计得分,输出解码后的语音识别结果。9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至7任一项所述的方法。10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至7任一项所述的方法。

技术总结


本申请公开了一种热词增强的语音识别方法以及装置、存储介质、电子装置。该方法包括根据预设解码网络对每一帧语音信号的声学特征进行解码,其中所述解码的过程包括多个解码路径;判断所述解码路径中是否包含热词,其中所述热词按照预设规则存入热词集合中,其中所述热词集合是根据用户自定义得到的;如果判断所述解码路径中包含所述热词,则按照预设衰减模型计算当前热词得分,其中所述预设衰减模型用于表征按照时间衰减的热词权重;根据所述当前热词得分更新对应的所述解码路径的累计得分,输出解码后的语音识别结果。本申请解决了热词增强方法效果不佳的技术问题。增强方法效果不佳的技术问题。增强方法效果不佳的技术问题。


技术研发人员:

肖艳红 赵茂祥 李全忠 何国涛 蒲瑶

受保护的技术使用者:

普强时代(珠海横琴)信息技术有限公司

技术研发日:

2022.06.10

技术公布日:

2022/9/30

本文发布于:2024-09-24 12:20:02,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/81636.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   得分   路径   权重
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议