(12)发明专利说明书 | ||
(10)申请公布号 CN 114564564 A (43)申请公布日 2022.05.31 | ||
权利要求说明书 说明书 幅图 |
本申请公开了一种用于语音识别的热词增强方法、设备及介质。方法包括:通过编码器获取热词的音频文件,并根据音频文件提取特征,将提取的特征发送至CTC解码器,以通过CTC解码器获得流式识别结果;将流式识别结果输入至语言模型进行浅融合,以根据前缀树对识别结果进行偏置,得到搜索图;通过WFST进行浅融合,以根据搜索图获取最佳路径,将最佳路径发送至注意力解码器,通过注意力解码器获得精确结果,以完成对热词的增强。本申请通过WFST的浅融合、基于前缀树的深度偏置和语言模型相结合的热词增强方法,提高了对域外(OOD)音频的识别准确率。热词的识别准确率得到明显的提升。 | |
法律状态公告日 | 法律状态信息 | 法律状态 |
2022-05-31 | 公开 | 发明专利申请公布 |
2022-06-17 | 实质审查的生效IPC(主分类):G06F16/33专利申请号:2022101802470申请日:20220225 | 实质审查的生效 |
本文发布于:2024-09-21 08:03:59,感谢您对本站的认可!
本文链接:https://www.17tex.com/tex/4/462901.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |