端到端语音的置信度计算方法、装置、服务器和介质[发明专利]

专利名称:端到端语音的置信度计算方法、装置、服务器和介质
专利类型:发明专利
发明人:王文超,余骁捷
申请号:CN202111403940.1
申请日:20211124
公开号:CN114005434A
公开日:
20220201
专利内容由知识产权出版社提供
摘要:本发明公开了一种语音识别中端到端语音的置信度计算方法、装置、服务器和介质。识别方法,包括:提取输入音频各帧数据的声学特征;将所述声学特征输入语音识别解码器并得到对应的识别结果;根据所述声学特征、所述识别结果和预设特征抽象模型,提取所述识别结果中每个字的置信度特征;将所述识别结果和所提取的置信度特征作为置信度计算模型的输入,预测出所述识别结果中每个字的置信度和句子的置信度。上述语音识别中端到端语音的置信度计算方法,直接由声学特征和识别结果计算各个字和句子的置信度,此置信度计算方案无需适配与依赖语音识别解码器的具体实现,具有独立优化、高效、减少错误累加的优点,在实际业务场景中具有较高的实用价值。
申请人:北京小鹏汽车有限公司
地址:100089 北京市海淀区北四环西路67号14层1608室
国籍:CN
代理机构:北京清亦华知识产权代理事务所(普通合伙)
代理人:花丽

本文发布于:2024-09-24 20:33:32,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/421083.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:识别   置信度   特征
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议