...多头注意力机制的语音识别模型建立方法[发明专利]

专利名称:基于瓶颈特征和多尺度多头注意力机制的语音识别模型建立方法
专利类型:发明专利
发明人:韩纪庆,唐海桃,郑铁然,郑贵滨
申请号:CN201910477034.2
申请日:20190603
公开号:CN110211574A
公开日:
20190906
专利内容由知识产权出版社提供
摘要:基于瓶颈特征和多尺度多头注意力机制的语音识别模型建立方法,属于建模方法领域。传统的注意力模型存在识别性能较差,注意力尺度单一等问题。一种基于瓶颈特征和多尺度多头注意力机制的语音识别模型建立方法,采用深度置信网络提取瓶颈特征作为前端,能够增加模型的鲁棒性,而后端则采用由不同尺度的卷积核组成的多尺度多头注意力模型,分别对音素、音节、词等级别的语音基元进行建模,逐个计算出循环神经网络隐含层状态序列以及输出序列;使用每个头的注意力网络所对应的解码网络计算输出序列在位置处的元素,最终将所有输出序列采整合成一个新的输出序列。本发明能够提高语音识别系统的识别效果。
申请人:哈尔滨工业大学
地址:150001 黑龙江省哈尔滨市南岗区西大直街92号
国籍:CN
代理机构:哈尔滨市松花江专利商标事务所
代理人:刘冰

本文发布于:2024-09-22 16:35:41,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/424549.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:模型   注意力   序列   语音   识别
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议