(12)发明专利说明书 | ||
(10)申请公布号 CN 114495957 A (43)申请公布日 2022.05.13 | ||
权利要求说明书 说明书 幅图 |
本发明属于语音处理领域,具体涉及一种基于Transformer改进的语音增强方法、系统、装置。该方法包括如下步骤:S1:对标准Transformer网络进行改良得到用于执行语音增强任务的序列模型。S2:在序列模型的输入和输出端分别增加线性处理层,进而得到语音增强模型。S3:获取不含噪音的标准语音信号,并与随机噪音信号进行混合得到混沌语音信号;进而构成模型训练的数据集。S4:完成语音增强模型的初始化,设置损失函数和训练参数对语音增强模型进行训练和验证。S5:获取待处理的单通道语音信号,将其输入到完成训练的语音增强模型中,转换成语音增强后的清晰语音。本发明解决了现有的Transformer模型顺序建模能力较弱、训练速度慢,训练阶段难以收敛的问题。 | |
法律状态公告日 | 法律状态信息 | 法律状态 |
2022-05-31 | 实质审查的生效IPC(主分类):G10L21/02专利申请号:2022101022106申请日:20220127 | 实质审查的生效 |
2022-05-13 | 公开 | 发明专利申请公布 |
本文发布于:2024-09-20 13:49:41,感谢您对本站的认可!
本文链接:https://www.17tex.com/xueshu/802308.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |