一种基于Transformer改进的语音增强方法、系统、装置

(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 CN 114495957 A
(43)申请公布日 2022.05.13
(21)申请号 CN202210102210.6
(22)申请日 2022.01.27
(71)申请人 安徽大学
    地址 230601 安徽省合肥市经济技术开发区九龙路111号
(72)发明人 周健 郭玉成
(74)专利代理机构
    代理人
(51)Int.CI
      G10L21/02
      G10L25/30
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      一种基于Transformer改进的语音增强方法、系统、装置
(57)摘要
      本发明属于语音处理领域,具体涉及一种基于Transformer改进的语音增强方法、系统、装置。该方法包括如下步骤:S1:对标准Transformer网络进行改良得到用于执行语音增强任务的序列模型。S2:在序列模型的输入和输出端分别增加线性处理层,进而得到语音增强模型。S3:获取不含噪音的标准语音信号,并与随机噪音信号进行混合得到混沌语音信号;进而构成模型训练的数据集。S4:完成语音增强模型的初始化,设置损失函数和训练参数对语音增强模型进行训练和验证。S5:获取待处理的单通道语音信号,将其输入到完成训练的语音增强模型中,转换成语音增强后的清晰语音。本发明解决了现有的Transformer模型顺序建模能力较弱、训练速度慢,训练阶段难以收敛的问题。
法律状态
法律状态公告日
法律状态信息
法律状态
2022-05-31
实质审查的生效IPC(主分类):G10L21/02专利申请号:2022101022106申请日:20220127
实质审查的生效
2022-05-13
公开
发明专利申请公布
权 利 要 求 说 明 书
【一种基于Transformer改进的语音增强方法、系统、装置】的权利说明书内容是......
说  明  书
【一种基于Transformer改进的语音增强方法、系统、装置】的说明书内容是......

本文发布于:2024-09-20 13:49:41,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/802308.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:语音   增强   模型   训练   方法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议