一种基于Transformer改进的语音增强方法、系统、装置

(19)中华人民共和国国家知识产权局

	(12)发明专利说明书
		(10)申请公布号 CN 114495957 A (43)申请公布日 2022.05.13

(21)申请号 CN202210102210.6

(22)申请日 2022.01.27

(71)申请人安徽大学

地址 230601 安徽省合肥市经济技术开发区九龙路111号

(72)发明人周健郭玉成

(74)专利代理机构

代理人

(51)Int.CI

G10L21/02

G10L25/30

权利要求说明书说明书幅图

(54)发明名称

一种基于Transformer改进的语音增强方法、系统、装置

(57)摘要

本发明属于语音处理领域，具体涉及一种基于Transformer改进的语音增强方法、系统、装置。该方法包括如下步骤：S1：对标准Transformer网络进行改良得到用于执行语音增强任务的序列模型。S2：在序列模型的输入和输出端分别增加线性处理层，进而得到语音增强模型。S3：获取不含噪音的标准语音信号，并与随机噪音信号进行混合得到混沌语音信号；进而构成模型训练的数据集。S4：完成语音增强模型的初始化，设置损失函数和训练参数对语音增强模型进行训练和验证。S5：获取待处理的单通道语音信号，将其输入到完成训练的语音增强模型中，转换成语音增强后的清晰语音。本发明解决了现有的Transformer模型顺序建模能力较弱、训练速度慢，训练阶段难以收敛的问题。

法律状态

法律状态公告日	法律状态信息	法律状态
2022-05-31	实质审查的生效IPC(主分类):G10L21/02专利申请号:2022101022106申请日:20220127	实质审查的生效
2022-05-13	公开	发明专利申请公布