全连接多尺度的残差网络及其进行声纹识别的方法[发明专利]

专利名称:全连接多尺度的残差网络及其进行声纹识别的方法专利类型:发明专利
发明人:王文超,方策,张鹏远,颜永红
申请号:CN202010731632.0
申请日:20200727
公开号:CN111833886A
公开日:
20201027
专利内容由知识产权出版社提供
摘要:本发明提供了一种全连接多尺度的残差网络及其进行声纹识别的方法。该残差网络包括输入层,卷积层,N个依次连接的残差模块,以及全连接层。其中,在每个残差模块中,可以将输入的特征图分成多个分组,长度和宽度均为1的第一卷积核的输出,连接到后面经过多个第二卷积核构成的第二卷积核组,作为第二卷积核组的输入,最后将经过第二卷积核组的输出的特征图拼接在一起,由长度和宽度均为1的第三卷积核对其进行卷积处理,实现多尺度特征信息的融合,全连接层可以根据融合后的特征更好预测并输出用于指示说话人的分类信息。如此,可以在不增加网络深度的情况下,更好的提取多尺度的特征,从而实现更为准确的进行声纹识别。
申请人:中国科学院声学研究所,北京中科信利技术有限公司
地址:100190 北京市海淀区北四环西路21号
国籍:CN
代理机构:北京亿腾知识产权代理事务所(普通合伙)
代理人:陈霁

本文发布于:2024-09-24 02:30:24,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/402912.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:特征   残差   网络   连接   进行   北京   尺度
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议