一种基于谐波冲击源分离数据增强的音频场景识别方法[发明专利]

专利名称:一种基于谐波冲击源分离数据增强的音频场景识别方法
专利类型:发明专利
发明人:张涛,刘赣俊
申请号:CN201910233185.3
申请日:20190326
公开号:CN110070856A
公开日:
20190730
专利内容由知识产权出版社提供
摘要:一种基于谐波冲击源分离数据增强的音频场景识别方法,包括:对训练集中的音频进行总谐波分量H与总冲击分量P的分离,通过由一段音频生成两段音频,实现数据增强;将经过谐波冲击源分离得到的两段音频作为训练集输入场景识别系统,进行音频特征提取;将训练集的音频特征作为分类器网络的输入,训练分类器网络,在测试集中根据分类器网络的输出结果识别音频场景。本发明用于在音频场景识别,采用相同的分类器模型,分类准确率得到了较大的提升。通过基于谐波冲击源分离数据增强,系统将会获得一个更大、更多样化的训练集。基于该训练集对分类器网络进行训练,可以很好地提升分类器网络的学习能力和泛化能力。
申请人:天津大学
地址:300072 天津市南开区卫津路92号
国籍:CN
代理机构:天津市北洋有限责任专利代理事务所
代理人:杜文茹

本文发布于:2024-09-21 01:35:55,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/759832.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:音频   分类器   网络   专利
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议