首页 > 学术百科

一种基于谐波冲击源分离数据增强的音频场景识别方法[发明专利]

专利名称：一种基于谐波冲击源分离数据增强的音频场景识别方法

专利类型：发明专利

发明人：张涛，刘赣俊

申请号：CN201910233185.3

申请日：20190326

公开号：CN110070856A

公开日：

20190730

专利内容由知识产权出版社提供

摘要：一种基于谐波冲击源分离数据增强的音频场景识别方法，包括：对训练集中的音频进行总谐波分量H与总冲击分量P的分离，通过由一段音频生成两段音频，实现数据增强；将经过谐波冲击源分离得到的两段音频作为训练集输入场景识别系统，进行音频特征提取；将训练集的音频特征作为分类器网络的输入，训练分类器网络，在测试集中根据分类器网络的输出结果识别音频场景。本发明用于在音频场景识别，采用相同的分类器模型，分类准确率得到了较大的提升。通过基于谐波冲击源分离数据增强，系统将会获得一个更大、更多样化的训练集。基于该训练集对分类器网络进行训练，可以很好地提升分类器网络的学习能力和泛化能力。

申请人：天津大学

地址：300072 天津市南开区卫津路92号

国籍：CN

代理机构：天津市北洋有限责任专利代理事务所

代理人：杜文茹

本文发布于:2024-09-21 01:35:55，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/759832.html

上一篇：适用于MMC的同时抑制二倍频与四倍频的环流抑制方法[发明专利]

下一篇：一种架空和电缆混合输电线路故障定位方法和装置[发明专利]