...一种基于LLD和DSS融合特征的语音情感识别方法【专利】

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910143689.6
(22)申请日 2019.02.25
(71)申请人 南京信息工程大学
地址 210032 江苏省南京市江北新区宁六
路219号
(72)发明人 张秀再 王玮蔚 
(74)专利代理机构 南京经纬专利商标代理有限
公司 32200
代理人 葛潇敏
(51)Int.Cl.
G10L  25/63(2013.01)
G10L  25/30(2013.01)
(54)发明名称
一种基于LLD和DSS融合特征语音情感
别方法
(57)摘要
本发明公布了一种基于LLD和DSS融合特征
的语音情感识别方法,具体为在传统LLD特征的
基础上,增加了DSS特征进行特征集扩充,再通过
自编码器将扩充后的特征集进行降维,得到LLD+
DSS融合特征。最后将LLD+DSS融合特征作为LSTM
深度网络的输入,由LSTM深度网络判定每条融合
特征对应的情感种类。本发明相较于传统语音情
感特征和分类识别算法具有更好的综合性能,提
高了语音情感分类的准确性。权利要求书1页  说明书7页  附图4页CN 109767788 A 2019.05.17
C N  109767788
A
权 利 要 求 书1/1页CN 109767788 A
1.一种基于LLD和DSS融合特征的语音情感识别方法,其特征在于,该方法包括如下步骤:
步骤1:提取情感语音数据集的LLD特征和DSS特征;
步骤2:将LLD特征与DSS特征作为自编码器的训练集,所述自编码器对LLD特征和DSS特征进行降维计算,得到降维后的LLD+DSS的融合特征;
步骤3:将步骤2中所述的LLD+DSS的融合特征依次输入至LSTM深度网络中,由LSTM深度网络识别每条融合特征对应的情感种类。
2.基于权利要求1所述的方法,其特征在于,所述步骤1中,采用DSS算法对情感语音数据集进行DSS特征的提取;所述DSS算法的阶数设为2阶,即提取的DSS特征包括情感语音数据集的零阶特征、一阶特征和二阶特征,各特征的获取方法为:将情感语音数据集作为输入信号通过第一低通滤波器获得零阶特征;将情感语音数据集作为输入信号依次通过第一小波带通滤波器和第二低通滤波器获得一阶特征;将情感语音数据集作为输入信号依次通过第一小波带通滤波器、第二小波带通滤波器和第三低通滤波器获得二阶特征,所述第二小波带通滤波器的频率高于第一小波带通滤波器的频率。
3.基于权利要求1所述的方法,其特征在于,所述步骤1中,情感语音数据集包括EMODB 数据集、RAVDESS数据集和Surrey数据集。
4.基于权利要求3所述的方法,其特征在于,所述步骤3中,LSTM深度网络具有β层网络层,该β层网络层中的前β-1层用于对输入的LLD+DSS的融合特征进行训练得到该条融合特征的隐含特征;最后一层为分类器,该分类器判断所述隐含特征所对应的情感种类,也即该条融合特征所对应的情感种类。
5.基于权利要求4所述的方法,其特征在于,所述分类器中的维度个数与共有情感种类的个数θ一致,一个维度对应共有情感种类中的一种情感种类;所述共有情感种类为EMODB 数据集、RAVDESS数据集和Surrey数据集中共有的情感种类。
6.基于权利要求5所述的方法,其特征在于,所述分类器判断隐含特征所对应的情感种类的方法为:分类器将隐含特征映射到(0,1)的区间内,得到θ1个概率,该θ1个概率与θ个共有情感种类一一对应,θ1=θ;概率最大的情感种类为该隐含特征对应的情感种类。
7.基于权利要求4所述的方法,其特征在于,所述分类器为sofmax分类器。
8.基于权利要求1所述的方法,其特征在于,所述自编码器具有3层神经网络层,分别为输入层、隐含层和输出层,LLD+DSS的融合特征的维度等于输出层神经元的个数。
2

本文发布于:2024-09-21 15:40:11,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/463386.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:特征   情感   数据   语音
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议