首页 > 专利技术

...一种基于LLD和DSS融合特征的语音情感识别方法【专利】

(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 (43)申请公布日 (21)申请号 201910143689.6

(22)申请日 2019.02.25

(71)申请人南京信息工程大学

地址 210032 江苏省南京市江北新区宁六

路219号

(72)发明人张秀再　王玮蔚　

(74)专利代理机构南京经纬专利商标代理有限

公司 32200

代理人葛潇敏

(51)Int.Cl.

G10L 25/63(2013.01)

G10L 25/30(2013.01)

(54)发明名称

一种基于LLD和DSS融合特征的语音情感识

别方法

(57)摘要

本发明公布了一种基于LLD和DSS融合特征

的语音情感识别方法，具体为在传统LLD特征的

基础上，增加了DSS特征进行特征集扩充，再通过

自编码器将扩充后的特征集进行降维，得到LLD+

DSS融合特征。最后将LLD+DSS融合特征作为LSTM

深度网络的输入，由LSTM深度网络判定每条融合

特征对应的情感种类。本发明相较于传统语音情

感特征和分类识别算法具有更好的综合性能，提

高了语音情感分类的准确性。权利要求书1页说明书7页附图4页CN 109767788 A 2019.05.17

C N 109767788

权　利　要　求　书1/1页CN 109767788 A

1.一种基于LLD和DSS融合特征的语音情感识别方法，其特征在于，该方法包括如下步骤：

步骤1：提取情感语音数据集的LLD特征和DSS特征；

步骤2：将LLD特征与DSS特征作为自编码器的训练集，所述自编码器对LLD特征和DSS特征进行降维计算，得到降维后的LLD+DSS的融合特征；

步骤3：将步骤2中所述的LLD+DSS的融合特征依次输入至LSTM深度网络中，由LSTM深度网络识别每条融合特征对应的情感种类。

2.基于权利要求1所述的方法，其特征在于，所述步骤1中，采用DSS算法对情感语音数据集进行DSS特征的提取；所述DSS算法的阶数设为2阶，即提取的DSS特征包括情感语音数据集的零阶特征、一阶特征和二阶特征，各特征的获取方法为：将情感语音数据集作为输入信号通过第一低通滤波器获得零阶特征；将情感语音数据集作为输入信号依次通过第一小波带通滤波器和第二低通滤波器获得一阶特征；将情感语音数据集作为输入信号依次通过第一小波带通滤波器、第二小波带通滤波器和第三低通滤波器获得二阶特征，所述第二小波带通滤波器的频率高于第一小波带通滤波器的频率。

3.基于权利要求1所述的方法，其特征在于，所述步骤1中，情感语音数据集包括EMODB 数据集、RAVDESS数据集和Surrey数据集。

4.基于权利要求3所述的方法，其特征在于，所述步骤3中，LSTM深度网络具有β层网络层，该β层网络层中的前β-1层用于对输入的LLD+DSS的融合特征进行训练得到该条融合特征的隐含特征；最后一层为分类器，该分类器判断所述隐含特征所对应的情感种类，也即该条融合特征所对应的情感种类。

5.基于权利要求4所述的方法，其特征在于，所述分类器中的维度个数与共有情感种类的个数θ一致，一个维度对应共有情感种类中的一种情感种类；所述共有情感种类为EMODB 数据集、RAVDESS数据集和Surrey数据集中共有的情感种类。

6.基于权利要求5所述的方法，其特征在于，所述分类器判断隐含特征所对应的情感种类的方法为：分类器将隐含特征映射到(0,1)的区间内，得到θ1个概率，该θ1个概率与θ个共有情感种类一一对应，θ1＝θ；概率最大的情感种类为该隐含特征对应的情感种类。

7.基于权利要求4所述的方法，其特征在于，所述分类器为sofmax分类器。

8.基于权利要求1所述的方法，其特征在于，所述自编码器具有3层神经网络层，分别为输入层、隐含层和输出层，LLD+DSS的融合特征的维度等于输出层神经元的个数。

本文发布于:2024-09-21 15:40:11，感谢您对本站的认可！

本文链接：https://www.17tex.com/tex/3/463386.html

上一篇：一种网络地址资源的利用方法[发明专利]

下一篇：实用新型专利申请书(集成电路)