基于音频频谱特征分析的演唱音明亮度客观评测方法[发明专利]

[19]
中华人民共和国国家知识产权局
[12]发明专利申请公布说明书
[11]公开号CN 101650941A [43]公开日2010年2月17日
[21]申请号200810224790.6[22]申请日2008.12.26
[21]申请号200810224790.6
[71]申请人中国科学院声学研究所
地址100190北京市海淀区北四环西路21号中国
科学院声学研究所
共同申请人北京中科信利技术有限公司
[72]发明人颜永红 潘接林 刘建 李明 曹川 [74]专利代理机构北京法思腾知识产权代理有限公司代理人杨小蓉
[51]Int.CI.G10L 11/00 (2006.01)
权利要求书 2 页 说明书 5 页 附图 1 页
[54]发明名称
基于音频频谱特征分析的演唱音明亮度客观
测方法
[57]摘要
本发明提供一种基于音频频谱特征分析的演唱
音明亮度的客观评测方法,包括如下步骤:1)选
取需要度量音明亮度的演唱片段音频信号;2)对
所选取的演唱片段音频信号进行“演唱/间隙”判
断;3)对步骤2)得到的演唱片段,计算得到三种频
谱特征测度:2K-3KHz能量和、频谱能量总和以及
频率加权的谱能量和;4)根据步骤3)得到的频谱特
征,计算得到最终的客观度量参数指标:平均2K-
3KHz能量比、平均谱重心,利用求出的参数指标对
演唱音的明亮度进行评测。本发明的评测方法,
通过对演唱片段的频谱特征分析,利用计算机算法
给出可以量化的客观评测参数指标,不受其他人为
因素影响,并且具有稳定性、客观性以及便利性等
优点。
200810224790.6权 利 要 求 书第1/2页    1、一种基于音频频谱特征分析的演唱音明亮度的客观评测方法,包括如下步骤:
1)选取需要度量音明亮度的演唱片段音频信号;
2)对上述所选取的演唱片段音频信号进行“演唱/间隙”判断;
3)对上述步骤2)中得到的演唱片段,计算得到三种频谱特征测度:2K-3KHz 能量和、频谱能量总和以及频率加权的谱能量和;
4)根据上述步骤3)中得到的频谱特征,计算得到最终的音明亮度的客观度量参数指标:平均2K-3KHz能量比、平均谱重心,然后利用求出的参数指标对演唱音的明亮度进行评测。
2、如权利要求1所述的基于音频频谱特征分析的演唱音明亮度的客观评测方法,其特征在于,所述步
骤4)中,在利用求出的参数指标对演唱音的明亮度进行评测时,单独基于所述平均2K-3KHz能量比或者平均谱重心进行评价,或者将所述平均2K-3KHz能量比和平均谱重心相结合进行评价。
3、如权利要求1或2所述的基于音频频谱特征分析的演唱音明亮度的客观评测方法,其特征在于,所述步骤2)中的判断方法包括:基于能量的语音活动检测算法以及基于基频检测算法的voice/nonvoice判断机制。
4、如权利要求1或2所述的基于音频频谱特征分析的演唱音明亮度的客观评测方法,其特征在于,
所述步骤3)中各频谱特征测度的计算方法分别为:
1)2K-3KHz能量和:计算公式为
其中,S i(f)为该帧的快速傅立叶变换能量谱;
2)频谱能量总和:计算公式为
E T=∫S i(f)df;
3)频率加权的谱能量和:
用频率值对频谱能量值进行加权,其计算方法为,
200810224790.6权 利 要 求 书 第2/2页    E W=∫f·S i(f)df;
所述步骤4)中根据上述频谱特征计算得到的最终的音明亮度的客观度量参数指标为:
1)平均2K-3KHz能量比R:
对于任何演唱帧,其2K-3KHz能量比的计算公式为,
所述平均2K-3KHz能量比R是该演唱音频信号中所有演唱帧2K-3KHz能量比R i的算术平均值,该平均2K-3KHz能量比R作为演唱音明亮度的一个客观度量时,取值范围为0~1,平均2K-3KHz能量比R越大,则演唱片段音明亮度越高;
2)平均谱重心C:
对于任何演唱帧,其谱重心的计算公式为,
平均谱重心C是该演唱音频信号中所有演唱帧谱重心C i的算术平均值,该平均谱重心C作为演唱音明亮度的另一个客观度量时,取值范围为0~8000,平均谱重心C越大,则演唱片段音明亮度越高;
3)当将上述平均2K-3KHz能量比R和平均谱重心C两个度量指标结合起来对音明亮度进行评测时,将这两种测度进行加权平均后的值作为指标,所述加权的方式采用线性加权或者指数加权。
200810224790.6说 明 书第1/5页基于音频频谱特征分析的演唱音明亮度客观评测方法
技术领域
本发明涉及一种度量演唱音明亮度的客观方法,更具体地说,本发明涉及一种基于音频频谱特征分析的演唱音明亮度的客观评测方法。
背景技术
音明亮度是指一种用于评价唱歌者演唱水平的主观指标,一般定义为对唱歌者歌声的一种明亮、高昂、温暖的主观感知。主观评价人感觉唱歌者的歌声越明亮、高昂,则认为唱歌者的演唱音明亮度越高,反之,则认为演唱音明亮度越低。这里的主观评价人,一般指的是声乐专家,比如声乐老师和资
深音乐家。而唱歌者可以是专业的歌手、声乐系学生,也可以是普通人。
目前,演唱评价基本还是处于完全依靠专家主观评价的阶段,并没有成熟的客观评价系统能够对演唱水平或演唱水平的某个方面进行度量和评价。演唱音明亮程度的评价也完全依赖专家的主观感知,目前还没有客观度量的方法或者辅助主观评价的客观指标。虽然国外一些研究调查发现音明亮度的评价和频谱能量分布、共振峰位置、能量等有关,但是并没有具体的、定义明确的客观度量方法出现。例如,文献1提出音明亮度与频谱能量分布有关,但是并没有给出具体的计算方法。另外,演唱水平的评价与旋律音高的准确性相关,演唱者音高的提取,我们采用了参考文献2中提出的方法,该方法通过求取每帧数据频谱谐波和最大值对应的基频作为每帧的音高值。这里,需要说明的是,该方法得到的音高值仅仅作为计算音的一个基本参数值,与本专利的独特性无关。
另外,主观演唱评价方法不可避免的具有以下几个缺点:第一,不可重复性。因为各种各样因素的影响,对于同样一个演唱片段,两次主观评价之间或多或少的都会出现差异,而这种差异在理想情况下是不应该存在的。第二,主观偏向性。因为每个评价人都有各自不同的喜好,所以对于同一个演唱片段,每个评价人都有各自不同的评价,都有各自的偏向性。第三,费用昂贵,可获得性差。对于一般的普通人来说(不是专业的声乐学校的学生),要获得声乐专家的主观评价,是很困难的或费用高昂的。
参考文献1:E.Ekholm,G.Papagiannis,and F.Chagnon,“Relating Objective
200810224790.6说 明 书 第2/5页Measurements to Expert Evaluation of Voice Quality in Western Classical Singing:Critical Perceptual Parameters,”Journal of Voice,vol.12,no.2,pp.182-196,1998.    参考文献2:C.Cao,M.Li,J.Liu,and Y.Yan,“Singing Melody Extraction in Polyphonic Music by Harmonic Tracking,”Proc.8th International Conference on Music Information Retrieval(ISMIR),pp.373-374,2007.
发明内容
因此,鉴于上述现状,本发明的目的在于提供一种基于音频频谱特征分析的演唱音明亮度的客观评测方法,通过对演唱片段的频谱特征分析,给出可以量化的客观评测参数指标。
为实现上述发明目的,本发明提供的基于音频频谱特征分析的演唱音明亮度的客观评测方法,包括如下步骤:
1)选取需要度量音明亮度的演唱片段音频信号;
2)对上述所选取的演唱片段音频信号进行“演唱/间隙”判断;
3)对上述步骤2)中得到的演唱片段,计算得到三种频谱特征测度:2K-3K H z 能量和、频谱能量总和以及频率加权的谱能量和;
4)根据上述步骤3)中得到的频谱特征,计算得到最终的音明亮度的客观度量参数指标:平均2K-3K H z能量比、平均谱重心,然后利用求出的参数指标对演唱音的明亮度进行评测。
其中,上述步骤4)中,在利用求出的参数指标对演唱音的明亮度进行评测时,可以单独基于所述平均2K-3K H z能量比或者平均谱重心进行评价,也可以将所述平均2K-3KHz能量比和平均谱重心相结合来进行评价。
另外,所述步骤2)中的判断方法包括:基于能量的语音活动检测算法以及基于基频检测算法的voice/nonvoice判断机制。
与现有的主观评价的方法相比,本发明提及的两种客观度量方法具有以下优点:稳定性、客观性、便利性。由于是基于音频信号频谱特征的客观评价方法,只要输入的演唱音频信号一致,则度量结果保持不变,不受其他人为因素影响。同时,计算机算法的便利程度较声乐专家主观评价的方式有很大改进,只需将录制的演唱片段输入,算法即可以给出客观度量参数。

本文发布于:2024-09-20 15:37:04,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/777190.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:演唱   音色   频谱   客观   评价   方法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议