演奏效果评估方法、装置、电子设备及存储介质与流程



1.本技术涉及数据处理领域,具体而言,涉及一种演奏效果评估方法、演奏效果评估装置、电子设备及计算机可读存储介质。


背景技术:



2.目前,在实现对演奏员参照曲谱进行演奏的演奏效果进行评估时,通常是通过专业人员旁听,并对照曲谱,从而发现演奏员演奏过程中存在的多弹、漏弹、错弹等各种错误情况。
3.但是,该方式一方面需要依赖于专业人员的专业水平,在专业人员水平有限的情况下,会出现错误评价或漏评等情况。而另一方面,该方式需要依赖于专业人员进行评价,在没有专业人员场景中,无法对演奏效果进行评估,应用场景受限。
4.为解决上述问题,目前业内通常采用将演奏员演奏的音频输入至预先训练好的识别模型(例如分类模型)中,通过识别模型识别出演奏员演奏过程中的音符序列或琴键序列,进而将识别出的音符序列或琴键序列,与曲谱对应的标准音符序列或琴键序列进行对比,实现对于演奏效果的评估。
5.但是,识别模型具有误差,在识别过程中,受识别模型精度的影响,可能会出现将输入的音频识别为错误的音符或琴键的情况,从而影响演奏效果的评估准确性。


技术实现要素:



6.有鉴于此,本技术实施例的目的在于提供一种演奏效果评估方法,用以提高评估演奏音频效果的准确性。
7.第一方面,本技术提供一种演奏效果评估方法,所述方法包括:获取待评价音频对应的音符序列;所述音符序列为对所述待评价音频中的每一个音频信号进行识别后,得到的由各所述音频信号对应识别出的音符构成的序列;采用隐马尔可夫模型对所述音符序列进行处理,得到所述音符序列对应的目标音簇序列;所述目标音簇序列为所述音符序列在标准曲谱中最大概率对应的音簇序列;将所述目标音簇序列与所述标准曲谱的标准音簇序列进行比对,得到所述待评价音频的评价结果;所述标准音簇序列为按照演奏顺序对所述标准曲谱进行划分后得到的音簇序列。
8.在上述实现过程中,通过获取待评价音频对应的音符序列,采用隐马尔可夫模型对音符序列进行处理,从而将音符序列转换为音符序列对应的目标音簇序列。这样,可以通过隐马尔可夫模型将准确性较低的音符序列转换为准确率较高的音符序列对应的目标音簇序列。这样,将目标音簇序列与标准曲谱的标准音簇序列进行对比,最终得到的待评价音频的评价效果,相比于直接以音符序列与标准曲谱中的音符序列进行比较的方案而言,对比结果的可靠性更高,提高了评估演奏音频效果的准确性。
9.一实施例中,所述隐马尔可夫模型包括:各音簇对应的初始状态概率pi,用于表征音簇i为演奏时的第一个音簇的概率;音簇转移概率tr[i][j],用于表征演奏过程中,从音
簇i跳转至音簇j的概率;音簇表现转移概率b[i][k],用于表征音簇i表现为音符k的概率。
[0010]
在上述实现过程中,通过对隐马尔可夫模型设置各音簇对应的初始状态概率、音簇转移概率及音簇表现转移概率,并设定各音簇对应的初始状态概率pi,用于表征音簇i为演奏时的第一个音簇的概率;音簇转移概率tr[i][j],用于表征演奏过程中,从音簇i跳转至音簇j的概率;音簇表现转移概率b[i][k],用于表征音簇i表现为音符k的概率。这就使得隐马尔可夫模型可以根据音簇对应的初始状态概率、音簇转移概率及音簇表现转移概率,将音符序列转换为目标音簇序列,保证方案的执行。
[0011]
一实施例中,所述采用隐马尔可夫模型对所述音符序列进行处理,得到所述音符序列对应的目标音簇序列,包括:根据所述pi、所述tr[i][j]和所述b[i][k],确定所述音符序列对应的各音簇序列,以及各所述音簇序列对应的概率值;确定所述概率值最大的音簇序列;所述概率值最大的音簇序列为所述目标音簇序列。
[0012]
在上述实现过程中,通过初始状态概率pi、音簇转移概率tr[i][j]及音簇表现转移概率b[i][k],确定音符序列对应的各音簇序列及各音簇序列对应的概率值,进而根据各音符序列转换得到音簇序列的概率值选择概率值最大的音簇序列,通过将概率值最大的音簇序列设置为目标音簇序列,在一定程度上提高识别演奏曲的准确性。
[0013]
一实施例中,所述标准曲谱中每一小节的第一个音簇对应的初始状态概率为第一概率值;所述标准曲谱中,除每一小节的第一个音簇外的其他音簇对应的初始状态概率为第二概率值;所述第一概率值大于所述第二概率值。
[0014]
在上述实现过程中,考虑到在实际应用过程中,演奏者通常是从一个小节的第一个音簇开始演奏的,从小节的其他部分开始演奏的概率较小。因此,通过将标准曲谱中每一小节的第一个音簇对应的初始状态概率设定为第一概率值,除每一小节的第一个音簇外的其他音簇对应的初始状态概率设定为第二概率值,并设置第一概率值大于第二概率值,这样就可以使得对于各音簇的初始状态概率的设定更符合用户的实际演奏情况,从而使得最终确定出的目标音簇序列更贴合实际演奏情况,使得演奏音频效果的评估结果更准确。
[0015]
一实施例中,所述音簇转移概率中的tr[i][i]为第三概率值;所述第三概率值根据音簇i中的音符数量确定;所述tr[i][i]用于表征演奏过程中,从音簇i跳转至音簇i的概率。
[0016]
在上述实现过程中,考虑到在实际应用过程中,演奏者在进行演奏时演奏的簇中包含的音符数量越多,则重复演奏相同的音簇的概率越大。因此,通过将音簇转移概率中的tr[i][i]设定为第三概率值,并根据音簇i中的音符数量确定第三概率值的大小,这样就可以使得演奏过程中,各音簇的转移概率的设定更符合用户的实际演奏情况,从而使得演奏音频效果的评估结果更准确。
[0017]
一实施例中,所述音簇转移概率中的tr[i][i+1]为第四概率值;所述tr[i][i+1]用于表征演奏过程中,从音簇i跳转至音簇i+1的概率;所述第四概率值大于除所述tr[i][i]之外的其他音簇转移概率的值。
[0018]
在上述实现过程中,考虑到在实际应用过程中,演奏者通常是按照标准曲谱中音簇的顺序,即从当前音簇跳转到下一个音簇的顺序进行演奏。但在实际演奏过程中,按照曲谱中音簇的顺序进行演奏的概率与重复演奏相同音簇的概率的大小关系并不确定。因此,通过将音簇转移概率中的tr[i][i+1]设定为第四概率值,并设置第四概率值大于除音簇转
移概率中的tr[i][i]之外的其他音簇转移概率值,从而使得最终确定出的目标音簇序列更贴合实际演奏情况,从而使得演奏音频效果的评估结果更准确。
[0019]
一实施例中,所述音簇转移概率中的tr[i][i+n]为第五概率值,其中,n为大于等于2的整数;所述tr[i][i+n]用于表征演奏过程中,从音簇i跳转至音簇i+n的概率;所述第五概率值小于所述tr[i][i+1]。
[0020]
在上述实现过程中,考虑到在实际应用过程中,演奏者通常是按照标准曲谱中音簇的顺序进行演奏,而跳着音簇顺序进行演奏的概率较低。因此,通过将音簇转移概率中的tr[i][i+n]设定为第五概率值,n为大于等于2的整数,并设置第五概率值小于tr[i][i+1],从而使得最终确定出的目标音簇序列更贴合实际演奏情况,从而使得演奏音频效果的评估结果更准确。
[0021]
一实施例中,所述n越大,所述第五概率值越小。
[0022]
在上述实现过程中,考虑到在实际应用过程中,演奏者通常是按照标准曲谱中音簇的顺序进行演奏,而两个音簇间隔越大时,演奏者连续演奏这两个音簇的概率越小。因此,通过设定当n越大时,可以设置第五概率值越小,从而使得最终确定出的目标音簇序列更贴合实际演奏情况,从而使得演奏音频效果的评估结果更准确。
[0023]
一实施例中,所述音簇序列中的每个音簇表征所述标准曲谱中在同一时刻演奏的音符组合;针对所述标准音簇序列中的任一音簇:该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第一目标音符的音簇表现转移概率,大于除所述第一目标音符对应的音簇表现转移概率外的其他音簇表现转移概率;所述第一目标音符为该音簇所具有的音符。
[0024]
在上述实现过程中,考虑到在实际应用过程中,演奏者演奏的每个音符组合都有一定概率表现为当前的音簇,而演奏该音簇本身具有的音符组合概率是最高,因此通过针对标准音簇序列中的任一音簇,设置该音簇对应的所有音簇表现转移概率中,表征该音簇表现为该音簇所具有的音符的音簇表现转移概率大于除第一目标音符对应的音簇表现转移概率外的其他音簇表现转移概率,这样就可以使得对于各音簇的表现转移概率的设定更符合用户的实际演奏情况,从而使得最终确定出的目标音簇序列更贴合实际演奏情况,从而使得演奏音频效果的评估结果更准确。
[0025]
一实施例中,针对所述标准音簇序列中的任一音簇:该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第二目标音符的音簇表现转移概率,大于除所述第一目标音符和所述第二目标音符对应的音簇表现转移概率外的其他音簇表现转移概率;所述第二目标音符为比所述第一目标音符高一级或低一级的音符。
[0026]
在上述实现过程中,考虑到在实际应用过程中,演奏者演奏当前音簇本身具有的音符时,容易误演奏为比当前音簇本身具有的音符高一级或低一级的音符。因此,通过针对标准音簇序列中的任一音簇,设定该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第二目标音符的音簇表现转移概率,大于除第一目标音符和所述第二目标音符对应的音簇表现转移概率,这样就可以使得对于各音簇的表现转移概率的设定更符合用户的实际演奏情况,从而使得最终确定出的目标音簇序列更贴合实际演奏情况,从而使得演奏音频效果的评估结果更准确。
[0027]
一实施例中,针对所述标准音簇序列中的任一音簇:该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第三目标音符的音簇表现转移概率,大于除所述第一目标
音符、所述第二目标音符和所述第三目标音符对应的音簇表现转移概率外的其他音簇表现转移概率,所述第三目标音符为比所述第一目标音符高八度或低八度的音符。
[0028]
在上述实现过程中,考虑到在实际应用过程中,演奏者演奏当前音簇本身具有的音符时,也比较容易误演奏为比当前音簇本身具有的音符高八度或低八度的音符。因此,通过针对标准音簇序列中的任一音簇,设定该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第三目标音符的音簇表现转移概率,大于除第一目标音符、第二目标音符和第三目标音符对应的音簇表现转移概率外的其他音簇表现转移概率,第三目标音符为比第一目标音符高八度或低八度的音符,这样就可以使得对于各音簇的表现转移概率的设定更符合用户的实际演奏情况,从而使得最终确定出的目标音簇序列更贴合实际演奏情况,从而使得演奏音频效果的评估结果更准确。
[0029]
第二方面,本技术提供一种演奏效果评估装置,所述装置包括:获取模块,用于获取待评价音频对应的音符序列;所述音符序列为对所述待评价音频中的每一个音频信号进行识别后,得到的由各所述音频信号对应识别出的音符构成的序列;处理模块,用于采用隐马尔可夫模型对所述音符序列进行处理,得到所述音符序列对应的目标音簇序列;所述目标音簇序列为所述音符序列在标准曲谱中最大概率对应的音簇序列;所述音簇序列中的每个音簇表征所述标准曲谱中在同一时刻演奏的音符组合;评价模块,用于将所述目标音簇序列与所述标准曲谱的标准音簇序列进行比对,得到所述待评价音频的评价结果;所述标准音簇序列为按照演奏顺序对所述标准曲谱进行划分后得到的音簇序列。
[0030]
第三方面,本技术提供一种电子设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述演奏效果评估方法或实现上述演奏效果评估装置的功能。
[0031]
第四方面,本技术提供一种存储有计算机可读指令的非易失性可读存储介质,所述计算机可读指令被处理器执行时,使得所述处理器执行上述演奏效果评估方法或实现上述演奏效果评估装置的功能。
[0032]
本技术的一个或多个实施例的细节在下面的附图和描述中提出。本技术的其它特征、目的和优点将从说明书、附图以及权利要求书变得明显。
附图说明
[0033]
为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0034]
图1为本技术实施例提供的一种演奏效果评估方法的流程示意图;
[0035]
图2为本技术实施例提供的一种音簇表现转移概率的示意图;
[0036]
图3为本技术实施例提供的一种演奏效果评估装置的结构示意图;
[0037]
图4为本技术实施例提供的一种电子设备的结构示意图。
[0038]
图标:演奏效果评估装置100;获取模块101;处理模块102;评价模块103。
具体实施方式
[0039]
为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
[0040]
实施例一:
[0041]
为了提高评估演奏音频效果的准确性,本技术实施例中提供了一种演奏效果评估方法。可以参见图1所示,图1为本技术实施例提供的一种演奏效果评估方法的流程示意图,包括:
[0042]
s11:获取待评价音频对应的音符序列。
[0043]
在本技术实施例中,所述音符序列可以为对待评价音频中的每一个音频信号进行识别后,得到的由各音频信号对应识别出的音符构成的序列。
[0044]
示例性地,待评价音频可以为预先或实时采集到的演奏者演奏的音频数据,例如可以为钢琴演奏曲。
[0045]
在本技术实施例中,待评价音频可以为wav、mp3、flac等格式,但不作为限制。
[0046]
可选的,可以通过预设的识别模型,例如卷积神经网络(cnn)模型、长短期记忆网络(lstm)模型等对待评价音频进行处理,获取该待评价音频对应的音符序列。
[0047]
需要说明的是,利用预设的识别模型获得音符序列的过程是本领域技术人员所熟知的,此处不再赘述。
[0048]
需要说明的是,在本技术实施例中,音符序列中的各音符可以是指传统意义上的,可以通过五线谱等形式体现出的音符,此外音符序列中的各音符也可以是指的与传统意义上的音符所对应的琴键。这是由于,在实际演奏过程中,演奏的音符与乐器的琴键之间往往存在一一对应关系,因此无论是直接由音符构成的音符序列,还是由琴键构成的琴键序列,其本质都是反映的音符集合,因此在本技术实施例中被统称为音符序列。
[0049]
s12:采用隐马尔可夫模型对音符序列进行处理,得到音符序列对应的目标音簇序列。
[0050]
应理解,目标音簇序列是指音符序列在标准曲谱中最大概率对应的音簇序列。
[0051]
音簇序列由多个音簇构成,在标准曲谱中,同一时刻演奏的音符组合,可以划分为音簇序列中的一个音簇。
[0052]
所谓标准曲谱,是指待评价音频对应的曲谱,例如用户演奏的是《两只猴子》这一钢琴曲,则《两只猴子》的曲谱即为标准曲谱。
[0053]
而标准曲谱可以为音乐扩展标记语言(music extensible markup language,musicxml)格式、乐器数字接口(musical instrument digital interface,midi)格式等音乐格式的文件,但不作为限制。
[0054]
可以理解,音乐扩展标记语言格式是一个基于可扩展标记语言(extensible markup language,xml)的音乐符号文件的开放格式,用于进行音乐交换和音乐分发,而乐器数字接口格式包含音符、控制参数等指令。
[0055]
需要注意的是,标准曲谱中包括音符、各琴键的演奏时刻等信息,从而可以便于后续进行音簇划分。
[0056]
还应理解,在实际应用过程中,用户可以通过在设备上选择需学习或演奏的曲子,
从而使得设备得以根据用户的选择确定标准曲谱。
[0057]
此外,考虑到用户可能仅选择学习或演奏一首曲子的一个部分,则设备可以根据该曲子的曲谱,截取出用户所选择的那一部分对应的曲谱,生成标准曲谱。
[0058]
此外,可选的,本技术实施例中设备也可以是通过对待评价音频进行曲名识别,从而识别出待评价音频对应的曲名,进而基于曲名确定出标准曲谱。而对待评价音频进行曲名识别的方式,可以采用现在已有的各种识别技术(例如现有的各种听歌识曲的技术)实现,但不作为限制。
[0059]
在本技术实施例中,标准曲谱可以是预先通过musicxml文件、midi文件等格式的文件加载到设备中的,但是也可以是在进行验证效果评估之前,才通过musicxml文件、midi文件等格式的文件加载到设备中。
[0060]
可选的,可以根据标准曲谱对隐马尔可夫模型进行设置。
[0061]
在本技术实施例中,隐马尔可夫模型可以包括各音簇对应的初始状态概率pi、音簇转移概率tr[i][j]及音簇表现转移概率b[i][k]。
[0062]
初始状态概率pi可以用于表征音簇i为演奏时的第一个音簇的概率。音簇转移概率tr[i][j]可以用于表征演奏过程中,从音簇i跳转至音簇j的概率。音簇表现转移概率b[i][k]可以用于表征音簇i表现为音符k的概率。
[0063]
可以理解,通过对隐马尔可夫模型设置各音簇对应的初始状态概率、音簇转移概率及音簇表现转移概率,并设定各音簇对应的初始状态概率pi,用于表征音簇i为演奏时的第一个音簇的概率;音簇转移概率tr[i][j],用于表征演奏过程中,从音簇i跳转至音簇j的概率;音簇表现转移概率b[i][k],用于表征音簇i表现为音符k的概率。这就使得隐马尔可夫模型可以根据音簇对应的初始状态概率、音簇转移概率及音簇表现转移概率,将音符序列转换为目标音簇序列,保证方案的执行。
[0064]
在本技术实施例中,可以根据初始状态概率pi、音簇转移概率tr[i][j]和音簇表现转移概率b[i][k],确定音符序列对应的各音簇序列,以及各音簇序列对应的概率值,确定概率值最大的音簇序列,概率值最大的音簇序列为目标音簇序列。
[0065]
在本技术实施例中,根据初始状态概率pi、音簇转移概率tr[i][j]和音簇表现转移概率b[i][k],确定音符序列对应的各音簇序列,以及各音簇序列对应的概率值,确定概率值最大的音簇序列,概率值最大的音簇序列为目标音簇序列的过程具体可以是:
[0066]
针对音符序列的中第一个音符,根据各音簇对应的初始状态概率pi和该音符对应的各音簇表现转移概率,计算出该音符直接演奏各音簇的概率。
[0067]
示例性的,假设音符序列的中第一个音符为音符1,则有:
[0068]
p(音符1对应音簇i)=p(i)
×
b[i][1]
[0069]
p(i)为音簇i对应的初始状态概率,b[i][1]为音簇i表现为音符1的音簇表现转移概率。
[0070]
获得并记录所有p(音符1对应音簇n的概率)以及对应音符1对应音簇n的情况。
[0071]
以音符数量为3,依次为音符1、音符2和音符3,音簇数量为2,依次为音簇1和音簇2的情况为例,则针对音符1,需要计算p(音符1对应音簇1)和p(音符1对应音簇2):
[0072]
p(音符1对应音簇1)=p(1)
×
b[1][1]。
[0073]
其中,p(1)为音簇1对应的初始状态概率,b[1][1]为音簇1表现为音符1的音簇表
现转移概率。
[0074]
p(音符1对应音簇2)=p(2)
×
b[2][1]。
[0075]
其中,p(2)为音簇2对应的初始状态概率,b[2][1]为音簇2表现为音符1的音簇表现转移概率。
[0076]
针对音符序列的中除第一个音符以外的其他音符,则针对每一个音簇,可以根据该音簇对应的各音簇转移概率和该音符对应的各音簇表现转移概率计算出该音符从各音簇跳转至该音簇的跳转概率,并根据该音簇对应的初始状态概率pi、该音符对应的各音簇表现转移概率及该音符对应各音簇的概率,计算出该音符为重新直接演奏的音符时,对应该音簇的直接演奏概率,并从该音簇的跳转概率和直接演奏概率选择出最大概率,作为该音符对应该音簇的概率:
[0077]
示例性的,假设当前计算的为音符序列的中第k个音符,为音符k,则有:
[0078]
针对音簇j:
[0079]
依次计算从音簇i(i依次取1至i,i为音簇总数)跳转到音簇j的概率,如下:
[0080]
p(kij)=p(音符k-1对应音簇n)
×
tr[n][k]
×
b[j][k]。
[0081]
p(kij)为针对音符k时,从音簇i跳转到音簇j的概率,tr[i][j]为从音簇i跳转至音簇j的音簇转移概率,b[j][k]为音簇j表现为音符k的音簇表现转移概率。
[0082]
计算从音簇i(i依次取1至i,i为音簇总数)直接演奏音簇j的概率,如下:
[0083]
p(dir_kij)=p(音符k-1对应音簇i)
×
p(j)/n
×
b[j][k]
[0084]
p(dir_kij)为针对音符k时,从音簇i直接演奏音簇j的概率,p(j)为音簇j的初始状态概率,n为音簇的总数,b[j][k]为音簇j表现为音符k的音簇表现转移概率。
[0085]
从所有的p(kij)和p(dir_kij)中,选出最大的概率进行记录,并记录该概率对应的音簇变化路径。
[0086]
针对每一个音簇,均进行上述过程,从而得到音符k对应每一个音簇的概率,以及该概率对应的音簇变化路径。
[0087]
例如,仍音符数量为3,依次为音符1、音符2和音符3,音簇数量为2,依次为音簇1和音簇2的情况为例:
[0088]
针对音符1,则按照前文记载,得到p(音符1对应音簇1)和p(音符1对应音簇2)。
[0089]
针对音符2:
[0090]
首先计算音符2对应音簇1的概率:
[0091]
从音簇1跳转到音簇1:p(211)=p(音符1对应音簇1)
×
tr[1][1]
×
b[1][2]。
[0092]
从音簇2跳转到音簇1:p(221)=p(音符1对应音簇2)
×
tr[2][1]
×
b[1][2]。
[0093]
从音簇1直接演奏音簇1:p(dir_211)=p(音符1对应音簇1)
×
p(1)/2
×
b[1][2]。
[0094]
从音簇2直接演奏音簇1:p(dir_221)=p(音符1对应音簇2)
×
p(1)/2
×
b[1][2]。
[0095]
假设上述音符2对应音簇1的情况中,p(dir_211)的概率值最大,则记录p(dir_211)为音符2对应音簇1的概率,并记录p(dir_211)对应从音簇1直接演奏音簇1。
[0096]
然后,计算音符2对应音簇2的概率:
[0097]
从音簇1跳转到音簇2:p(212)=p(音符1对应音簇1)
×
tr[1][2]
×
b[2][2]。
[0098]
从音簇2跳转到音簇2:p(222)=p(音符1对应音簇2)
×
tr[2][2]
×
b[2][2]。
[0099]
从音簇1直接演奏音簇2:p(dir_212)=p(音符1对应音簇1)
×
p(2)/2
×
b[2][2]。
[0100]
从音簇2直接演奏音簇2:p(dir_222)=p(音符1对应音簇2)
×
p(2)/2
×
b[2][2]。
[0101]
假设上述音符2对应音簇2的情况中,p(222)的概率值最大,则记录p(222)为音符2对应音簇2的概率,并记录p(222)对应从音簇2跳转到音簇2。
[0102]
针对音符3:
[0103]
首先计算音符3对应音簇1的概率:
[0104]
从音簇1跳转到音簇1:p(311)=p(音符2对应音簇1)
×
tr[1][1]
×
b[1][3]
[0105]
从音簇2跳转到音簇1:p(321)=p(音符2对应音簇2)
×
tr[2][1]
×
b[1][3]
[0106]
从音簇1直接演奏音簇1:p(dir_311)=p(音符2对应音簇1)
×
p(1)/2
×
b[1][3]
[0107]
从音簇2直接演奏音簇1:p(dir_321)=p(音符2对应音簇2)
×
p(1)/2
×
b[1][3]
[0108]
假设上述音符3对应音簇1的情况中,p(321)的概率值最大,则记录p(321)为音符3对应音簇1的概率,并记录p(321)对应从音簇2跳转到音簇1。
[0109]
然后计算音符3对应音簇2的概率:
[0110]
从音簇1跳转到音簇2:p(312)=p(音符2对应音簇1)
×
tr[1][2]
×
b[2][3]
[0111]
从音簇2跳转到音簇2:p(322)=p(音符2对应音簇2)
×
tr[2][2]
×
b[2][3]
[0112]
从音簇1直接演奏音簇2:p(dir_312)=p(音符2对应音簇1)
×
p(2)/2
×
b[2][3]
[0113]
从音簇2直接演奏音簇2:p(dir_322)=p(音符2对应音簇2)
×
p(2)/2
×
b[2][3]
[0114]
假设上述音符3对应音簇2的情况中,p(312)的概率值最大,则记录p(312)为音符3对应音簇2的概率,并记录p(312)对应从音簇1跳转到音簇2。
[0115]
由于音符3为该音符序列的最后一个音符,因此,得到音符3对应每一个音簇的概率,以及该概率对应的音簇变化路径后,概率计算结束。此时可以根据音符序列中的最后一个音符对应每一个音簇的概率,选择出最大概率,并基于该最大概率对应的音簇变化路径,逆推得到整个音符序列对应的目标音簇序列。
[0116]
示例性的,以前文示例过程为例,假设在获取到的p(321)和p(312)中,p(312)最大,则可以由音符3对应的音簇情况向音符1反推,可以确定目标音簇序列为音簇1(直接)-音簇1-音簇2。
[0117]
具体地,在p(312)为最大的概率值时,表征音簇1跳转到音簇2,可以确定音符2对应音簇1,音符3对应音簇2,再根据之前获取的音符2对应音簇1的情况中,p(dir_211)的概率值最大,确定音符1直接演奏音簇1,即,音符1对应音簇1,最终确定目标音簇序列为音簇1(直接)-音簇1-音簇2,音簇1(直接)表征直接从音簇1开始演奏。
[0118]
可以理解,音符数量为3及音簇数量为2仅为示例性说明,对于更多音符数量以及音簇数量的应用参照上文,本技术对于音符数量以及音簇数量并不限制。
[0119]
考虑到实际应用时,音簇数量较多,计算每个音符对应音簇时,可以选择仅对从当前音簇的之前x(例如为3)个音簇跳转到当前音簇,从当前音簇跳转到当前音簇,以及当前音簇的后面y(例如为2)个音簇到当前音簇的情况进行计算,以减少计算量,提高演奏效果评估的效率。
[0120]
可以理解,通过初始状态概率pi、音簇转移概率tr[i][j]及音簇表现转移概率b[i][k],确定音符序列对应的各音簇序列及各音簇序列对应的概率值,进而根据各音符序列转换得到音簇序列的概率值选择概率值最大的音簇序列,通过将概率值最大的音簇序列设置为目标音簇序列,在一定程度上提高识别演奏曲的准确性。
[0121]
在本技术实施例中,在标准曲谱中,可以将每一小节的第一个音簇对应的初始状态概率设为第一概率值,将除每一小节的第一个音簇外的其他音簇对应的初始状态概率设为第二概率值,并设置第一概率值大于第二概率值。
[0122]
可以理解,考虑到在实际应用过程中,演奏者通常是从一个小节的第一个音簇开始演奏的,从而小节的其他部分开始演奏的概率较小。因此,通过将标准曲谱中每一小节的第一个音簇对应的初始状态概率设定为第一概率值,除每一小节的第一个音簇外的其他音簇对应的初始状态概率设定为第二概率值,并设置第一概率值大于第二概率值。这样就可以使得对于各音簇的初始状态概率的设定更符合用户的实际演奏情况,从而使得最终确定出的目标音簇序列更贴合实际演奏情况,从而使得演奏音频效果的评估结果更准确。
[0123]
可选的,在进行各簇的初始状态概率的设置时,可以将各簇的初始状态用一维数组p表示,一维数组p中的各元素表征各簇的初始状态概率的权重值。先初始化设置一维数组p中的各元素的初始状态概率权重值为a,确保各个元素概率权重值不为0,再设置一维数组中表征每一小节的第一个音簇的元素的初始状态概率权重值为b,b大于a。接着将一维数组p中的元素对应的权重值转化为概率值(例如可以对一维数组p进行归一化处理),使得一维数组p中的各元素的初始状态概率值总和为1。
[0124]
可选的,为了防止后续使用初始状态概率值进行连续相乘时计算的下溢,可以将一维数组p中的各元素的初始状态概率值,分别转换为对数,从而便于后续进行概率计算。
[0125]
示例性地,a可以设置为1,b可以设置为2。
[0126]
一实施例中,音簇转移概率中的tr[i][i]可以为第三概率值,第三概率值根据音簇i中的音符数量确定,tr[i][i]用于表征演奏过程中,从音簇i跳转至音簇i的概率。
[0127]
可以理解,考虑到在实际应用过程中,演奏者在进行演奏时演奏的簇中包含的音符数量越多,则重复演奏相同的音簇的概率越大。因此,通过将音簇转移概率中的tr[i][i]设定为第三概率值,并根据音簇i中的音符数量确定第三概率值的大小,这样就可以使得演奏过程中,各音簇的转移概率的设定更符合用户的实际演奏情况,从而使得演奏音频效果的评估结果更准确。
[0128]
进一步地,音簇转移概率中的tr[i][i+1]可以为第四概率值,tr[i][i+1]用于表征演奏过程中,从音簇i跳转至音簇i+1的概率;第四概率值大于除tr[i][i]之外的其他音簇转移概率的值。
[0129]
具体地,音簇转移概率可以用n
×
n的矩阵trn×n表示,其中,n表示标准曲谱中的音簇数量,trn×n中元素tr[i][j]表征从音簇i跳转至音簇j的转移概率。首先,初始化矩阵trn×n中的所有元素的转移概率的权重值为a1,确保所有元素的状态转移概率不为0,其次,设置tr[i][i]的转移概率的权重值为c1,c1大小可以根据音簇i中的音符数量设定,当音簇i中的音符数量越多时,c1越大,再设置tr[i][i+1]的转移概率的权重值为b1,其中,b1大于a1。最后,将矩阵trn×n中的所有元素对应的权重值转化为概率值,使得矩阵trn×n中的各元素的转移概率值总和为1,再将矩阵trn×n中各元素的转移概率值分别转换为对数,以方便后续的计算。
[0130]
示例性地,a1可以为0.01,b1可以为0.1。
[0131]
需要说明的是,本实施例中对于第四概率值与tr[i][i]的大小关系并不限定,可以根据实际应用场景确定第四概率值与tr[i][i]的大小关系,在此不再过多赘述。
[0132]
可以理解,考虑到在实际应用过程中,演奏者通常是按照标准曲谱中音簇的顺序,即从当前音簇跳转到下一个音簇的顺序进行演奏,但在实际演奏过程中按照曲谱中音簇的顺序进行演奏的概率与重复演奏相同音簇的概率的大小关系并不确定。因此,通过将音簇转移概率中的tr[i][i+1]设定为第四概率值,并设置第四概率值大于除音簇转移概率中的tr[i][i]之外的其他音簇转移概率值,从而使得最终确定出的目标音簇序列更贴合实际演奏情况,从而使得演奏音频效果的评估结果更准确。
[0133]
一实施例中,音簇转移概率中的tr[i][i+n]可以为第五概率值,其中,n为大于等于2的整数;tr[i][i+n]用于表征演奏过程中,从音簇i跳转至音簇i+n的概率;第五概率值小于tr[i][i+1]。
[0134]
可以理解,考虑到在实际应用过程中,演奏者通常是按照标准曲谱中音簇的顺序进行演奏,而跳着音簇顺序进行演奏的概率较低。因此,通过将音簇转移概率中的tr[i][i+n]设定为第五概率值,n为大于等于2的整数,并设置第五概率值小于tr[i][i+1],从而使得最终确定出的目标音簇序列更贴合实际演奏情况,从而使得演奏音频效果的评估结果更准确。
[0135]
一实施例中,当n越大时,可以设置第五概率值越小。
[0136]
可以理解,考虑到在实际应用过程中,演奏者通常是按照标准曲谱中音簇的顺序进行演奏,而两个音簇间隔越大时,演奏者连续演奏这两个音簇的概率越小。因此,通过设定当n越大时,可以设置第五概率值越小,从而使得最终确定出的目标音簇序列更贴合实际演奏情况,从而使得演奏音频效果的评估结果更准确。
[0137]
一实施例中,针对标准音簇序列中的任一音簇:该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第一目标音符的音簇表现转移概率,大于除第一目标音符对应的音簇表现转移概率外的其他音簇表现转移概率,第一目标音符为该音簇所具有的音符。
[0138]
可以理解,考虑到在实际应用过程中,演奏者演奏的每个音符组合都有一定概率表现为当前的音簇,而演奏该音簇本身具有的音符组合概率是最高,因此通过针对标准音簇序列中的任一音簇,设置该音簇对应的所有音簇表现转移概率中,表征该音簇表现为该音簇所具有的音符的音簇表现转移概率大于除第一目标音符对应的音簇表现转移概率外的其他音簇表现转移概率,这样就可以使得对于各音簇的表现转移概率的设定更符合用户的实际演奏情况,从而使得最终确定出的目标音簇序列更贴合实际演奏情况,从而使得演奏音频效果的评估结果更准确。
[0139]
一实施例中,针对所述标准音簇序列中的任一音簇:该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第二目标音符的音簇表现转移概率,大于除所述第一目标音符和所述第二目标音符对应的音簇表现转移概率外的其他音簇表现转移概率;所述第二目标音符为比所述第一目标音符高一级或低一级的音符。
[0140]
可以理解,考虑到在实际应用过程中,演奏者演奏当前音簇本身具有的音符时,容易误演奏为比当前音簇本身具有的音符高一级或低一级的音符。因此,通过针对标准音簇序列中的任一音簇,设定该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第二目标音符的音簇表现转移概率,大于除第一目标音符和所述第二目标音符对应的音簇表现转移概率。这样就可以使得对于各音簇的表现转移概率的设定更符合用户的实际演奏情况,从而使得最终确定出的目标音簇序列更贴合实际演奏情况,从而使得演奏音频效果的
评估结果更准确。
[0141]
一实施例中,针对标准音簇序列中的任一音簇:该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第三目标音符的音簇表现转移概率,大于除第一目标音符、第二目标音符和第三目标音符对应的音簇表现转移概率外的其他音簇表现转移概率,第三目标音符为比第一目标音符高八度或低八度的音符。
[0142]
可以理解,考虑到在实际应用过程中,演奏者演奏当前音簇本身具有的音符时,也比较容易误演奏为比当前音簇本身具有的音符高八度或低八度的音符。因此,通过针对标准音簇序列中的任一音簇,设定该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第三目标音符的音簇表现转移概率,大于除第一目标音符、第二目标音符和第三目标音符对应的音簇表现转移概率外的其他音簇表现转移概率,第三目标音符为比第一目标音符高八度或低八度的音符。这样就可以使得对于各音簇的表现转移概率的设定更符合用户的实际演奏情况,从而使得最终确定出的目标音簇序列更贴合实际演奏情况,从而使得演奏音频效果的评估结果更准确。
[0143]
在本技术实施例中,i表示标准曲谱中的音簇数量,钢琴的音符数量有88个,此时各音簇的表现转移概率可以通过i
×
88的矩阵bi×
88
表示。设置1个较小的数值a2作为各音簇以及对应音符的表现转移概率的初始权重值,确保各音簇的表现概率不为0。
[0144]
再设置每个音簇中表现为该音簇本身具有的音符组合的音符的表现转移概率的累加权重值为b2,设置每个音簇中表现为比该音簇本身具有的音符组合中的音符高一级或第一级的音符的表现转移概率的累加权重值为c2,设置每个音簇中表现为该音簇中具有高八度及低八度的音符的表现转移概率的累加权重值为d2。
[0145]
最后,将矩阵bn×
88
中的所有元素对应的权重值转化为概率值,使得矩阵bn×
88
中的各元素的表现转移概率总和为1。
[0146]
可选的,还可以再将矩阵bn×
88
中各元素的表现转移概率值分别转换为对数,以方便后续的计算。
[0147]
一实施例中,a2可以为10-6
,b2可以为0.95,c2可以为0.0075,d2可以为0.0023。
[0148]
为方便理解,可以参见图2所示,图2为本技术实施例提供的一种音簇表现转移概率的示意图。
[0149]
为了便于讲解方便,设定标准曲谱中音簇的数量为3,音符的数量为4。音簇1本身具有的音符2和音符3,音簇2本身具有音符2,音簇3本身具有音符3,音簇1中表现为高八度的音符为音符4,表现为低八度的音符为音符1。此时,表现转移概率可以表示为3
×
4的矩阵b3×4,初始化各音簇以及对应音符的初始权重值为a2。
[0150]
针对音簇1设置各音符的表现转移概率权重:音簇1本身具有的音符为音符2和音符3。因此,音簇1对应音符2和音符3的表现转移概率权重值为a2+b2。进一步地,设置比音符2和音符3高一级或低一级的音符的表现转移概率权重值。即,音符1比音符2低第一级,音符3比音符2高一级,音符4比音符3高一级。因此,音符1的表现转移概率权重值为a2+c2,音符2的表现转移概率权重值为a2+b2+c2,音符3的表现转移概率权重值为a2+b2+c2,音符4的表现转移概率权重值为a2+c2。进一步地,音簇1中表现为高八度的音符为音符4,表现为低八度的音符为音符1,因此,音符1的表现转移概率权重值为a2+c2+d2,音符4的表现转移概率权重值为a2+c2+d2。
[0151]
应理解,上文描述表现为低八度的音符为音符4以及表现为高八度的音符为音符1,仅为示例性说明。在实际应用中,本领域技术人员根据钢琴的基础知识可以得知音符1和音符4并不会同时表现为高/低一级和高/低八度。表现为高八度或低八度的音符的含义,为本领域技术人员所熟知,在此不再赘述。
[0152]
最终,音符1的表现转移概率权重值为a2+c2+d2,音符2的表现转移概率权重值为a2+b2+c2,音符3的表现转移概率权重值为a2+b2+c2,音符4的表现转移概率权重值为a2+c2+d2。
[0153]
可以理解,为了保持说明书的简洁性,针对音簇2和音簇3的各音符的表现转移概率权重的设置,可参考上述音簇1中各音符的设置,在此不再说明。
[0154]
s13:将目标音簇序列与标准曲谱的标准音簇序列进行比对,得到待评价音频的评价结果。
[0155]
所述标准音簇序列为按照演奏顺序对所述标准曲谱进行划分后得到的音簇序列。
[0156]
在本技术实施例中,通过将目标音簇序列与标准曲谱的标准音簇序列对比后,可以得出待评价音频对应的目标音簇与标准音簇的不同,进而得到错弹、漏弹、多弹等演奏错误或者演奏正确的信息。
[0157]
可以理解,通过获取待评价音频对应的音符序列,采用隐马尔可夫模型对音符序列进行处理,从而将音符序列转换为音符序列对应的目标音簇序列。这样,可以通过隐马尔可夫模型将准确性较低的音符序列转换为准确率较高的音符序列对应的目标音簇序列。这样,将目标音簇序列与标准曲谱的标准音簇序列进行对比,最终得到的待评价音频的评价效果,相比于直接以音符序列与标准曲谱中的音符序列进行比较的方案而言,对比结果的可靠性更高,提高了评估演奏音频效果的准确性。
[0158]
实施例二:
[0159]
基于同一发明构思,本技术实施例中还提供一种演奏效果评估装置100。请参阅图3所示,图3示出了采用图1所示的方法的演奏效果评估装置。应理解,装置100具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。装置100包括至少一个能以软件或固件的形式存储于存储器中或固化在装置100的操作系统中的软件功能模块。具体地:
[0160]
参见图3所示,装置100包括:获取模块101、处理模块102及评价模块103。其中:
[0161]
所述获取模块101,用于获取待评价音频对应的音符序列;所述音符序列为对所述待评价音频中的每一个音频信号进行识别后,得到的由各所述音频信号对应识别出的音符构成的序列;
[0162]
所述处理模块102,用于采用隐马尔可夫模型对所述音符序列进行处理,得到所述音符序列对应的目标音簇序列;所述目标音簇序列为所述音符序列在标准曲谱中最大概率对应的音簇序列;
[0163]
所述评价模块103,用于将所述目标音簇序列与所述标准曲谱的标准音簇序列进行比对,得到所述待评价音频的评价结果;所述标准音簇序列为按照演奏顺序对所述标准曲谱进行划分后得到的音簇序列。
[0164]
在本技术实施例中,所述隐马尔可夫模型包括:各音簇对应的初始状态概率pi,用于表征音簇i为演奏时的第一个音簇的概率;音簇转移概率tr[i][j],用于表征演奏过程中,从音簇i跳转至音簇j的概率;音簇表现转移概率b[i][k],用于表征音簇i表现为音符k
的概率。
[0165]
在本技术实施例中,所述处理模块102还用于,根据所述pi、所述tr[i][j]和所述b[i][k],确定所述音符序列对应的各音簇序列,以及各所述音簇序列对应的概率值;确定所述概率值最大的音簇序列;所述概率值最大的音簇序列为所述目标音簇序列。
[0166]
在本技术实施例中,所述标准曲谱中,每一小节的第一个音簇对应的初始状态概率为第一概率值;所述标准曲谱中,除每一小节的第一个音簇外的其他音簇对应的初始状态概率为第二概率值;所述第一概率值大于所述第二概率值。
[0167]
在本技术一种可行实施方式中,所述音簇转移概率中的tr[i][i]为第三概率值;所述第三概率值根据音簇i中的音符数量确定;所述tr[i][i]用于表征演奏过程中,从音簇i跳转至音簇i的概率。
[0168]
在本技术一种可行实施方式中,所述音簇转移概率中的tr[i][i+1]为第四概率值;所述tr[i][i+1]用于表征演奏过程中,从音簇i跳转至音簇i+1的概率;所述第四概率值大于除所述tr[i][i]之外的其他音簇转移概率的值。
[0169]
在本技术一种可行实施方式中,所述音簇转移概率中的tr[i][i+n]为第五概率值,其中,n为大于等于2的整数;所述tr[i][i+n]用于表征演奏过程中,从音簇i跳转至音簇i+n的概率;所述第五概率值小于所述tr[i][i+1]。
[0170]
在本技术一种可行实施方式中,所述n越大,所述第五概率值越小。
[0171]
在本技术实施例的一种可行实施方式中,所述音簇序列中的每个音簇表征所述标准曲谱中在同一时刻演奏的音符组合;针对所述标准音簇序列中的任一音簇:该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第一目标音符的音簇表现转移概率,大于除所述第一目标音符对应的音簇表现转移概率外的其他音簇表现转移概率;所述第一目标音符为该音簇所具有的音符。
[0172]
在本技术一种可行实施方式中,针对所述标准音簇序列中的任一音簇:该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第二目标音符的音簇表现转移概率,大于除所述第一目标音符和所述第二目标音符对应的音簇表现转移概率外的其他音簇表现转移概率;所述第二目标音符为比所述第一目标音符高一级或低一级的音符。
[0173]
在本技术一种可行实施方式中,针对所述标准音簇序列中的任一音簇:该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第三目标音符的音簇表现转移概率,大于除所述第一目标音符、所述第二目标音符和所述第三目标音符对应的音簇表现转移概率外的其他音簇表现转移概率;所述第三目标音符为比所述第一目标音符高八度或低八度的音符。
[0174]
需要理解的是,出于描述简洁的考量,部分实施例一中描述过的内容在本实施例中不再赘述。
[0175]
实施例三:
[0176]
本实施例提供了一种电子设备,参见图4所示,图4为根据本技术的一个实施例的电子设备的内部结构示意图,电子设备可以为终端(如手机、电脑、平板等设备)、服务器等具有信息处理功能的设备。请参阅图4,该电子设备包括存储器和处理器。
[0177]
处理器可以通过系统总线连接、存储器可以包括非易失性存储介质、内存储器等中的至少之一。除此之外,电子设备还可以包括输入装置、显示屏、网络接口等部件,但不作
为限制。
[0178]
其中,该电子设备的存储器中可存储操作系统和计算机可读指令,该计算机可读指令被执行时,可使得处理器执行本技术各实施例的一种演奏效果评估方法,该方法的具体实现过程可参考实施例一的具体内容,在此不再赘述。
[0179]
该电子设备的处理器用于提供计算和控制能力,支撑整个电子设备的运行。
[0180]
在电子设备具有输入装置时,输入装置可以用于各种数据的输入,电子设备具有显示屏时,显示屏可以用于进行显示,在电子设备具有网络接口时,网络接口可以用于与外部设备进行网络通信。
[0181]
可以理解,图4中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0182]
实施例四:
[0183]
基于同一发明构思,本技术实施例提供的一种计算机可读存储介质,其上存储有计算机可读指令,该计算机可读指令被处理器执行时实现上述的演奏效果评估方法中的步骤。
[0184]
如此处所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性。合适的非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。
[0185]
在本技术所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0186]
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0187]
再者,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
[0188]
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
[0189]
以上所述仅为本技术的实施例而已,并不用于限制本技术的保护范围,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。

技术特征:


1.一种演奏效果评估方法,其特征在于,包括:获取待评价音频对应的音符序列;所述音符序列为对所述待评价音频中的每一个音频信号进行识别后,得到的由各所述音频信号对应识别出的音符构成的序列;采用隐马尔可夫模型对所述音符序列进行处理,得到所述音符序列对应的目标音簇序列;所述目标音簇序列为所述音符序列在标准曲谱中最大概率对应的音簇序列;将所述目标音簇序列与所述标准曲谱的标准音簇序列进行比对,得到所述待评价音频的评价结果;所述标准音簇序列为按照演奏顺序对所述标准曲谱进行划分后得到的音簇序列。2.如权利要求1所述的演奏效果评估方法,其特征在于,所述隐马尔可夫模型包括:各音簇对应的初始状态概率pi,用于表征音簇i为演奏时的第一个音簇的概率;音簇转移概率tr[i][j],用于表征演奏过程中,从音簇i跳转至音簇j的概率;音簇表现转移概率b[i][k],用于表征音簇i表现为音符k的概率。3.如权利要求2所述的演奏效果评估方法,其特征在于,所述采用隐马尔可夫模型对所述音符序列进行处理,得到所述音符序列对应的目标音簇序列,包括:根据所述pi、所述tr[i][j]和所述b[i][k],确定所述音符序列对应的各音簇序列,以及各所述音簇序列对应的概率值;确定所述概率值最大的音簇序列;所述概率值最大的音簇序列为所述目标音簇序列。4.如权利要求2或3所述的演奏效果评估方法,其特征在于,所述标准曲谱中,每一小节的第一个音簇对应的初始状态概率为第一概率值;所述标准曲谱中,除每一小节的第一个音簇外的其他音簇对应的初始状态概率为第二概率值;所述第一概率值大于所述第二概率值。5.如权利要求2或3所述的演奏效果评估方法,其特征在于,所述音簇转移概率中的tr[i][i]为第三概率值;所述第三概率值根据音簇i中的音符数量确定;所述tr[i][i]用于表征演奏过程中,从音簇i跳转至音簇i的概率。6.如权利要求5所述的演奏效果评估方法,其特征在于,所述音簇转移概率中的tr[i][i+1]为第四概率值;所述tr[i][i+1]用于表征演奏过程中,从音簇i跳转至音簇i+1的概率;所述第四概率值大于除所述tr[i][i]之外的其他音簇转移概率的值。7.如权利要求6所述的演奏效果评估方法,其特征在于,所述音簇转移概率中的tr[i][i+n]为第五概率值,其中,n为大于等于2的整数;所述tr[i][i+n]用于表征演奏过程中,从音簇i跳转至音簇i+n的概率;所述第五概率值小于所述tr[i][i+1]。8.如权利要求7所述的演奏效果评估方法,其特征在于,所述n越大,所述第五概率值越小。9.如权利要求2或3所述的演奏效果评估方法,其特征在于,所述音簇序列中的每个音簇表征所述标准曲谱中在同一时刻演奏的音符组合;针对所述标准音簇序列中的任一音簇:该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第一目标音符的音簇表现
转移概率,大于除所述第一目标音符对应的音簇表现转移概率外的其他音簇表现转移概率;所述第一目标音符为该音簇所具有的音符。10.如权利要求9所述的演奏效果评估方法,其特征在于,针对所述标准音簇序列中的任一音簇:该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第二目标音符的音簇表现转移概率,大于除所述第一目标音符和所述第二目标音符对应的音簇表现转移概率外的其他音簇表现转移概率;所述第二目标音符为比所述第一目标音符高一级或低一级的音符。11.如权利要求10所述的演奏效果评估方法,其特征在于,针对所述标准音簇序列中的任一音簇:该音簇对应的所有音簇表现转移概率中,表征该音簇表现为第三目标音符的音簇表现转移概率,大于除所述第一目标音符、所述第二目标音符和所述第三目标音符对应的音簇表现转移概率外的其他音簇表现转移概率;所述第三目标音符为比所述第一目标音符高八度或低八度的音符。12.一种演奏效果评估装置,其特征在于,包括:获取模块,用于获取待评价音频对应的音符序列;所述音符序列为对所述待评价音频中的每一个音频信号进行识别后,得到的由各所述音频信号对应识别出的音符构成的序列;处理模块,用于采用隐马尔可夫模型对所述音符序列进行处理,得到所述音符序列对应的目标音簇序列;所述目标音簇序列为所述音符序列在标准曲谱中最大概率对应的音簇序列;评价模块,用于将所述目标音簇序列与所述标准曲谱的标准音簇序列进行比对,得到所述待评价音频的评价结果;所述标准音簇序列为按照演奏顺序对所述标准曲谱进行划分后得到的音簇序列。13.一种电子设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1-11任一项所述的演奏效果评估方法。14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至11中任一项所述的演奏效果评估方法。

技术总结


本申请实施例提供一种演奏效果评估方法、装置、电子设备及存储介质,方法包括:获取待评价音频对应的音符序列;所述音符序列为对所述待评价音频中的每一个音频信号进行识别后,得到的由各所述音频信号对应识别出的音符构成的序列;采用隐马尔可夫模型对所述音符序列进行处理,得到所述音符序列对应的目标音簇序列;所述目标音簇序列为所述音符序列在标准曲谱中最大概率对应的音簇序列;所述标准音簇序列为按照演奏顺序对所述标准曲谱进行划分后得到的音簇序列;将所述目标音簇序列与所述标准曲谱的标准音簇序列进行比对,得到所述待评价音频的评价结果,以此提高评估演奏音频效果的准确性。的准确性。的准确性。


技术研发人员:

王新宇 王宇航 曾鹏轩

受保护的技术使用者:

北京思明启创科技有限公司

技术研发日:

2022.03.30

技术公布日:

2022/6/17

本文发布于:2024-09-20 17:50:12,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/811.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:概率   音符   所述   序列
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议