歌声合成方法、计算机设备及存储介质与流程



1.本技术涉及计算机技术领域,尤其涉及一种歌声合成方法、一种计算机设备以及一种计算机可读存储介质。


背景技术:



2.歌声合成是通过机器输出歌声的方式,用户可以利用歌声合成技术进行音乐创作,以得到风格各异的歌曲。在进行歌声合成的过程中,歌声合成能覆盖的音域范围是有限的,目前,歌声合成大多都是通过增加歌声合成模型训练数据,来保证模型的音域覆盖范围。这样的做法优点是从数据侧解决发音问题,方法直接且有效;但是缺点是需要大量的歌声数据,成本昂贵。如果不购买歌声数据,则需要使用类似数据增强的方式扩充数据量,这种的做法会降低训练数据的质量,导致模型输出音质打折扣,还可能增加时间和价格成本。
3.同时,采用训练数据进行歌声合成,由于用户的训练数据是有限的,模板的音域又是固定的,两者之间常常存在不匹配的情况,从而导致音不协调,例如,一个女声用户选择了一个男生版的歌曲进行合成,出来的声音会比用户原本的女声更加低沉。因此,怎样保证音域范围,又使得合成的歌曲数据协调成为亟待解决的技术问题。


技术实现要素:



4.本技术实施例提供了一种歌声合成方法、计算机设备及存储介质,可以通过对待合成歌曲的曲谱进行调整,从而增加了音域匹配度高,使得合成的歌声数据听起来更为协调。
5.第一方面,本技术实施例公开了一种歌声合成方法,该方法包括:
6.获取目标对象的歌声数据,并对所述歌声数据进行音域检测,得到所述目标对象的第一音域;获取待合成歌曲的初始曲谱信息,并根据所述初始曲谱信息获取所述待合成歌曲的第二音域;
7.确定所述第一音域和所述第二音域之间的重合度比较结果;
8.若所述重合度比较结果指示所述第一音域和所述第二音域不匹配,则对所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息;其中,所述目标音高调整参数是根据所述第一音域和所述第二音域确定,或者是根据参考音域确定的;
9.调用与所述目标对象相关联的声学合成模型,以使所述声学合成模型根据所述目标曲谱信息进行歌声数据合成处理,得到与所述目标对象和所述待合成歌曲相关联的合成歌声数据。
10.第二方面,本技术实施例公开了一种歌声合成装置,该装置包括:
11.获取单元,用于获取目标对象的歌声数据,并对所述歌声数据进行音域检测,得到所述目标对象的第一音域;获取待合成歌曲的初始曲谱信息,并根据所述初始曲谱信息获取所述待合成歌曲的第二音域;
12.确定单元,用于确定所述第一音域和所述第二音域之间的重合度比较结果;
13.处理单元,用于若所述重合度比较结果指示所述第一音域和所述第二音域不匹配,则对所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息;
14.所述处理单元,还用于调用与所述目标对象相关联的声学合成模型,以使所述声学合成模型根据所述目标曲谱信息进行歌声数据合成处理,得到与所述目标对象和所述待合成歌曲相关联的合成歌声数据。
15.第三方面,本技术实施例公开了一种计算机设备,该计算机设备包括处理器,适于实现一条或多条计算机程序;以及,计算机存储介质,所述计算机存储介质存储有一条或多条计算机程序,所述一条或多条计算机程序适于由所述处理器加载并执行以上述的歌声合成方法。
16.第四方面,本技术实施公开了一种计算机可读存储介质,该计算机可读存储介质存储有一条或多条计算机程序,所述一条或多条计算机程序适于由处理器加载并执行上述的歌声合成方法。
17.第五方面,本技术实施例公开了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该计算机设备执行上述的歌声合成方法。
18.本技术实施例中,先获取目标对象的歌声数据,并对歌声数据进行音域检测,得到目标对象的第一音域;获取待合成歌曲的初始曲谱信息,并根据初始曲谱信息获取待合成歌曲的第二音域;先确定目标对象和待合成歌曲的音域匹配度,即确定第一音域和第二音域之间的重合度比较结果,若第一音域和第二音域不匹配,则对初始曲谱信息的音高区间进行调整,得到目标曲谱信息。在这个过程中,通过对初始曲谱的音高区间进行调整,得到目标曲谱信息,再调用与目标对象相关联的声学合成模型根据目标曲谱信息进行歌声数据合成处理,得到与目标对象和待合成歌曲相关联的合成歌声数据。通过该方法,基于目标对象的歌声数据确定目标对象的音域覆盖范围,然后再对待合成歌曲的音高进行调整,从而使得音域匹配度高,在不改变目标对象音域的前提下,改变曲谱的音高,可以保证合成的歌声数据的音变化小,使得合成的合成歌声数据效果更好,听起来更为协调。
附图说明
19.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
20.图1是本技术实施例公开的一种歌声合成系统的网络架构图;
21.图2是本技术实施例公开的一种歌声合成方法的流程示意图;
22.图3a是本技术实施例公开的一种女声的音域统计图;
23.图3b是本技术实施例公开的一首歌曲的音域统计图;
24.图3c是本技术实施例公开的另一首歌曲的音域统计图;
25.图4是本技术实施例公开的另一种歌声合成方法的流程示意图;
26.图5是本技术实施例公开的一种声学合成模型的架构示意图;
27.图6是本技术实施例公开的一种歌声合成装置的结构示意图;
28.图7是本技术实施例公开的一种计算机设备的结构示意图。
具体实施方式
29.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
30.为了使得合成歌声数据效果更好(音域匹配度高、歌曲听起来更为协调。),本技术实施例提出了一种歌声合成方法,可以在歌词合成过程中,对目标对象和待合成歌曲的音域进行分析,并在两者音域覆盖范围不匹配的情况下,对待合成歌曲的音高进行调整,从而使得两者匹配度增加,进而再进行合成,使得合成歌声数据听起来更为协调。本技术实施例提供的歌声合成方法可以基于ai(artificial intelligence,人工智能)技术实现。ai是指利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。ai技术是一门综合学科,其涉及的领域较为广泛;而本技术实施例提供的歌声合成方法主要涉及ai技术中的机器学习(machine learning,ml)技术。机器学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
31.在可行的实施例中,本技术实施例提供的歌声合成方法还可以基于云技术(cloudtechnology)和/或区块链技术实现。具体可以涉及云技术中的云存储(cloudstorage)、云数据库(clouddatabase)、大数据(bigdata)中的一种或者多种。例如,从云数据库中获取执行该歌声合成方法所需要的数据(例如目标对象的歌声数据、待合成请歌曲的初始曲谱信息等)。又例如,执行该歌声合成方法所需要的数据可以是以区块的形式存储在区块链上;可以将执行该歌声合成方法所产生的数据(例如候选曲谱信息、目标曲谱信息以及合成歌声数据等)以区块的形式存储到区块链上;另外,执行该歌声合成方法的歌声合成设备可以是区块链网络中的节点设备。
32.请参见图1,图1是申请实施例公开的一种歌声合成系统的网络架构图,如图1所示,该歌声合成系统100至少可以包括终端设备101以及计算机设备102,其中,终端设备101和计算机设备102可以实现通信连接,其连接方式可以包括有线连接和无线连接,在此不进行限定。在具体的实现过程中,终端设备101主要为输入或者输出设备,主要可以是向计算机设备102输入目标对象的歌曲数据以及待合成歌曲的曲谱信息(可选的,目标对象的歌曲数据以及待合成歌曲的曲谱信息也可以是从数据库中获取);终端设备101还可以用于输出合成歌声数据。计算机设备102主要为歌声合成设备,用于获取目标对象的歌曲数据以及待合成歌曲的曲谱信息,用于分别对目标对象的歌曲数据以及待合成歌曲的曲谱信息进行处理,得到目标对象的第一音域和待合成歌曲的第二音域;还用于对始曲谱信息的音高区间进行调整,得到目标曲谱信息,调用与目标对象相关联的声学合成模型根据目标曲谱信息进行歌声数据合成处理,得到与目标对象和待合成歌曲相关联的合成歌声数据。
33.在一种可能的实现方式中,上述所提及的终端设备101包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器等;上述的计算机设备102可以是服务器,
服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器。图1只是示例性地表征歌声合成系统的网络架构图,并不对此进行限定。例如,图1中的计算机设备102可以部署成区块链网络中的节点,或者将计算机设备102可以接入区块链网络,使得计算机设备102可以将合成歌声数据上传至区块链网络进行存储,以防止内部数据被篡改,从而保证数据安全性。
34.结合上述歌声合成系统,本技术实施例的歌声合成方法大致可以包括:计算机设备102先获取目标对象的歌声数据,并对歌声数据进行音域检测,得到目标对象的第一音域;获取待合成歌曲的初始曲谱信息,并根据初始曲谱信息获取待合成歌曲的第二音域;先确定第一音域和第二音域之间的重合度比较结果,若第一音域和第二音域不相匹配,则对初始曲谱信息进行调整,得到目标曲谱信息,在这个过程中,通过对初始曲谱信息的音高区间进行调整,从而得到目标曲谱信息,再调用与目标对象相关联的声学合成模型根据目标曲谱信息进行歌声数据合成处理,得到与目标对象和待合成歌曲相关联的合成歌声数据。通过该方法,基于目标对象的歌声数据确定目标对象的音域覆盖范围,然后再对初始曲谱信息的音高区间进行调整,从而使得音域匹配度增高,在不改变目标对象音域的前提下,改变曲谱的音高,可以保证合成的歌声数据的音变化小,使得合成歌声数据听起来更为协调。
35.需要说明的是,在本技术的具体实施方式中,涉及到目标对象的歌声数据、待合成歌曲的初始曲谱信息等相关的数据,所涉及使用到的数据均是经过用户授权的。当本技术以上实施例运用到具体产品或技术中时,所涉及使用到的数据需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
36.请参见图2,是本技术实施例公开的一种歌声合成方法的流程示意图,该歌声合成方法可以由计算机设备执行,该歌声合成方法包括但不仅限于步骤s201-s205:
37.s201:获取目标对象的歌声数据,并对歌声数据进行音域检测,得到目标对象的第一音域。
38.其中,目标对象指的是歌词合成过程需要合成的声音,可以是歌手a,也可以是用户自己。歌声数据是与目标对象相关的音频数据,对于用户本身而言,歌声数据可以是用户练唱的数据;对于歌手a而言,歌声数据可以是歌手a演唱的相关歌曲。
39.在一种可能的实现方式中,歌声数据可以是用户在用户界面中触发“合成”按钮后,计算机设备再进行获取的,也就是说,用户勾选了用户界面的相关歌声数据并点击了“合成”按钮,然后计算机设备再获取目标对象的歌声数据。一方面,歌声数据可以是用户设备发送给计算机设备的,也可以是计算机设备在接收到合成指令后从数据库中获取的。
40.在一种可能的实现方式中,可以通过分析目标对象的歌声数据从而获取目标对象的音域。因此,在获取到歌声数据后,对歌声数据进行音域检测,得到目标对象的第一音域。该过程中,先提取歌声数据中的基频数据(基频提取技术,指能够提取用户干声中人声的基频曲线),然后对提取的基频数据进行分析,得到目标对象的第一音域。
41.其中,基频提取可以采用各种基频提取工具。基频提取的工具有多种,在提取时所用方法包含传统数字信号处理以及深度学习的方法。基于传统数字信号处理的提取方法如
yin、pyin等,适用性强,计算量小。基于深度学习的基频提取方法,如crepe,虽然在训练集之外的场景可能适用性较低,但在训练集之内的场景下(如特定噪声场景),准确率很高。pyin工具包支持按帧提取,在每一帧的计算中,寻多个候选峰谷值作为候选点,有效地避免了局部最优,且其后续利用隐马尔可夫模型进一步提升了基频曲线的平滑性。yin算法是通过计算自相关函数,来寻语音波形的最小周期。
42.音域,是一个范围值,用户唱歌时能够发声的区间,不同物种、个体的发声音域均不同。如图3a所示,是一个以女声的音域统计图,其中,横坐标是音高,纵坐标是声音的频率(单位hz),从图3a中可以看出,女生音域主要分布在52-70之间,也就是g3-g4;再如图3b所示,是一首歌曲的音域统计图,其中,横坐标是音高,纵坐标是声音的频率(单位hz),从图3b中可以看出,该歌曲的音域跨度是从52到70。
43.s202:获取待合成歌曲的初始曲谱信息,并根据初始曲谱信息获取待合成歌曲的第二音域。
44.为了获取待合成歌曲的音域,可以对待合成数据的相关信息进行分析,从而得到待合成歌曲的音域。在一种可能的实现方式中,可以直接从数据库中获取待合成歌曲的初始曲谱信息,然后根据初始曲谱信息获取待合成歌曲的第二音域。曲谱信息中有歌词的音高,根据音高就可以知道歌曲的音域。
45.在另一种可能的实现方式中,也可以是用户选择了待合成歌曲对应的名称后,计算机该设备根据该歌曲的标识信息(唯一识别标识符)获取待合成歌曲的原始音频数据,然后提取该音频数据的基频数据,再根据基频数据确定出该待合成歌曲的音域。这种方法和获取目标对象的音域的方法一样,这里就不再赘述。
46.s203:确定第一音域和第二音域之间的重合度比较结果。
47.在一种可能的实现方式中,在确定出目标对象的第一音域和待合成歌曲的第二音域后,将第一音域和第二音域进行匹配,从而确定两者音域是否适配,可以包括:先确定第一音域和第二音域之间的目标音域重合度;然后将目标音域重合度与重合度阈值进行比较,得到重合度比较结果。若目标音域重合度大于重合度阈值(例如,90%,该值可调),则可以认为第一音域和第二音域匹配;若目标音域重合度小于等于重合度阈值,则认为第一音域和第二音域不相匹配。
48.在另一种实现方式中,确定第一音域和第二音域之间的重合度比较结果,还可以包括:根据第一音域确定目标对象的音高跨度值,根据第一音域和第二音域确定目标对象和待合成歌曲之间的交叉音高跨度值,根据交叉音高跨度值和目标对象的音高跨度值,确定第一音域和第二音域之间的重合度比较结果。在这个过程中,根据第一音域和第二音域确定目标对象和待合成歌曲之间的交叉音高跨度值,又可以包括:根据第一音域确定目标对象的音高上限值,并根据第二音域确定待合成歌曲的音高上限值;若待合成歌曲的音高上限值小于目标对象的音高上限值,则确定待合成歌曲的音高上限值和目标对象的音高下限值之间的差值为交叉音高跨度值;若待合成歌曲的音高上限值大于或者等于目标对象的音高上限值,则确定目标对象的音高上限值和待合成歌曲的音高下限值之间的差值为交叉音高跨度值。
49.进一步,在确定出交叉音高跨度值和目标对象的音高跨度值后,确定第一音域和第二音域之间的目标音域重合度,具体可以包括确定交叉音高跨度值和音高跨度值之间的
比值,然后将比值和设定数值进行比较,将比值与设定数值之间的最大值作为第一音域和第二音域之间的目标音域重合度。最后,将目标音域重合度与重合度阈值进行比较,得到重合度比较结果。若目标音域重合度大于重合度阈值(例如,90%,该值可调),则可以认为第一音域和第二音域匹配;若目标音域重合度小于等于重合度阈值,则认为第一音域和第二音域不相匹配。
50.举例对目标音域重合度计算进行阐述,假设目标对象的第一音域为[x1,x2],待合成歌曲的第二音域可为[y1,y2],则可以采用以下公式(1)进行目标音域重合度(ratio)计算:
[0051][0052]
其中,ratio1是根据第一音域和第二音域确定的初始音域重合度,为了保证音域重合度数值不为负数,则利用取大的公式对ratio1进行更新,得到目标音域重合度,x2-x1为目标对象的音高跨度值,y2-x1和x2-y1为不同情况下目标对象和待合成歌曲之间的交叉音高跨度值。
[0053]
例如,目标对象的第一音域为52到62,待合成歌曲的第二音域可为36到50,由于50小于62,根据公式(1),得到x2-x1=10,y2-x1=-2,ratio1=-0.2,ratio=0。基于此,可以得出第一音域和第二音域的目标音域匹配度为0。又例如,目标对象的第一音域为52到62,待合成歌曲的第二音域可为54到68,由于68大于62,根据公式(1),得到x2-x1=10,x2-y1=8,ratio1=0.8,ratio=0.8。基于此,可以得出第一音域和第二音域的目标音域匹配度为0.8。
[0054]
s204:若重合度比较结果指示第一音域和第二音域不匹配,则对初始曲谱信息的音高区间进行调整,得到目标曲谱信息。
[0055]
其中,第一音域和第二音域是否匹配是非常重要的,若是匹配,则合成的合成歌声数据效果就比较好,若是不匹配,则合成的合成歌声数据效果就不理想。例如,图3a中的女声音域在52-70之间,图3b中的歌曲的音域跨度是从52到70,也就是说,图3a中的女声的音完全可以驾驭图3b中的这首歌曲。再例如,图3c所示,是另一首歌曲的音域统计图,从图3c可以看出,该歌曲的音域跨度是从40到65,那么图3a中的女声的低音部分不在这首歌的音域范围,那么,将图3a中的女声和图3c中的这首歌曲进行合成,合成效果就不理想。
[0056]
在一种可能的实现方式中,若重合度比较结果指示第一音域和第二音域不匹配,则可以根据目标音高调整参数对初始曲谱信息的音高区间进行调整,得到目标曲谱信息。其中,目标音高调整参数是根据第一音域和第二音域确定的,或者是根据参考音域确定的。
[0057]
若目标音高调整参数是根据第一音域和第二音域确定的,则具体的根据目标音高调整参数对初始曲谱信息的音高区间进行调整,得到,目标曲谱信息包括:根据第一音域确定目标对象的音高平均值,根据第二音域确定待合成歌曲的音高平均值,根据目标对象的音高平均值和待合成歌曲的音高平均值确定偏离参数,将偏离参数确定为所述目标音高调整参数,将初始曲谱信息所包含的音高信息与目标音高调整参数进行相加处理,得到目标曲谱信息。这种方案针对不同的对象(用户),得到的目标曲谱信息是不同的,即使是针对同一首待合成歌曲,针对不同的对象对应的目标曲谱信息也是不同的,因为不同的对象的音
域不同,得到音高平均值不同,从而使得偏离参数不同,对应的,得到的目标曲谱信息也就不同。
[0058]
若目标音高调整参数是根据参考音域确定的,则具体的根据目标音高调整参数对初始曲谱信息的音高区间进行调整,得到,目标曲谱信息包括:获取参考音域,参考音域包括低音音域、中音音域和高音音域,同时获取低音音域的音高下限值、中音音域的音高下限值以及高音音域的音高下限值。根据低音音域的音高下限值和待合成歌曲的音高下限值确定第一音高调整参数,根据中音音域的音高下限值和待合成歌曲的音高下限值确定第二音高调整参数,根据高音音域的音高下限值和待合成歌曲的音高下限值确定第三音高调整参数。然后根据第一音高调整参数、第二音高调整参数以及第三音高调整参数对初始曲谱信息的音高区间进行调整,得到目标曲谱信息。
[0059]
其中,根据第一音高调整参数、第二音高调整参数以及第三音高调整参数对初始曲谱信息的音高区间进行调整,得到目标曲谱信息,可以包括:将初始曲谱信息所包含的音高信息与第一音高调整参数进行相加处理,得到第一曲谱信息,将初始曲谱信息所包含的音高信息与第二音高调整参数进行相加处理,得到第二曲谱信息,将初始曲谱信息所包含的音高信息与第三音高调整参数进行相加处理,得到第三曲谱信息。计算第一音域与第一曲谱信息所对应的音域之间的第一音域重合度,计算第一音域与第二曲谱信息所对应的音域之间的第二音域重合度,以及计算第一音域与第三曲谱信息所对应的音域之间的第三音域重合度;再确定第一音域重合度、第二音域重合度以及第三音域重合度中的最大音域重合度;将最大音域重合度所对应的曲谱信息确定为目标曲谱信息,其中最大音域重合度所对应的曲谱信息为第一曲谱信息、第二曲谱信息或第三曲谱信息中的一种。
[0060]
其中,需要注意的是,低音音域、中音音域和高音音域可以是根据待合成歌曲的第二音域自定义设置得到的,也可以根据设定算法确定的,即确定出待合成歌曲的音域后,可以根据该算法得出对应的低音音域、中音音域和高音音域。第一音域重合度、第二音域重合度以及第三音域重合度的计算方式可以参见公式(1)。
[0061]
s205:调用与目标对象相关联的声学合成模型,以使声学合成模型根据目标曲谱信息进行歌声数据合成处理,得到与目标对象和待合成歌曲相关联的合成歌声数据。
[0062]
在一种可能的实现方式中,在确定出待合成歌曲的目标曲谱信息后,调用与目标对象相关联的声学合成模型根据目标曲谱信息进行歌声数据合成处理,即可得到与目标对象和待合成歌曲相关联的合成歌声数据。其中,目标曲谱信息包括音素信息和音符序列,将待合成歌曲的音素信息和音符序列作为输入,声学合成模型对音素信息和音符序列进行处理,就可以得到合成歌声数据。其中,声学合成模型是提前训练好的,针对不同的对象,对应的声学合成模型是唯一的,因为在声学合成模型的训练过程中,加入了用户标识信息的。
[0063]
本技术实施例中,计算机设备先获取目标对象的歌声数据,并对歌声数据进行音域检测,得到目标对象的第一音域;获取待合成歌曲的初始曲谱信息,并根据初始曲谱信息获取待合成歌曲的第二音域;先确定目标对象和待合成歌曲的音域,然后将两者的音域进行匹配,若第一音域和第二音域不相匹配,则根据目标音高调整参数对初始曲谱信息进行调整,得到候选曲谱信息,并根据候选曲谱信息确定目标曲谱信息,在这个过程中,通过对歌曲的音高区间进行调整,得到不同的曲谱模板,再调用与目标对象相关联的声学合成模型根据目标曲谱信息进行歌声数据合成处理,得到与目标对象和待合成歌曲相关联的合成
歌声数据。通过该方法,基于目标对象的歌声数据确定目标对象的音域覆盖范围,然后再对待合成歌曲的音高进行调整,从而使得音域匹配度高,在不改变目标对象音域的前提下,改变曲谱的音高,可以保证合成的歌声数据的音变化小,使得合成歌声数据听起来更为协调。
[0064]
基于上述阐述,本技术实施例公开了另一种歌声合成方法,请参见图4,是本技术实施例公开的另一种歌声合成方法的流程示意图,假设目标对象是用户a,待合成歌曲是歌曲b,对应的歌声合成方法的流程图包括但不仅限于以下步骤:
[0065]
s401:获取用户a的歌声数据,并对歌声数据进行音域检测,得到用户a的第一音域。
[0066]
s402:获取歌曲b的初始曲谱信息,并根据初始曲谱信息获取歌曲b的第二音域。
[0067]
s403:第一音域和第二音域是否匹配。
[0068]
其中,若第一音域和第二音域匹配,则直接将待合成歌曲的初始曲谱信息作为目标曲谱信息,执行步骤s405;若第一音域和第二音域不相匹配,则执行步骤s404。
[0069]
s404:根据目标音高调整参数对初始曲谱信息进行调整,得到目标曲谱信息。
[0070]
在对初始曲谱信息进行调整时,包括两种方案,在实际应用场景中,可以从两种方案中选一种即可。
[0071]
s405:调用与用户a相关联的声学合成模型根据目标曲谱信息进行歌声数据合成处理,得到与用户a和歌曲b相关联的合成歌声数据。
[0072]
上述步骤s401-s405与图2中的步骤s201-204是一样的,这里就不再赘述。
[0073]
在这部分中,对声学合成模型的训练进行阐述:
[0074]
获取目标对象的训练歌声数据,并对训练歌声数据进行解析,得到用户a的音素信息、音符序列以及对象标识;基于音素信息、音符序列以及对象标识对初始声学合成模型进行训练,并不断对参数进行微调,得到用户a的声学合成模型。训练歌声数据可以是和步骤s401中歌声数据相同,也可以另外从数据库中获取的。其中,训练歌声数据的时间长度要足够长(例如一共15分钟),这样才能保证提取到更多的音符序列。
[0075]
在一种可能的实现方式中,在获取到用户a的训练歌声数据后,对训练歌声数据进行音域检测,得到用户a的音域;若用户a的音域不满足预设条件,则对第一音域信息进行调整,得到调整后的音域;基于调整后的音域确定音符序列。这个过程相当于数据增强处理,主要是保证用户a的数据音域覆盖度至少要超过一个八度,也就是12个半音,这样才能保证在音域适配的基础上能演唱大部分的歌曲(由于绝对多数歌曲音域跨度都在12个半音以上)。如果用户a的训练歌声数据的音域不足12个半音,就需要对这部分训练数据做数据增强。这里的数据增强是指,对原音频干声做上下6个半音的升降调(变调不变速处理),拓宽用户a的音高覆盖度。该过程采用的是升降调算法(可以改变音频音高(也就是基频),而不改变速度以及音素的变调不变速算法,常用的算法有psola)。
[0076]
其中,该声学合成模型可以是基于fastspeech的框架开发的,由编码器和解码器两大部分组成。fastspeech模型输入为音素序列,输出梅尔频谱,主要结构就是一个基于tramsformer(变形器)中的multi-head self-attention(多头自注意力)和一维卷积,将其称为fft block(feed-forward transformer),在音素端和频谱端各堆叠了n个fft block。在进行声学合成模型的训练时,输入信息为:对象标识(针对不同的对象,标识不同)、音符
序列(可以基于对象的歌声数据获取)以及音素信息,输出为梅尔谱。最后接上一个声码器可以将声学特征(通常是梅尔谱)转成可以播放的语音波形。和普通的合成模型不同的是,做个性化歌声合成的模型需要在输入侧加入对象标识,这样模型可以学习到与对象音相关的特征,将演唱内容等信息和音解耦开来。其中,该声学合成模型的架构可以如图5所示,可见,输入是音素信息、音符序列和对象标识,然后通过embedding层(一个将离散变量转为连续向量表示的一个方式,在神经网络中,embedding不光可以减少离散变量的空间维数,同时还可以有意义的表示该变量),再通过编码器、解码器、线性层以及声码器,输出为语音波形。
[0077]
本技术实施例中,主要对声学合成模型进行了阐述,结合该声学合成模型,可以针对不同的对象进行歌声合成,真正体现出个性化,在这个过程中,对待合成歌曲的曲谱进行调整,以解决音域适配问题。
[0078]
基于上述的方法实施例,本技术实施例还提供了一种歌声合成装置的结构示意图。参见图6,为本技术实施例提供的一种歌声合成装置的结构示意图。图6所示的歌声合成装置600可运行获取单元601、确定单元602以及处理单元603,具体的:
[0079]
获取单元601,用于获取目标对象的歌声数据,并对所述歌声数据进行音域检测,得到所述目标对象的第一音域;获取待合成歌曲的初始曲谱信息,并根据所述初始曲谱信息获取所述待合成歌曲的第二音域;
[0080]
确定单元602,用于确定所述第一音域和所述第二音域之间的重合度比较结果;
[0081]
处理单元603,用于若所述重合度比较结果指示所述第一音域和所述第二音域不匹配,则对所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息;调用与所述目标对象相关联的声学合成模型,以使所述声学合成模型根据所述目标曲谱信息进行歌声数据合成处理,得到与所述目标对象和所述待合成歌曲相关联的合成歌声数据。
[0082]
在一种可能的实现方式中,所述确定单元602确定所述第一音域和所述第二音域之间的重合度比较结果时,具体用于:
[0083]
在一种可能的实现方式中,所述确定单元602确定所述第一音域和所述第二音域之间的目标音域重合度时,具体用于:
[0084]
根据所述第一音域确定所述目标对象的音高跨度值;
[0085]
根据所述第一音域和所述第二音域确定所述目标对象和所述待合成歌曲之间的交叉音高跨度值;
[0086]
根据所述交叉音高跨度值和所述目标对象的音高跨度值,确定所述第一音域和所述第二音域之间的重合度比较结果。
[0087]
在一种可能的实现方式中,所述确定单元602根据所述第一音域和所述第二音域确定所述目标对象和所述待合成歌曲之间的交叉音高跨度值时,具体用于:
[0088]
根据所述第一音域确定所述目标对象的音高上限值,并根据所述第二音域确定所述待合成歌曲的音高上限值;
[0089]
若所述待合成歌曲的音高上限值小于所述目标对象的音高上限值,则确定所述待合成歌曲的音高上限值和所述目标对象的音高下限值之间的差值为交叉音高跨度值;
[0090]
若所述待合成歌曲的音高上限值大于或者等于所述目标对象的音高上限值,则确定所述目标对象的音高上限值和所述待合成歌曲的音高下限值之间的差值为交叉音高跨
度值。
[0091]
在一种可能的实现方式中,所述确定单元602根据所述交叉音高跨度值和所述目标对象的音高跨度值,确定所述第一音域和所述第二音域之间的重合度比较结果时,具体用于:
[0092]
确定所述交叉音高跨度值和所述目标对象的音高跨度值之间的比值,根据所述比值确定所述第一音域和所述第二音域之间的重合度比较结果。
[0093]
在一种可能的实现方式中,所述处理单元603所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息时,具体用于:
[0094]
根据所述第一音域确定所述目标对象的音高平均值,根据所述第二音域确定所述待合成歌曲的音高平均值;并根据所述目标对象的音高平均值和所述待合成歌曲的音高平均值确定偏离参数;
[0095]
将所述初始曲谱信息所包含的音高信息与所述偏离参数进行相加处理,得到目标曲谱信息。
[0096]
在一种可能的实现方式中,所述处理单元603所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息时,具体用于:
[0097]
获取参考音域,所述参考音域包括低音音域、中音音域和高音音域;
[0098]
根据所述低音音域的音高下限值和所述待合成歌曲的音高下限值确定第一音高调整参数,根据所述中音音域的音高下限值和所述待合成歌曲的音高下限值确定第二音高调整参数,根据所述高音音域的音高下限值和所述待合成歌曲的音高下限值确定第三音高调整参数;
[0099]
根据所述第一音高调整参数、所述第二音高调整参数以及所述第三音高调整参数对所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息。
[0100]
在一种可能的实现方式中,所述处理单元603根据所述第一音高调整参数、所述第二音高调整参数以及所述第三音高调整参数对所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息时,具体用于:
[0101]
将所述初始曲谱信息所包含的音高信息与所述第一音高调整参数进行相加处理,得到第一曲谱信息,将所述初始曲谱信息所包含的音高信息与所述第二音高调整参数进行相加处理,得到第二曲谱信息,将所述初始曲谱信息所包含的音高信息与所述第三音高调整参数进行相加处理,得到第三曲谱信息;
[0102]
从所述第一曲谱信息、所述第二曲谱信息以及所述第三曲谱信息确定目标曲谱信息。
[0103]
在一种可能的实现方式中,所述确定单元602从所述第一曲谱信息、所述第二曲谱信息以及所述第三曲谱信息确定目标曲谱信息时,具体用于:
[0104]
计算所述第一音域与所述第一曲谱信息所对应的音域之间的第一音域重合度,计算所述第一音域与所述第二曲谱信息所对应的音域之间的第二音域重合度,以及计算所述第一音域与所述第三曲谱信息所对应的音域之间的第三音域重合度;
[0105]
确定所述第一音域重合度、所述第二音域重合度以及所述第三音域重合度中的最大音域重合度;将所述最大音域重合度所对应的曲谱信息确定为目标曲谱信息,其中所述最大音域重合度所对应的曲谱信息为所述第一曲谱信息、所述第二曲谱信息或所述第三曲
谱信息。
[0106]
可以理解的是,本技术实施例提供的歌声合成装置的各功能单元的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例中的相关描述,此处不再赘述。
[0107]
在可行的实施例中,本技术实施例提供的歌声合成装置可以采用软件方式实现,歌声合成装置可以存储在存储器中,其可以是程序和插件等形式的软件,并包括一系列的单元,包括获取单元、处理单元、确定单元;其中,获取单元、处理单元、确定单元以用于实现本技术实施例提供的歌声合成方法。
[0108]
在其它可行的实施例中,本技术实施例提供的歌声合成装置也可以采用软硬件结合的方式实现,作为示例,本技术实施例提供的歌声合成装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本技术实施例提供的歌声合成方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(asic,application specific integrated circuit)、dsp、可编程逻辑器件(pld,programmable logic device)、复杂可编程逻辑器件(cpld,complex programmable logic device)、现场可编程门阵列(fpga,field-programmable gate array)或其他电子元件。
[0109]
本技术实施例,获取单元601获取目标对象的歌声数据,并对歌声数据进行音域检测,得到目标对象的第一音域;获取待合成歌曲的初始曲谱信息,并根据初始曲谱信息获取待合成歌曲的第二音域;确定单元602确定第一音域和第二音域之间的重合度比较结果,若第一音域和第二音域不相匹配,则处理单元603对初始曲谱信息的音高区间进行调整,得到初始曲谱信息。在这个过程中,通过对初始曲谱信息的音高区间进行调整,得到初始曲谱信息,再调用与目标对象相关联的声学合成模型根据目标曲谱信息进行歌声数据合成处理,得到与目标对象和待合成歌曲相关联的合成歌声数据。通过该方法,基于目标对象的歌声数据确定目标对象的音域覆盖范围,然后再对待合成歌曲的音高进行调整,从而使得音域匹配度高,在不改变目标对象音域的前提下,改变曲谱的音高,可以保证合成的歌声数据的音变化小,使得合成歌声数据听起来更为协调。
[0110]
请参阅图7,图7为本技术实施例提供的一种计算机设备的结构示意图。本技术实施例中所描述的计算机设备包括:处理器701、通信接口702及存储器703。其中,处理器701、通信接口702及存储器703可通过总线或其他方式连接,本技术实施例以通过总线连接为例。
[0111]
其中,处理器701(或称cpu(central processing unit,中央处理器))是计算机设备的计算核心以及控制核心,其可以解析计算机设备内的各类指令以及处理计算机设备的各类数据,例如:cpu可以用于解析用户向计算机设备所发送的开关机指令,并控制计算机设备进行开关机操作;再如:cpu可以在计算机设备内部结构之间传输各类交互数据,等等。通信接口702可选的可以包括标准的有线接口、无线接口(如wi-fi、移动通信接口等),受处理器701的控制用于收发数据。存储器703(memory)是计算机设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的存储器703既可以包括计算机设备的内置存储器,当然也可以包括计算机设备所支持的扩展存储器。存储器703提供存储空间,该存储空间存储了计算机设备的操作系统,可包括但不限于:android系统、ios系统、windows phone系统等等,本技术对此并不作限定。
[0112]
在本技术实施例中,处理器701通过运行存储器703中的可执行程序代码,执行如下操作:
[0113]
获取目标对象的歌声数据,并对所述歌声数据进行音域检测,得到所述目标对象的第一音域;获取待合成歌曲的初始曲谱信息,并根据所述初始曲谱信息获取所述待合成歌曲的第二音域;
[0114]
确定所述第一音域和所述第二音域之间的重合度比较结果;
[0115]
若所述重合度比较结果指示所述第一音域和所述第二音域不匹配,则对所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息;
[0116]
调用与所述目标对象相关联的声学合成模型,以使所述声学合成模型根据所述目标曲谱信息进行歌声数据合成处理,得到与所述目标对象和所述待合成歌曲相关联的合成歌声数据。
[0117]
在一种可能的实现方式中,所述处理器701确定所述第一音域和所述第二音域之间的重合度比较结果时,具体用于:
[0118]
根据所述第一音域确定所述目标对象的音高跨度值;
[0119]
根据所述第一音域和所述第二音域确定所述目标对象和所述待合成歌曲之间的交叉音高跨度值;
[0120]
根据所述交叉音高跨度值和所述目标对象的音高跨度值,确定所述第一音域和所述第二音域之间的重合度比较结果。
[0121]
在一种可能的实现方式中,所述处理器701根据所述第一音域和所述第二音域确定所述目标对象和所述待合成歌曲之间的交叉音高跨度值时,具体用于:
[0122]
根据所述第一音域确定所述目标对象的音高上限值,并根据所述第二音域确定所述待合成歌曲的音高上限值;
[0123]
若所述待合成歌曲的音高上限值小于所述目标对象的音高上限值,则确定所述待合成歌曲的音高上限值和所述目标对象的音高下限值之间的差值为交叉音高跨度值;
[0124]
若所述待合成歌曲的音高上限值大于或者等于所述目标对象的音高上限值,则确定所述目标对象的音高上限值和所述待合成歌曲的音高下限值之间的差值为交叉音高跨度值。
[0125]
在一种可能的实现方式中,所述处理器701根据所述交叉音高跨度值和所述目标对象的音高跨度值,确定所述第一音域和所述第二音域之间的重合度比较结果时,具体用于:
[0126]
确定所述交叉音高跨度值和所述目标对象的音高跨度值之间的比值,根据所述比值确定所述第一音域和所述第二音域之间的重合度比较结果。
[0127]
在一种可能的实现方式中,所述处理器701对所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息时,具体用于:
[0128]
根据所述第一音域确定所述目标对象的音高平均值,根据所述第二音域确定所述待合成歌曲的音高平均值;并根据所述目标对象的音高平均值和所述待合成歌曲的音高平均值确定偏离参数;
[0129]
将所述初始曲谱信息所包含的音高信息与所述偏离参数进行相加处理,得到目标曲谱信息。
[0130]
在一种可能的实现方式中,所述处理器701对所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息时,具体用于:
[0131]
获取参考音域,所述参考音域包括低音音域、中音音域和高音音域;
[0132]
根据所述低音音域的音高下限值和所述待合成歌曲的音高下限值确定第一音高调整参数,根据所述中音音域的音高下限值和所述待合成歌曲的音高下限值确定第二音高调整参数,根据所述高音音域的音高下限值和所述待合成歌曲的音高下限值确定第三音高调整参数;
[0133]
根据所述第一音高调整参数、所述第二音高调整参数以及所述第三音高调整参数对所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息。
[0134]
在一种可能的实现方式中,所述处理器701根据所述第一音高调整参数、所述第二音高调整参数以及所述第三音高调整参数对所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息时,具体用于:
[0135]
将所述初始曲谱信息所包含的音高信息与所述第一音高调整参数进行相加处理,得到第一曲谱信息,将所述初始曲谱信息所包含的音高信息与所述第二音高调整参数进行相加处理,得到第二曲谱信息,将所述初始曲谱信息所包含的音高信息与所述第三音高调整参数进行相加处理,得到第三曲谱信息;
[0136]
从所述第一曲谱信息、所述第二曲谱信息以及所述第三曲谱信息确定目标曲谱信息。
[0137]
在一种可能的实现方式中,所述处理器701从所述第一曲谱信息、所述第二曲谱信息以及所述第三曲谱信息确定目标曲谱信息时,具体用于:
[0138]
计算所述第一音域与所述第一曲谱信息所对应的音域之间的第一音域重合度,计算所述第一音域与所述第二曲谱信息所对应的音域之间的第二音域重合度,以及计算所述第一音域与所述第三曲谱信息所对应的音域之间的第三音域重合度;
[0139]
确定所述第一音域重合度、所述第二音域重合度以及所述第三音域重合度中的最大音域重合度;将所述最大音域重合度所对应的曲谱信息确定为目标曲谱信息,其中所述最大音域重合度所对应的曲谱信息为所述第一曲谱信息、所述第二曲谱信息或所述第三曲谱信息。
[0140]
根据本技术的一个方面,本技术实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中。处理器701从计算机可读存储介质中读取该计算机程序,处理器701执行该计算机程序,使得计算机设备700执行图2以及图4的歌声合成方法。
[0141]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可能可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本技术所必须的。
[0142]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可
以集成到另一个系统,或一些特征可以忽略,或不执行。
[0143]
以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以所述权利要求的保护范围为准。

技术特征:


1.一种歌声合成方法,其特征在于,所述方法包括:获取目标对象的歌声数据,并对所述歌声数据进行音域检测,得到所述目标对象的第一音域;获取待合成歌曲的初始曲谱信息,并根据所述初始曲谱信息获取所述待合成歌曲的第二音域;确定所述第一音域和所述第二音域之间的重合度比较结果;若所述重合度比较结果指示所述第一音域和所述第二音域不匹配,则对所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息;调用与所述目标对象相关联的声学合成模型,以使所述声学合成模型根据所述目标曲谱信息进行歌声数据合成处理,得到与所述目标对象和所述待合成歌曲相关联的合成歌声数据。2.根据权利要求1所述的方法,其特征在于,所述确定所述第一音域和所述第二音域之间的重合度比较结果,包括:根据所述第一音域确定所述目标对象的音高跨度值;根据所述第一音域和所述第二音域确定所述目标对象和所述待合成歌曲之间的交叉音高跨度值;根据所述交叉音高跨度值和所述目标对象的音高跨度值,确定所述第一音域和所述第二音域之间的重合度比较结果。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一音域和所述第二音域确定所述目标对象和所述待合成歌曲之间的交叉音高跨度值,包括:根据所述第一音域确定所述目标对象的音高上限值,并根据所述第二音域确定所述待合成歌曲的音高上限值;若所述待合成歌曲的音高上限值小于所述目标对象的音高上限值,则确定所述待合成歌曲的音高上限值和所述目标对象的音高下限值之间的差值为交叉音高跨度值;若所述待合成歌曲的音高上限值大于或者等于所述目标对象的音高上限值,则确定所述目标对象的音高上限值和所述待合成歌曲的音高下限值之间的差值为交叉音高跨度值。4.根据权利要求2所述的方法,其特征在于,所述根据所述交叉音高跨度值和所述目标对象的音高跨度值,确定所述第一音域和所述第二音域之间的重合度比较结果,包括:确定所述交叉音高跨度值和所述目标对象的音高跨度值之间的比值,根据所述比值确定所述第一音域和所述第二音域之间的重合度比较结果。5.根据权利要求1-4任一项所述的方法,其特征在于,所述对所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息,包括:根据所述第一音域确定所述目标对象的音高平均值,根据所述第二音域确定所述待合成歌曲的音高平均值;并根据所述目标对象的音高平均值和所述待合成歌曲的音高平均值确定偏离参数;将所述初始曲谱信息所包含的音高信息与所述偏离参数进行相加处理,得到目标曲谱信息。6.根据权利要求1-4任一项所述的方法,其特征在于,所述对所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息,包括:获取参考音域,所述参考音域包括低音音域、中音音域和高音音域;
根据所述低音音域的音高下限值和所述待合成歌曲的音高下限值确定第一音高调整参数,根据所述中音音域的音高下限值和所述待合成歌曲的音高下限值确定第二音高调整参数,根据所述高音音域的音高下限值和所述待合成歌曲的音高下限值确定第三音高调整参数;根据所述第一音高调整参数、所述第二音高调整参数以及所述第三音高调整参数对所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息。7.根据权利要求6所述的方法,其特征在于,所述根据所述第一音高调整参数、所述第二音高调整参数以及所述第三音高调整参数对所述初始曲谱信息的音高区间进行调整,得到目标曲谱信息,包括:将所述初始曲谱信息所包含的音高信息与所述第一音高调整参数进行相加处理,得到第一曲谱信息,将所述初始曲谱信息所包含的音高信息与所述第二音高调整参数进行相加处理,得到第二曲谱信息,将所述初始曲谱信息所包含的音高信息与所述第三音高调整参数进行相加处理,得到第三曲谱信息;从所述第一曲谱信息、所述第二曲谱信息以及所述第三曲谱信息确定目标曲谱信息。8.根据权利要求7所述的方法,其特征在于,所述从所述第一曲谱信息、所述第二曲谱信息以及所述第三曲谱信息确定目标曲谱信息,包括:计算所述第一音域与所述第一曲谱信息所对应的音域之间的第一音域重合度,计算所述第一音域与所述第二曲谱信息所对应的音域之间的第二音域重合度,以及计算所述第一音域与所述第三曲谱信息所对应的音域之间的第三音域重合度;确定所述第一音域重合度、所述第二音域重合度以及所述第三音域重合度中的最大音域重合度;将所述最大音域重合度所对应的曲谱信息确定为目标曲谱信息,其中所述最大音域重合度所对应的曲谱信息为所述第一曲谱信息、所述第二曲谱信息或所述第三曲谱信息。9.一种计算机设备,其特征在于,所述计算机设备包括:处理器,适于实现一条或多条计算机程序;以及,计算机存储介质,所述计算机存储介质存储有一条或多条计算机程序,所述一条或多条计算机程序适于由所述处理器加载并执行如权利要求1-8任一项所述的歌声合成方法。10.一种计算机可读存储介质,其特征在于,其特征在于,所述计算机存储介质存储有一条或多条计算机程序,所述一条或多条计算机程序适于由处理器加载并执行如权利要求1-8任一项所述的歌声合成方法。

技术总结


本申请公开了一种歌声合成方法、计算机设备及存储介质,该方法包括:获取目标对象的歌声数据,并对歌声数据进行音域检测,得到目标对象的第一音域;获取待合成歌曲的初始曲谱信息,并根据初始曲谱信息获取待合成歌曲的第二音域;确定第一音域和第二音域之间的重合度比较结果,若重合度比较结果指示第一音域和第二音域不匹配,则对初始曲谱信息的音高区间进行调整,得到目标曲谱信息,最后调用与目标对象相关联的声学合成模型根据目标曲谱信息进行歌声数据合成处理,得到与目标对象和待合成歌曲相关联的合成歌声数据。通过该方法,可以通过对待合成歌曲的曲谱进行调整,提高音域匹配度高,使得合成的合成歌声数据效果更好,听起来更为协调。来更为协调。来更为协调。


技术研发人员:

陈梦

受保护的技术使用者:

腾讯音乐娱乐科技(深圳)有限公司

技术研发日:

2022.10.31

技术公布日:

2023/2/3

本文发布于:2024-09-20 21:31:06,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/54838.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:音域   所述   音高   曲谱
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议