一种美声滤镜匹配方法与流程



1.本发明涉及声像处理领域,特别涉及一种美声滤镜匹配方法。


背景技术:



2.现有的卡拉ok效果,可供用户选择场景。一套场景是根据经验设置的一套效果参数组合。也有开放给用户的参数调节。但是可供切换的,都是效果处理过程,而不是最终听到的效果目标。但是一方面,预设的参数都是根据调音师的经验来手动调节的,风格和审美与人的关系很大,方向偏向固定风格。另一方面,用户切换的是效果处理过程,而不是最终效果的目标。为了达到最终效果,不同的声音需要不同的处理。


技术实现要素:



3.为解决现有技术中无法脱离调音师的经验,进行混响调节的技术问题,本发明提供一种美声滤镜匹配方法,包括:
4.获取目标音频;
5.将所述目标音频导入到预先构建的滤镜分析模型中,获取目标滤镜;
6.使用目标滤镜,对所述目标音频进行混响,以产生目标混响音频。
7.本技术方案,通过自动化的滤镜选择,针对用户的声音进行滤镜的选择以及应用,不依赖于调音师的经验,实现了一键美化效果;
8.优选地,还包括:构建所述滤镜分析模型,具体包括:
9.使用声源分离工具提取原声音数据中的混响人声数据;
10.对所述混响人声数据进行混响分离,以获取纯人声数据和混响数据;
11.对所述纯人声数据、所述混响数据进行分类训练,以获取多个歌手-人声统计结果和多个歌曲-混响统计结果;所述歌手-人声统计结果包括目标歌手的频谱分布、动态差分参数分布、效果声音量;所述歌曲-混响统计结果包括目标歌曲的混响频谱分布、混响时间和混响音量;
12.根据所述多个歌手-人声统计结果、所述多个歌曲-混响统计结果,进行聚类分析,以产生滤镜分析模型。
13.进一步优选地,所述混响分离具体包括:
14.使用线性预测编码进行混响分离,以获取纯人声数据和混响数据;
15.所述线性预测编码的代价函数为其中,r为冲激响应滤波器,o为所述冲激响应滤波器的阶数,n为所述冲激响应滤波器的长度。
16.进一步优选地,所述线性预测编码的冲激响应滤波器的长度为0.5秒。
17.进一步优选地,所述分类训练具体包括:
18.将所述纯人声数据按照预设的人声分块长度,划分为纯人声数据集;
19.将所述混响数据按照预设的混响分块长度,划分为混响数据集;
20.根据预先设置的人声统计算法,统计所述纯人声数据集,产生歌手-人声统计结果;
21.根据预先设置的混响统计算法,统计所述混响数据集,产生歌曲-混响统计结果。
22.进一步优选地,所述所述人声分块长度为0.5秒;
23.所述混响分块长度为0.5秒。
24.进一步优选地,所述人声统计算法具体包括:
25.获取目标歌手的所有人声分块;
26.获取所述所有人声分块中,所述目标歌手正在发声的人声分块,形成目标人声统计集;
27.对所述目标人声统计集的mfcc系数和分块平均音量、湿声部分平均音量进行统计,产生歌手-人声统计结果;
28.所述混响统计算法具体包括:
29.获取目标歌曲的所有混响分块,形成目标混响统计集;
30.对所述目标混响统计集的mfcc系数和分块平均音量、湿声部分平均音量进行统计,产生歌曲-混响统计结果。
31.进一步优选地,所述进行聚类分析具体包括:
32.具体包括:将所述多个歌手-人声统计结果、所述歌曲-混响统计结果导入到k均值算法中,以产生滤镜特征向量聚类簇集;
33.选取预设聚类簇选取数量个,所述滤镜特征向量聚类簇集中,特征向量数量最多的滤镜特征向量聚类簇,以产生滤镜分析模型;
34.进一步优选地,所述k均值算法的k值为2倍的所述预设聚类簇选取数量。
35.进一步优选地,将所述目标音频导入到预先构建的滤镜分析模型中具体包括:
36.将所述目标音频,按照预设的目标音频块长度,划分产生目标音频块集;
37.按照时间顺序排列所述目标音频块集,并使当前音频块mfcc系数等于目标音频块集的第一个所述目标音频块的mfcc系数;
38.依次统计所述目标音频块的mfcc系数,以更新所述当前音频块mfcc系数;当更新所述当前音频块mfcc系数时,所述所述当前音频块mfcc系数的变化量不高于1分贝。
39.本发明至少包括以下一项技术效果:
40.(1)通过自动化的滤镜选择,针对用户的声音进行滤镜的选择以及应用,不依赖于调音师的经验,实现了一键美化效果;
41.(2)通过对于mfcc系数更新变化的限制,实现了稳定的mfcc系数统计,减少噪音以及波动对于滤镜选取的干扰,提高了系统的可靠性与稳定性。
附图说明
42.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
43.图1为本发明实施例1的流程示意图;
44.图2为本发明实施例2的流程示意图;
45.图3为本发明实施例3的流程示意图;
46.图4为本发明实施例4的流程示意图;
47.图5为本发明实施例5的流程示意图;
48.图6为本发明实施例6的流程示意图;
49.图7为本发明线性预测编码的流程示意图。
具体实施方式
50.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其他实施例中也可以实现本技术。在其他情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
51.应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所述描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或集合的存在或添加。
52.为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘出了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
53.还应当进一步理解,在本技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
54.另外,在本技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
55.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
56.实施例1:
57.如图1所示,本实施例提供一种美声滤镜匹配方法,包括:
58.s1:获取目标音频;
59.s2:将所述目标音频导入到预先构建的滤镜分析模型中,获取目标滤镜;
60.s3:使用目标滤镜,对所述目标音频进行混响,以产生目标混响音频。
61.现有的卡拉ok效果,可供用户选择场景。一套场景是根据经验设置的一套效果参数组合。也有开放给用户的参数调节。但是可供切换的,都是效果处理过程,而不是最终听到的效果目标。但是一方面,预设的参数都是根据调音师的经验来手动调节的,风格和审美与人的关系很大,方向偏向固定风格。另一方面,用户切换的是效果处理过程,而不是最终效果的目标。为了达到最终效果,不同的声音需要不同的处理。
62.故在本实施例中,通过对商业音乐的大量学习,获取一系列针对不同音乐风格的特征性强烈的人声呈现方式打包成滤镜,在用户使用时,根据用户的实际情况,通过滤镜分
析模型,自动选择相应的滤镜,然后应用到目标音频上进行混响。使得在用户演唱歌曲时能实时获得显著的个性化声音美化效果,使得用户可以很方便的为自己的声音一键加上想要的个性化美化效果。
63.同时也可以根据实际的需要,在实际用户唱歌时,让用户选择对应的滤镜,根据用户的特点对用户的声音进行对应的处理。
64.本实施例,通过自动化的滤镜选择,针对用户的声音进行滤镜的选择以及应用,不依赖于调音师的经验,实现了一键美化效果。
65.实施例2:
66.如图2所示,本实施例提供一种美声滤镜匹配方法,包括:
67.s0-1:使用声源分离工具提取原声音数据中的混响人声数据;
68.s0-2:对所述混响人声数据进行混响分离,以获取纯人声数据和混响数据;
69.s0-3:对所述纯人声数据、所述混响数据进行分类训练,以获取多个歌手-人声统计结果和多个歌曲-混响统计结果;所述歌手-人声统计结果包括目标歌手的频谱分布、动态差分参数分布、效果声音量;所述歌曲-混响统计结果包括目标歌曲的混响频谱分布、混响时间和混响音量;
70.s0-4:根据所述多个歌手-人声统计结果、所述多个歌曲-混响统计结果,进行聚类分析,以产生滤镜分析模型。
71.s1:获取目标音频;
72.s2:将所述目标音频导入到预先构建的滤镜分析模型中,获取目标滤镜;
73.s3:使用目标滤镜,对所述目标音频进行混响,以产生目标混响音频。
74.在实施例中,一般通过s0-1到s0-4三步来实现对于滤镜分析模型的构建。具体而言,首先使用声源分离工具提取原声音数据中的混响人声数据,一般而言,原声音数据的公开的数据库,以及从正规渠道购买的商业mp3格式的音频数据,而从正规渠道购买的商业mp3格式的音频数据,一般先使用开源的深度学习声源分离工具,如sleepter,对原有音频数据进行人声提取。
75.一般而言,数据库会由不同风格、不同歌者的大量歌曲的纯人声部分,以及纯伴奏部分组成,从而满足滤镜分析模型构建的流程所需的数据。
76.在具体的模型构建过程中,因为本实施例的目的在于形成一个滤镜,也就是在唱歌过程中所需要的混响,故首先利用混响分离工具,将声音中的混响与人声进行分离,提取其中的混响,从而进行下一步的工作。然后再通过聚类分析方法,产生所需的滤镜分析模型,来选择使用哪种滤镜。
77.进一步优选地,所述混响分离具体包括:
78.s0-2-1:使用线性预测编码进行混响分离,以获取纯人声数据和混响数据;
79.如图7所示,所述线性预测编码的代价函数为其中,r为冲激响应滤波器,o为所述冲激响应滤波器的阶数,n为所述冲激响应滤波器的长度。
80.一般而言,使用lpc线性预测方法进行混响分离,由于人声已经整轨分离,所以在这一步处理不需要考虑因果性。只需要计算一个有限冲击响应的滤波器能将信号能量最小化即可。
81.对分离出来的纯人声数据v,需要最小化其中rv的能量。即求解r,使得代价函数为最小。这是一个标准的线性预测问题,使用标准的lpc线性预测方法就可以解出对应的r。解出来的rv为去相干化的原声,而v-rv为混响湿声。而r这个滤波器的脉冲响应就相当于混响的效果。
82.进一步优选地,所述线性预测编码的冲激响应滤波器的长度为0.5秒。
83.考虑到商业歌曲一般reverb不会太长,所以我们选用一个半秒长的滤波器r。对分离出来的人声信号v,我们要求最小化rv的能量。
84.实施例3:
85.如图3所示,本实施例提供一种美声滤镜匹配方法,包括:
86.s0-1:使用声源分离工具提取原声音数据中的混响人声数据;
87.s0-2-1:使用线性预测编码进行混响分离,以获取纯人声数据和混响数据;所述线性预测编码的代价函数为其中,r为冲激响应滤波器,o为所述冲激响应滤波器的阶数,n为所述冲激响应滤波器的长度;所述线性预测编码的冲激响应滤波器的长度为0.5秒。
88.s0-3-1:将所述纯人声数据按照预设的人声分块长度,划分为纯人声数据集;
89.s0-3-2:将所述混响数据按照预设的混响分块长度,划分为混响数据集;
90.s0-3-3:根据预先设置的人声统计算法,统计所述纯人声数据集,产生歌手-人声统计结果;
91.s0-3-4:根据预先设置的混响统计算法,统计所述混响数据集,产生歌曲-混响统计结果;
92.s0-4:根据所述多个歌手-人声统计结果、所述多个
·
歌曲-混响统计结果,进行聚类分析,以产生滤镜分析模型;
93.s1:获取目标音频;
94.s2:将所述目标音频导入到预先构建的滤镜分析模型中,获取目标滤镜;
95.s3:使用目标滤镜,对所述目标音频进行混响,以产生目标混响音频。
96.因为原数据已经按照歌手进行了归类,所以我们对每位歌手进行统计。假设每位歌手在演唱中的声音是相对一致的。对每位歌手的所有数据,进行分区块处理,同时对于每个歌曲的混响数据,也进行分区块处理,从而产生相应的纯人声数据集和混响数据集,并对原有的纯人声数据集和混响数据集进行聚类分析,进而产生相应的滤镜分析模型。
97.进一步优选地,所述所述人声分块长度为0.5秒;所述混响分块长度为0.5秒,从而与冲激响应滤波器的长度相适应。
98.进一步优选地,所述人声统计算法具体包括:对所述目标人声统计集的mfcc系数和分块平均音量、湿声部分平均音量进行统计,产生歌手-人声统计结果;所述混响统计算法具体包括:对所述目标混响统计集的mfcc系数和分块平均音量、湿声部分平均音量进行统计,产生歌曲-混响统计结果。
99.对纯人声数据集中的每一个分块,进行如下计算:
100.首先判断,是否有在唱歌,如果在唱歌,那么统计当前块的mfcc系数、并用使用平
方平均数表示当前块的音量,同时计算湿声部分的当前块音量。
101.然后再对所有该歌手的分块的mfcc和音量进行统计,进而得到这个歌手的频谱分布和动态范围分布,以及效果声音量。同时对每首歌,由于得到了混响响应r,故也统计混响的频谱分布,混响时间,以及混响音量,从而得到了对于混响的统计。
102.实施例4:
103.如图4所示,本实施例提供一种美声滤镜匹配方法,包括:
104.s0-1:使用声源分离工具提取原声音数据中的混响人声数据;
105.s0-2:对所述混响人声数据进行混响分离,以获取纯人声数据和混响数据;
106.s0-3:对所述纯人声数据、所述混响数据进行分类训练,以获取多个歌手-人声统计结果和多个歌曲-混响统计结果;所述歌手-人声统计结果包括目标歌手的频谱分布、动态差分参数分布、效果声音量;所述歌曲-混响统计结果包括目标歌曲的混响频谱分布、混响时间和混响音量;
107.s0-4-1:将所述多个歌手-人声统计结果、所述歌曲-混响统计结果导入到k均值算法中,以产生滤镜特征向量聚类簇集;
108.s0-4-2:选取预设聚类簇选取数量个,所述滤镜特征向量聚类簇集中,特征向量数量最多的滤镜特征向量聚类簇,以产生滤镜分析模型;
109.s1:获取目标音频;
110.s2:将所述目标音频导入到预先构建的滤镜分析模型中,获取目标滤镜;
111.s3:使用目标滤镜,对所述目标音频进行混响,以产生目标混响音频。
112.经过s0-3的过程,对每位歌手得到了一个音(频谱分布),动态音量分布,效果音量,混响音,混响长度的一个统计,即歌手-人声统计结果和歌曲-混响统计结果。然后对每位歌手,形成一个将上面所有的特征列成一个向量,为这个歌手的特征向量。然后使用k均值算法对其进行统计,最后得到特征向量的分布情况,即最后的滤镜分析模型,同时选取其中较为常用的数种滤镜,也就是数量较多的几个簇,在后续的业务过程中进行使用。
113.进一步优选地,所述k均值算法的k值为2倍的所述预设聚类簇选取数量。
114.在具体的k值的设定上,一般选取数量比较多的一半的簇,比如最终需要n个滤镜,则对所有歌手的特征向量,使用标准的k-mean方法进行无监督聚类,聚类成2n个类。选用其中元素最多的n个类,将特征的平均值作为n个滤镜的特征向量。
115.实施例5:
116.如图5所示,本实施例提供一种美声滤镜匹配方法,包括:
117.s1:获取目标音频;
118.s2-1:将所述目标音频,按照预设的目标音频块长度,划分产生目标音频块集;
119.s2-2:按照时间顺序排列所述目标音频块集,并使当前音频块mfcc系数等于目标音频块集的第一个所述目标音频块的mfcc系数;
120.s2-3:依次统计所述目标音频块的mfcc系数,以更新所述当前音频块mfcc系数;当更新所述当前音频块mfcc系数时,所述所述当前音频块mfcc系数的变化量不高于1分贝。
121.s3:使用目标滤镜,对所述目标音频进行混响,以产生目标混响音频。
122.在具体的使用过程中,通过内置的图形eq算法,将目标音频分成若干个频段,每个频段可以独立控制其增益,即在每个不同的频段,可以使用不同的滤镜。而频段的布置,与
mfcc系数的分频频段完全一致,长度均为0.5秒。
123.根据用户的演唱,实时统计用户的mfcc系数。同时为了保证用户音的稳定性,用户mfcc系统的统计,以每0.5秒最多1db的速度进行缓慢更新,这样在用户演唱了一段时间后,可以平滑的获取到了用户的mfcc系数,更为可靠。
124.本实施例通过对于mfcc系数更新变化的限制,实现了稳定的mfcc系数统计,减少噪音以及波动对于滤镜选取的干扰,提高了系统的可靠性与稳定性。
125.同时实时与特征向量中的mfcc系数进行比对,根据用户mfcc和目标mfcc的差调节图形eq的各段频段的增益。
126.同时,由于已经分离出当前风格的混响脉冲响应r,所以知道了当前风格需要多长时间的混响,即脉冲响应衰减到-60db的时间。当前混响的音量,即rv与v的音量比,当前混响的eq即r的频谱包络。而由于本混响算法,提供了混响长度,混响eq,混响音量的调节,故仅需要根据特征向量调节即可。
127.实施例6:
128.如图6所示,本实施例提供一种美声滤镜匹配方法,包括:
129.s0-1:使用声源分离工具提取原声音数据中的混响人声数据;
130.s0-2-1:使用线性预测编码进行混响分离,以获取纯人声数据和混响数据;所述线性预测编码的代价函数为其中,r为冲激响应滤波器,o为所述冲激响应滤波器的阶数,n为所述冲激响应滤波器的长度;所述线性预测编码的冲激响应滤波器的长度为0.5秒。
131.s0-3-1:将所述纯人声数据按照预设的人声分块长度,划分为纯人声数据集;
132.s0-3-2:将所述混响数据按照预设的混响分块长度,划分为混响数据集;
133.s0-3-3:根据预先设置的人声统计算法,统计所述纯人声数据集,产生歌手-人声统计结果;
134.s0-3-4:根据预先设置的混响统计算法,统计所述混响数据集,产生歌曲-混响统计结果;
135.所述歌手-人声统计结果包括目标歌手的频谱分布、动态差分参数分布、效果声音量;所述歌曲-混响统计结果包括目标歌曲的混响频谱分布、混响时间和混响音量;
136.s0-4-1:将所述多个歌手-人声统计结果、所述歌曲-混响统计结果导入到k均值算法中,以产生滤镜特征向量聚类簇集;
137.s0-4-2:选取预设聚类簇选取数量个,所述滤镜特征向量聚类簇集中,特征向量数量最多的滤镜特征向量聚类簇,以产生滤镜分析模型;所述k均值算法的k值为2倍的所述预设聚类簇选取数量。
138.s1:获取目标音频;
139.s2-1:将所述目标音频,按照预设的目标音频块长度,划分产生目标音频块集;
140.s2-2:按照时间顺序排列所述目标音频块集,并使当前音频块mfcc系数等于目标音频块集的第一个所述目标音频块的mfcc系数;
141.s2-3:依次统计所述目标音频块的mfcc系数,以更新所述当前音频块mfcc系数;当更新所述当前音频块mfcc系数时,所述所述当前音频块mfcc系数的变化量不高于1分贝。
142.s3:使用目标滤镜,对所述目标音频进行混响,以产生目标混响音频。
143.本发明通过上述实施例,实现了:
144.(1)通过自动化的滤镜选择,针对用户的声音进行滤镜的选择以及应用,不依赖于调音师的经验,实现了一键美化效果;
145.(2)通过对于mfcc系数更新变化的限制,实现了稳定的mfcc系数统计,减少噪音以及波动对于滤镜选取的干扰,提高了系统的可靠性与稳定性。
146.尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
147.显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

技术特征:


1.一种美声滤镜匹配方法,其特征在于,包括:获取目标音频;将所述目标音频导入到预先构建的滤镜分析模型中,获取目标滤镜;使用目标滤镜,对所述目标音频进行混响,以产生目标混响音频。2.根据权利要求1所述的一种美声滤镜匹配方法,其特征在于,还包括:构建所述滤镜分析模型,具体包括:使用声源分离工具提取原声音数据中的混响人声数据;对所述混响人声数据进行混响分离,以获取纯人声数据和混响数据;对所述纯人声数据、所述混响数据进行分类训练,以获取多个歌手-人声统计结果和多个歌曲-混响统计结果;所述歌手-人声统计结果包括目标歌手的频谱分布、动态差分参数分布、效果声音量;所述歌曲-混响统计结果包括目标歌曲的混响频谱分布、混响时间和混响音量;根据所述多个歌手-人声统计结果、所述多个歌曲-混响统计结果,进行聚类分析,以产生滤镜分析模型。3.根据权利要求2所述的一种美声滤镜匹配方法,其特征在于,所述混响分离具体包括:使用线性预测编码进行混响分离,以获取纯人声数据和混响数据;所述线性预测编码的代价函数为其中,r为冲激响应滤波器,o为所述冲激响应滤波器的阶数,n为所述冲激响应滤波器的长度。4.根据权利要求2所述的一种美声滤镜匹配方法,其特征在于,所述线性预测编码的冲激响应滤波器的长度为0.5秒。5.根据权利要求2或者4所述的一种美声滤镜匹配方法,其特征在于,所述分类训练具体包括:将所述纯人声数据按照预设的人声分块长度,划分为纯人声数据集;将所述混响数据按照预设的混响分块长度,划分为混响数据集;根据预先设置的人声统计算法,统计所述纯人声数据集,产生歌手-人声统计结果;根据预先设置的混响统计算法,统计所述混响数据集,产生歌曲-混响统计结果。6.根据权利要求5所述的一种美声滤镜匹配方法,其特征在于,所述所述人声分块长度为0.5秒;所述混响分块长度为0.5秒。7.根据权利要求5或者6所述的一种美声滤镜匹配方法,其特征在于,所述人声统计算法具体包括:获取目标歌手的所有人声分块;获取所述所有人声分块中,所述目标歌手正在发声的人声分块,形成目标人声统计集;对所述目标人声统计集的mfcc系数和分块平均音量、湿声部分平均音量进行统计,产生歌手-人声统计结果;所述混响统计算法具体包括:获取目标歌曲的所有混响分块,形成目标混响统计集;
对所述目标混响统计集的mfcc系数和分块平均音量、湿声部分平均音量进行统计,产生歌曲-混响统计结果。8.根据权利要求2所述的一种美声滤镜匹配方法,其特征在于,所述进行聚类分析具体包括:具体包括:将所述多个歌手-人声统计结果、所述歌曲-混响统计结果导入到k均值算法中,以产生滤镜特征向量聚类簇集;选取预设聚类簇选取数量个,所述滤镜特征向量聚类簇集中,特征向量数量最多的滤镜特征向量聚类簇,以产生滤镜分析模型。9.根据权利要求8所述的一种美声滤镜匹配方法,其特征在于,所述k均值算法的k值为2倍的所述预设聚类簇选取数量。10.根据权利要求1所述的一种美声滤镜匹配方法,其特征在于,将所述目标音频导入到预先构建的滤镜分析模型中具体包括:将所述目标音频,按照预设的目标音频块长度,划分产生目标音频块集;按照时间顺序排列所述目标音频块集,并使当前音频块mfcc系数等于目标音频块集的第一个所述目标音频块的mfcc系数;依次统计所述目标音频块的mfcc系数,以更新所述当前音频块mfcc系数;当更新所述当前音频块mfcc系数时,所述所述当前音频块mfcc系数的变化量不高于1分贝。

技术总结


本发明公开了一种美声滤镜匹配方法,包括:获取目标音频;将所述目标音频导入到预先构建的滤镜分析模型中,获取目标滤镜;使用目标滤镜,对所述目标音频进行混响,以产生目标混响音频。本发明的技术效果:通过自动化的滤镜选择,针对用户的声音进行滤镜的选择以及应用,不依赖于调音师的经验,实现了一键美化效果。果。果。


技术研发人员:

陈洁珺 王小虎

受保护的技术使用者:

上海炉石信息科技有限公司

技术研发日:

2022.04.21

技术公布日:

2022/7/12

本文发布于:2024-09-22 07:20:37,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/12627.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:混响   所述   滤镜   人声
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议