语音评估方法、装置及电子设备与流程



1.本发明涉及人工智能技术领域,尤其涉及一种语音评估方法、装置及电子设备。


背景技术:



2.在模型训练的过程中需要大量的干净数据作为训练样本。干净数据是指理论上没有噪声的语音数据。语音数据的噪声越小,则语音的干净程度越高,越适合作为模型训练的干净数据。目前通过在安静环境下录制语音获得用于模型训练的干净数据。为避免录制的语音的干净程度较低,通常是播放录制的语音,由人耳判定语音的干净程度,语音评估的效率较低。


技术实现要素:



3.本公开实施例提供一种语音评估方法、装置及电子设备,以解决现有技术中由人耳判定语音的干净程度导致的语音评估的效率较低的问题。
4.为了解决上述技术问题,本发明是这样实现的:
5.第一方面,本公开实施例提供了一种语音评估方法,所述方法包括:
6.对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段;
7.基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,所述至少一个评估指标值用于指示所述待评估语音中的干净语音在所述待评估语音中的能量占比;
8.基于所述至少一个评估指标值确定所述待评估语音的语音干净程度。
9.第二方面,本公开实施例提供了一种语音评估装置,所述装置包括:
10.分割模块,用于对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段;
11.第一确定模块,用于基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,所述至少一个评估指标值用于指示所述待评估语音中的干净语音在所述待评估语音中的能量占比;
12.第二确定模块,用于基于所述至少一个评估指标值确定所述待评估语音的语音干净程度。
13.第三方面,本公开实施例提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如第一方面所述的语音评估方法中的步骤。
14.第四方面,本公开实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的语音评估方法中的步骤。
15.在本公开实施例中,对待评估语音进行语音分割,得到所述待评估语音对应的第
一语音段和第一非语音段;基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,所述至少一个评估指标值用于指示所述待评估语音中的干净语音在所述待评估语音中的能量占比;基于所述至少一个评估指标值确定所述待评估语音的语音干净程度。这样,通过所述至少一个评估指标值确定所述待评估语音的语音干净程度,能够实现语音干净程度的自动评估,从而能够提高语音评估的效率,且能够提高语音评估的准确性。
附图说明
16.为了更清楚地说明本公开实施例的技术方案,下面将对本公开实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
17.图1是本公开实施例提供的一种语音评估方法的流程图;
18.图2是本公开实施例提供的一种语音评估装置的结构示意图;
19.图3是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
20.下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
21.在本公开实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载移动终端、可穿戴设备、以及计步器等。
22.参见图1,图1是本公开实施例提供的一种语音评估方法的流程图,如图1所示,包括以下步骤:
23.步骤101、对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段。
24.其中,待评估语音对应的第一语音段可以包括对待评估语音进行语音分割得到的至少一个语音段。待评估语音对应的第一非语音段可以包括对待评估语音进行语音分割得到的至少一个非语音段。
25.一种实施方式中,待评估语音对应的第一语音段可以包括对待评估语音进行语音分割得到的全部语音段。待评估语音对应的第一非语音段可以包括对待评估语音进行语音分割得到的全部非语音段。
26.一种实施方式中,可以确定待评估语音的帧长及帧移等,对待评估语音进行分帧,在分帧后,可以采用语音活动检测(voice activity detection,vad)算法对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段。
27.步骤102、基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,所述至少一个评估指标值用于指示所述待评估语音中的干净语音在所述待评估语音中的能量占比。
28.其中,所述至少一个评估指标值可以包括第一评估指标值、第二评估指标值、第三
评估指标值及第四评估指标值中的一项或多项。所述第一评估指标值基于第二语音段确定,所述第二语音段基于所述第一语音段进行低通滤波处理后获得。所述第二评估指标值基于第二非语音段确定,所述第二非语音段基于所述第一非语音段进行低通滤波处理后获得。所述第三评估指标值基于所述第一语音段的基频及所述基频的倍频对应的数据点确定。所述第四评估指标值基于所述第一语音段的能量值与所述第一非语音段的能量值确定。
29.步骤103、基于所述至少一个评估指标值确定所述待评估语音的语音干净程度。
30.其中,所述至少一个评估指标值越大,则待评估语音的语音干净程度越高。
31.需要说明的是,目前针对语音的模型训练方法中,通常使用的是监督训练的方法,而监督训练中干净数据的选择对模型的效果有着十分重要的作用,可以直接影响模型的效果。语音数据的噪声越小,则语音的干净程度越高,越适合作为模型训练的干净数据。
32.一种实施方式中,所述至少一个评估指标值可以包括第一评估指标值、第二评估指标值、第三评估指标值及第四评估指标值,可以将满足第一评估指标值大于第一预设阈值、第二评估指标值大于第二预设阈值、第三评估指标值大于第三预设阈值且第四评估指标值大于第四预设阈值的待评估数据用于模型训练,能够提高模型训练的效果。该第一预设阈值、第二预设阈值、第三预设阈值及第四预设阈值可以按照实际需求设置。
33.在本公开实施例中,对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段;基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,所述至少一个评估指标值用于指示所述待评估语音中的干净语音在所述待评估语音中的能量占比;基于所述至少一个评估指标值确定所述待评估语音的语音干净程度。这样,通过所述至少一个评估指标值确定所述待评估语音的语音干净程度,能够实现语音干净程度的自动评估,从而能够提高语音评估的效率,且能够提高语音评估的准确性。
34.可选地,所述至少一个评估指标值包括如下至少一项:
35.第一评估指标值;
36.第二评估指标值;
37.第三评估指标值;
38.第四评估指标值;
39.其中,所述第一评估指标值基于第二语音段确定,所述第二语音段基于所述第一语音段进行低通滤波处理后获得;
40.所述第二评估指标值基于第二非语音段确定,所述第二非语音段基于所述第一非语音段进行低通滤波处理后获得;
41.所述第三评估指标值基于所述第一语音段的基频及所述基频的倍频对应的数据点确定;
42.所述第四评估指标值基于所述第一语音段的能量值与所述第一非语音段的能量值确定。
43.其中,第一评估指标值可以为第二语音段的能量均值与待评估语音的能量均值的比值;或者,第一评估指标值可以为第二语音段的能量均值与第三语音段的能量均值的比值,第三语音段基于所述第一语音段进行高通滤波处理后获得;或者,第一评估指标值可以为第二语音段的能量均值;等等。本实施例对此不进行限定。
44.另外,第二评估指标值可以为第二非语音段的能量均值与待评估语音的能量均值的比值;或者,第二评估指标值可以为第二非语音段的能量均值与第三非语音段的能量均值的比值,第三非语音段基于所述第一非语音段进行高通滤波处理后获得;或者,第二评估指标值可以为第二非语音段的能量均值;等等。本实施例对此不进行限定。
45.另外,第三评估指标值可以为第一语音段的基频及所述基频的倍频对应的第一数据点的能量均值与待评估语音的能量均值的比值;或者,第三评估指标值可以为第一数据点的能量均值与第二数据点的能量均值的比值,第二数据点为所述第一语音段中除所述第一数据点外的第二数据点;或者,第三评估指标值可以为第一数据点的能量均值;等等。本实施例对此不进行限定。
46.另外,第四评估指标值可以是所述第一语音段的能量值与所述第一非语音段的能量值的比值;或者,第四评估指标值可以是所述第一语音段的能量均值与所述第一非语音段的能量均值的比值;等等。本实施例对此不进行限定。
47.该实施方式中,通过第一评估指标值、第二评估指标值、第三评估指标值及第四评估指标值中的至少一项,能够从一个或多个维度评估待评估语音的语音干净程度,从而能够提高语音评估的准确性。
48.可选地,所述基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,包括:
49.对所述第一语音段进行低通滤波处理,得到第二语音段;
50.对所述第一语音段进行高通滤波处理,得到第三语音段;
51.确定第一比值,所述第一比值为所述第二语音段的能量均值与所述第三语音段的能量均值的比值;
52.其中,所述至少一个评估指标值包括第一评估指标值,所述第一评估指标值为所述第一比值。
53.另外,第二语音段可以包括多个第三数据点。第二语音段的能量均值可以是多个第三数据点的幅值的平方的均值;或者第二语音段的能量均值可以通过如下获得:确定每个第三数据点的幅值与第一幅值均值的差值,计算每个第三数据点对应的差值的平方值,将多个第三数据点对应的平方值的均值作为第二语音段的能量均值,第一幅值均值为该多个第三数据点的幅值的均值。示例地,第二语音段的能量均值lspeech可以通过如下计算公式获得:
[0054][0055]
其中,xi为第i个第三数据点的幅值与第一幅值均值的差值,m为第二语音段包括的第三数据点的数据点个数。
[0056]
另外,第三语音段可以包括多个第四数据点。第三语音段的能量均值可以是多个第四数据点的幅值的平方的均值;或者第三语音段的能量均值可以通过如下获得:确定每个第四数据点的幅值与第二幅值均值的差值,计算每个第四数据点对应的差值的平方值,将多个第四数据点对应的平方值的均值作为第三语音段的能量均值,第二幅值均值为该多个第四数据点的幅值的均值。示例地,第三语音段的能量均值hspeech可以通过如下计算公式获得:
[0057][0058]
其中,xi为第i个第四数据点的幅值与第二幅值均值的差值,m为第三语音段包括的第四数据点的数据点个数。
[0059]
需要说明的是,本实施例对高通滤波及低通滤波的滤波截止频率不进行限定。示例地,滤波截止频率可以为3khz,高通滤波即滤除3khz以下的信号,低通滤波即滤除3khz以上的信号。
[0060]
该实施方式中,对所述第一语音段进行低通滤波处理,得到第二语音段;对所述第一语音段进行高通滤波处理,得到第三语音段;确定第一比值,所述第一比值为所述第二语音段的能量均值与所述第三语音段的能量均值的比值;其中,所述至少一个评估指标值包括第一评估指标值,所述第一评估指标值为所述第一比值。这样,由于低通滤波处理能够滤除高频噪声,高通滤波处理能够滤除低频信号,保留高频噪声,从而第一比值能够反映待评估语音的语音干净程度,在第一比值较大时,待评估语音的语音干净程度越高。从待评估语音的语音段的维度,通过第一比值确定待评估语音的语音干净程度,能够提高语音评估的效率,且能够提高语音评估的准确性。
[0061]
可选地,所述基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,包括:
[0062]
对所述第一非语音段进行低通滤波处理,得到第二非语音段;
[0063]
对所述第一非语音段进行高通滤波处理,得到第三非语音段;
[0064]
确定第二比值,所述第二比值为所述第二非语音段的能量均值与所述第三非语音段的能量均值的比值;
[0065]
其中,所述至少一个评估指标值包括第二评估指标值,所述第二评估指标值为所述第二比值。
[0066]
另外,第二非语音段可以包括多个第五数据点。第二非语音段的能量均值可以是多个第五数据点的幅值的平方的均值;或者第二非语音段的能量均值可以通过如下获得:确定每个第五数据点的幅值与第三幅值均值的差值,计算每个第五数据点对应的差值的平方值,将多个第五数据点对应的平方值的均值作为第二非语音段的能量均值,第三幅值均值为该多个第五数据点的幅值的均值。示例地,第二非语音段的能量均值lnoise可以通过如下计算公式获得:
[0067][0068]
其中,xi为第i个第五数据点的幅值与第三幅值均值的差值,m为第二非语音段包括的第五数据点的数据点个数。
[0069]
另外,第三非语音段可以包括多个第六数据点。第三非语音段的能量均值可以是多个第六数据点的幅值的平方的均值;或者第三非语音段的能量均值可以通过如下获得:确定每个第六数据点的幅值与第四幅值均值的差值,计算每个第六数据点对应的差值的平方值,将多个第六数据点对应的平方值的均值作为第三非语音段的能量均值,第四幅值均值为该多个第六数据点的幅值的均值。示例地,第三非语音段的能量均值hnoise可以通过如下计算公式获得:
[0070][0071]
其中,xi为第i个第六数据点的幅值与第四幅值均值的差值,m为第三非语音段包括的第六数据点的数据点个数。
[0072]
该实施方式中,对所述第一非语音段进行低通滤波处理,得到第二非语音段;对所述第一非语音段进行高通滤波处理,得到第三非语音段;确定第二比值,所述第二比值为所述第二非语音段的能量均值与所述第三非语音段的能量均值的比值;其中,所述至少一个评估指标值包括第二评估指标值,所述第二评估指标值为所述第二比值。这样,由于低通滤波处理能够滤除高频噪声,高通滤波处理能够滤除低频信号,保留高频噪声,从而第二比值能够反映待评估语音的语音干净程度,在第二比值较大时,待评估语音的语音干净程度越高。从待评估语音的非语音段的维度,通过第二比值确定待评估语音的语音干净程度,能够提高语音评估的效率,且能够提高语音评估的准确性。
[0073]
可选地,所述基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,包括:
[0074]
确定所述第一语音段中的第一数据点,所述第一数据点为所述第一语音段的基频及所述基频的倍频对应的数据点;
[0075]
确定第二数据点,所述第二数据点为所述第一语音段中除所述第一数据点外的数据点;
[0076]
确定第三比值,所述第三比值为所述第一数据点的能量均值与所述第二数据点的能量均值的比值;
[0077]
其中,所述至少一个评估指标值包括第三评估指标值,所述第三评估指标值为所述第三比值。
[0078]
以第一语音段的基频为65hz为例,基频的倍频为2*65hz,3*65hz,4*65hz..;等等,第一数据点为第一语音段中65hz,2*65hz,3*65hz,4*65hz,...,等频率所在的数据点。
[0079]
需要说明的是,确定第一数据点的方式可以如下:可以获取第一语音段的频谱,频谱的谱号为:0,1,2,3,4,...,256。频谱的谱号对应的频率为:0*32.5,1*32.5,....,256*32.5hz。假设基频为65hz,倍频为:2*65,3*65,...,等,则可以获取对应谱号为:65/32.5=2,2*65/32.5=4,3*65/32.5=6,

,等谱号处的点作为第一数据点。
[0080]
另外,第一数据点的数据点个数可以为多个。第一数据点的能量均值可以是第一语音段中的第一数据点的幅值的平方的均值;或者第一数据点的能量均值可以通过如下获得:确定每个第一数据点的幅值与第五幅值均值的差值,计算每个第一数据点对应的差值的平方值,将第一语音段中的第一数据点对应的平方值的均值作为第一数据点的能量均值,第五幅值均值为第一语音段中的第一数据点的幅值的均值。示例地,第一数据点的能量均值eb可以通过如下计算公式获得:
[0081][0082]
其中,xi为第i个第一数据点的幅值与第五幅值均值的差值,m为第一语音段包括的第一数据点的数据点个数。
[0083]
另外,第二数据点的数据点个数可以为多个。第二数据点的能量均值可以是第一
语音段中的第二数据点的幅值的平方的均值;或者第二数据点的能量均值可以通过如下获得:确定每个第二数据点的幅值与第六幅值均值的差值,计算每个第二数据点对应的差值的平方值,将第一语音段中的第二数据点对应的平方值的均值作为第二数据点的能量均值,第六幅值均值为第一语音段中的第二数据点的幅值的均值。示例地,第二数据点的能量均值eo可以通过如下计算公式获得:
[0084][0085]
其中,xi为第i个第二数据点的幅值与第六幅值均值的差值,m为第一语音段包括的第二数据点的数据点个数。
[0086]
该实施方式中,确定所述第一语音段中的第一数据点,所述第一数据点为所述第一语音段的基频及所述基频的倍频对应的数据点;确定第二数据点,所述第二数据点为所述第一语音段中除所述第一数据点外的数据点;确定第三比值,所述第三比值为所述第一数据点的能量均值与所述第二数据点的能量均值的比值;其中,所述至少一个评估指标值包括第三评估指标值,所述第三评估指标值为所述第三比值。这样,由于基频及所述基频的倍频对应的第一数据点大概率为干净数据,第二数据点大概率为噪声数据,从而第三比值能够反映待评估语音的语音干净程度,在第三比值较大时,待评估语音的语音干净程度越高。从待评估语音的频率维度,通过第三比值确定待评估语音的语音干净程度,能够提高语音评估的效率,且能够提高语音评估的准确性。
[0087]
可选地,所述基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,包括:
[0088]
分别获取所述第一语音段的能量均值与所述第一非语音段的能量均值;
[0089]
确定第四比值,所述第四比值为所述第一语音段的能量均值与所述第一非语音段的能量均值的比值;
[0090]
其中,所述至少一个评估指标值包括第四评估指标值,所述第四评估指标值为所述第四比值。
[0091]
另外,第一语音段可以包括多个第七数据点。第一语音段的能量均值可以是多个第七数据点的幅值的平方的均值;或者第一语音段的能量均值可以通过如下获得:确定每个第七数据点的幅值与第七幅值均值的差值,计算每个第七数据点对应的差值的平方值,将多个第七数据点对应的平方值的均值作为第一语音段的能量均值,第七幅值均值为该多个第七数据点的幅值的均值。示例地,第一语音段的能量均值espeech可以通过如下计算公式获得:
[0092][0093]
其中,xi为第i个第七数据点的幅值与第七幅值均值的差值,m为第一语音段包括的第七数据点的数据点个数。
[0094]
另外,第一非语音段可以包括多个第八数据点。第一非语音段的能量均值可以是多个第八数据点的幅值的平方的均值;或者第一非语音段的能量均值可以通过如下获得:确定每个第八数据点的幅值与第八幅值均值的差值,计算每个第八数据点对应的差值的平方值,将多个第八数据点对应的平方值的均值作为第一非语音段的能量均值,第八幅值均
值为该多个第八数据点的幅值的均值。示例地,第一非语音段的能量均值enoise可以通过如下计算公式获得:
[0095][0096]
其中,xi为第i个第八数据点的幅值与第八幅值均值的差值,m为第一非语音段包括的第八数据点的数据点个数。
[0097]
该实施方式中,分别获取所述第一语音段的能量均值与所述第一非语音段的能量均值;确定第四比值,所述第四比值为所述第一语音段的能量均值与所述第一非语音段的能量均值的比值;其中,所述至少一个评估指标值包括第四评估指标值,所述第四评估指标值为所述第四比值。这样,通过第四比值能够反映待评估语音的语音干净程度,在第四比值较大时,待评估语音的语音干净程度越高,能够提高语音评估的效率,且能够提高语音评估的准确性。
[0098]
可选地,所述基于所述至少一个评估指标值确定所述待评估语音的语音干净程度,包括:
[0099]
获取第一权重值、第二权重值、第三权重值及第四权重值;
[0100]
基于所述第一评估指标值与第一权重的乘积、所述第二评估指标值与第二权重值的乘积、所述第三评估指标值与第三权重值的乘积以及所述第四评估指标值与第四权重值的乘积确定目标评估指标值;
[0101]
基于所述目标评估指标值确定所述待评估语音的语音干净程度。
[0102]
其中,第一权重值、第二权重值、第三权重值及第四权重值均可以预先设置。示例地,第一权重值可以设为0.3,第二权重值可以设为0.2,第三权重值可以设为0.3,第四权重值可以设为0.2;或者,第一权重值可以设为5,第二权重值可以设为4,第三权重值可以设为2,第四权重值可以设为2;或者,第一权重值可以设为30,第二权重值可以设为28,第三权重值可以设为21,第四权重值可以设为10;等等,本实施例对此不进行限定。
[0103]
一种实施方式中,第一权重值、第二权重值、第三权重值及第四权重值的和值可以为1。
[0104]
一种实施方式中,目标评估指标值q=a*js+b*jn+c*jf+d*je,其中,js为第一比值,jn为第二比值,jf为第三比值,je为第四比值,a为第一权重值,b为第二权重值,c为第三权重值,d为第四权重值。
[0105]
另外,目标评估指标值越大,则表征待评估语音的语音干净程度越高。可以将目标评估指标值大于预设阈值的待评估数据用于模型训练,能够提高模型训练的效果。该预设阈值可以按照实际需求设置。
[0106]
该实施方式中,基于所述第一评估指标值与第一权重的乘积、所述第二评估指标值与第二权重值的乘积、所述第三评估指标值与第三权重值的乘积以及所述第四评估指标值与第四权重值的乘积确定目标评估指标值;基于所述目标评估指标值确定所述待评估语音的语音干净程度。这样,从多个维度综合评估待评估语音的语音干净程度,能够更全面、更准确地对待评估语音的语音干净程度进行评估。
[0107]
参见图2,图2是本公开实施例提供的一种语音评估装置的结构示意图,如图2所示,语音评估装置200包括:
[0108]
分割模块201,用于对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段;
[0109]
第一确定模块202,用于基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,所述至少一个评估指标值用于指示所述待评估语音中的干净语音在所述待评估语音中的能量占比;
[0110]
第二确定模块203,用于基于所述至少一个评估指标值确定所述待评估语音的语音干净程度。
[0111]
可选地,所述至少一个评估指标值包括如下至少一项:
[0112]
第一评估指标值;
[0113]
第二评估指标值;
[0114]
第三评估指标值;
[0115]
第四评估指标值;
[0116]
其中,所述第一评估指标值基于第二语音段确定,所述第二语音段基于所述第一语音段进行低通滤波处理后获得;
[0117]
所述第二评估指标值基于第二非语音段确定,所述第二非语音段基于所述第一非语音段进行低通滤波处理后获得;
[0118]
所述第三评估指标值基于所述第一语音段的基频及所述基频的倍频对应的数据点确定;
[0119]
所述第四评估指标值基于所述第一语音段的能量值与所述第一非语音段的能量值确定。
[0120]
可选地,所述第一确定模块具体用于:
[0121]
对所述第一语音段进行低通滤波处理,得到第二语音段;
[0122]
对所述第一语音段进行高通滤波处理,得到第三语音段;
[0123]
确定第一比值,所述第一比值为所述第二语音段的能量均值与所述第三语音段的能量均值的比值;
[0124]
其中,所述至少一个评估指标值包括第一评估指标值,所述第一评估指标值为所述第一比值。
[0125]
可选地,所述第一确定模块具体用于:
[0126]
对所述第一非语音段进行低通滤波处理,得到第二非语音段;
[0127]
对所述第一非语音段进行高通滤波处理,得到第三非语音段;
[0128]
确定第二比值,所述第二比值为所述第二非语音段的能量均值与所述第三非语音段的能量均值的比值;
[0129]
其中,所述至少一个评估指标值包括第二评估指标值,所述第二评估指标值为所述第二比值。
[0130]
可选地,所述第一确定模块具体用于:
[0131]
确定所述第一语音段中的第一数据点,所述第一数据点为所述第一语音段的基频及所述基频的倍频对应的数据点;
[0132]
确定第二数据点,所述第二数据点为所述第一语音段中除所述第一数据点外的数据点;
[0133]
确定第三比值,所述第三比值为所述第一数据点的能量均值与所述第二数据点的能量均值的比值;
[0134]
其中,所述至少一个评估指标值包括第三评估指标值,所述第三评估指标值为所述第三比值。
[0135]
可选地,所述第一确定模块具体用于:
[0136]
分别获取所述第一语音段的能量均值与所述第一非语音段的能量均值;
[0137]
确定第四比值,所述第四比值为所述第一语音段的能量均值与所述第一非语音段的能量均值的比值;
[0138]
其中,所述至少一个评估指标值包括第四评估指标值,所述第四评估指标值为所述第四比值。
[0139]
可选地,所述第一确定模块具体用于:
[0140]
获取第一权重值、第二权重值、第三权重值及第四权重值;
[0141]
基于所述第一评估指标值与第一权重的乘积、所述第二评估指标值与第二权重值的乘积、所述第三评估指标值与第三权重值的乘积以及所述第四评估指标值与第四权重值的乘积确定目标评估指标值;
[0142]
基于所述目标评估指标值确定所述待评估语音的语音干净程度。
[0143]
语音评估装置能够实现图1的方法实施例中实现的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0144]
如图3所示,本公开实施例还提供了一种电子设备300,包括:存储器302、处理器301及存储在所述存储器302上并可在所述处理器301上运行的程序,所述程序被所述处理器301执行时实现上述语音评估方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0145]
本公开实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述语音评估方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等。
[0146]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0147]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本公开各个实施例所述的方法。
[0148]
上面结合附图对本公开的实施例进行了描述,但是本发明并不局限于上述的具体
实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

技术特征:


1.一种语音评估方法,其特征在于,所述方法包括:对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段;基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,所述至少一个评估指标值用于指示所述待评估语音中的干净语音在所述待评估语音中的能量占比;基于所述至少一个评估指标值确定所述待评估语音的语音干净程度。2.根据权利要求1所述的方法,其特征在于,所述至少一个评估指标值包括如下至少一项:第一评估指标值;第二评估指标值;第三评估指标值;第四评估指标值;其中,所述第一评估指标值基于第二语音段确定,所述第二语音段基于所述第一语音段进行低通滤波处理后获得;所述第二评估指标值基于第二非语音段确定,所述第二非语音段基于所述第一非语音段进行低通滤波处理后获得;所述第三评估指标值基于所述第一语音段的基频及所述基频的倍频对应的数据点确定;所述第四评估指标值基于所述第一语音段的能量值与所述第一非语音段的能量值确定。3.根据权利要求1或2所述的方法,其特征在于,所述基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,包括:对所述第一语音段进行低通滤波处理,得到第二语音段;对所述第一语音段进行高通滤波处理,得到第三语音段;确定第一比值,所述第一比值为所述第二语音段的能量均值与所述第三语音段的能量均值的比值;其中,所述至少一个评估指标值包括第一评估指标值,所述第一评估指标值为所述第一比值。4.根据权利要求1或2所述的方法,其特征在于,所述基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,包括:对所述第一非语音段进行低通滤波处理,得到第二非语音段;对所述第一非语音段进行高通滤波处理,得到第三非语音段;确定第二比值,所述第二比值为所述第二非语音段的能量均值与所述第三非语音段的能量均值的比值;其中,所述至少一个评估指标值包括第二评估指标值,所述第二评估指标值为所述第二比值。5.根据权利要求1或2所述的方法,其特征在于,所述基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,包括:确定所述第一语音段中的第一数据点,所述第一数据点为所述第一语音段的基频及所
述基频的倍频对应的数据点;确定第二数据点,所述第二数据点为所述第一语音段中除所述第一数据点外的数据点;确定第三比值,所述第三比值为所述第一数据点的能量均值与所述第二数据点的能量均值的比值;其中,所述至少一个评估指标值包括第三评估指标值,所述第三评估指标值为所述第三比值。6.根据权利要求1或2所述的方法,其特征在于,所述基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,包括:分别获取所述第一语音段的能量均值与所述第一非语音段的能量均值;确定第四比值,所述第四比值为所述第一语音段的能量均值与所述第一非语音段的能量均值的比值;其中,所述至少一个评估指标值包括第四评估指标值,所述第四评估指标值为所述第四比值。7.根据权利要求2所述的方法,其特征在于,所述基于所述至少一个评估指标值确定所述待评估语音的语音干净程度,包括:获取第一权重值、第二权重值、第三权重值及第四权重值;基于所述第一评估指标值与第一权重的乘积、所述第二评估指标值与第二权重值的乘积、所述第三评估指标值与第三权重值的乘积以及所述第四评估指标值与第四权重值的乘积确定目标评估指标值;基于所述目标评估指标值确定所述待评估语音的语音干净程度。8.一种语音评估装置,其特征在于,所述装置包括:分割模块,用于对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段;第一确定模块,用于基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,所述至少一个评估指标值用于指示所述待评估语音中的干净语音在所述待评估语音中的能量占比;第二确定模块,用于基于所述至少一个评估指标值确定所述待评估语音的语音干净程度。9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如权利要求1至7中任一项所述的语音评估方法中的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的语音评估方法中的步骤。

技术总结


本公开提供一种语音评估方法、装置及电子设备,所述方法包括:对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段;基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,所述至少一个评估指标值用于指示所述待评估语音中的干净语音在所述待评估语音中的能量占比;基于所述至少一个评估指标值确定所述待评估语音的语音干净程度。本公开实施例能够提高语音评估的效率,且能够提高语音评估的准确性。且能够提高语音评估的准确性。且能够提高语音评估的准确性。


技术研发人员:

李良斌

受保护的技术使用者:

北京声智科技有限公司

技术研发日:

2022.08.02

技术公布日:

2022/11/3

本文发布于:2024-09-23 16:24:35,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/13665.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   语音   据点   指标
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议