音频质量确定方法、异常检测方法、系统、设备及介质与流程



1.本技术涉及智能控制技术领域,具体涉及音频质量确定方法、异常检测方法、系统、设备及介质。


背景技术:



2.近年来,随着互联网软件技术的发展,为满足人们对软件使用方便的需求,语音类软件开发开始兴起并获得快速发展。这些语音类软件可以为用户提供语音设置、语音拨通、语音社交等多种功能,这些多样化的功能服务可以为用户带来个性化的使用体验。
3.在实际的研发过程中,语音开发环境中会存在很多问题,当语音开发过程中遇到无法唤醒或者识别语音设备时,通常会需要依赖各种检测工具对语音音频进行分析。随着设备的智能化发展趋势,需要降低对检测设备的依赖性,故而亟需一种对于音频异常的检测方法,以实现音频异常的检测的智能化。
4.相关技术中通过将音频数据通过傅里叶变换得到频域信息,进而通过检测两个时间段的声音频率,判断音频播放装置或音频接收装置是否存在异常。然而,从音频接收装置出来的音频与经过语音增强后的音频数据存在差异性,无法获知异常点的位置。


技术实现要素:



5.鉴于以上所述现有技术的缺点,本发明提供音频质量确定方法、异常检测方法、系统、设备及介质,以解决上述相关技术中通过将音频数据通过傅里叶变换得到频域信息,进而通过检测两个时间段的声音频率,判断音频播放装置或音频接收装置是否存在异常,从音频接收装置出来的音频与经过语音增强后的音频数据存在差异性,无法获知异常点的位置的技术问题。
6.为实现上述目的,第一个方面,本技术提供一种音频质量确定方法,所述音频质量确定方法包括:
7.获取增强音频数据和第一系统参数,所述第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,所述第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;
8.根据所述第一音频通道数、第一采样个数及第一采样位数,确定所述增强音频数据中单位时间内播放的音频的数据量;
9.基于所述第一采样频率,确定所述增强音频数据中每帧音频数据的播放时长;
10.按照所述增强音频数据中单位时间内播放的音频的数据量读取所述增强音频数据;
11.在增强音频数据中每帧音频数据的播放时长内,基于所述增强音频数据中单位时间内播放的音频的数据量,确定所述增强音频数据中每帧音频的质量,所述每帧音频的质量包括静音和破音。
12.在本技术的一示例性实施例中,确定所述增强音频数据中每帧音频的质量,包括:
13.在所述每帧音频数据的播放时长内,将增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量与0进行比较;
14.在所述每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量均为0,将增强音频数据中相应帧音频数据的质量确定为静音;
15.在所述每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中部分单位时间内播放的音频的数据量大于0或每帧音频数据中所有单位时间内播放的音频的数据均大于0,获取在所述每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值的第一次数;
16.若所述第一次数大于预设第一次数阈值,将增强音频数据中相应帧音频的质量确定为破音。
17.在本技术的一示例性实施例中,所述音频质量确定方法还包括:
18.获取原始音频数据和第二系统参数,所述第二系统参数为对原始音频数据进行采样的采样系统的参数,所述第二系统参数包括第二采样频率、第二音频通道数、第二采样个数及第二采样位数;
19.根据所述第二音频通道数、第二采样个数及第二采样位数,确定所述原始音频数据中单位时间内播放的音频的数据量;
20.基于所述第二采样频率,确定所述原始音频数据中每帧音频数据的播放时长;
21.按照所述原始音频数据中单位时间内播放的音频的数据量读取所述原始音频数据;
22.在原始音频数据中每帧音频数据的播放时长内,基于所述原始音频数据中单位时间内播放的音频的数据量,确定所述原始音频数据中每帧音频的质量,所述每帧音频的质量包括静音和破音。
23.在本技术的一示例性实施例中,确定所述原始音频数据中每帧音频的质量,包括:
24.在所述每帧音频数据的播放时长内,将原始音频数据中每帧音频数据中各单位时间内播放的音频的数据量与0进行比较;
25.在所述每帧音频数据的播放时长内,若原始音频数据中每帧音频数据中各单位时间内播放的音频的数据量均为0,将原始音频数据中相应帧音频数据的质量确定为静音;
26.在所述每帧音频数据的播放时长内,若原始音频数据中每帧音频数据中部分单位时间内播放的音频的数据量大于0或每帧音频数据中所有单位时间内播放的音频的数据均大于0,获取在所述每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值的第二次数;
27.若所述第二次数大于预设第二次数阈值,将原始音频数据中相应帧音频的质量确定为破音。
28.第二个方面,本技术提供一种音频异常检测方法,所述音频异常检测方法包括:
29.获取增强音频数据和第一系统参数,所述第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,所述第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;
30.根据所述第一音频通道数、第一采样个数及第一采样位数,确定所述增强音频数据中单位时间内播放的音频的数据量;
31.基于所述第一采样频率,确定所述增强音频数据中每帧音频数据的播放时长;
32.按照所述增强音频数据中单位时间内播放的音频的数据量读取所述增强音频数据;
33.在增强音频数据中每帧音频数据的播放时长内,基于所述增强音频数据中单位时间内播放的音频的数据量,确定所述增强音频数据中每帧音频的质量,所述每帧音频的质量包括静音和破音。
34.若所述增强音频数据中音频的质量为静音或破音,将静音或破音对应帧音频数据确定为音频异常位置。
35.第三个方面,本技术提供一种音频质量确定系统,所述音频质量确定系统包括:
36.采集模块,用于获取增强音频数据和第一系统参数,所述第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,所述第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;
37.第一确定模块,用于根据所述第一音频通道数、第一采样个数及第一采样位数,确定所述增强音频数据中单位时间内播放的音频的数据量;
38.第二确定模块,用于基于所述第一采样频率,确定所述增强音频数据中每帧音频数据的播放时长;
39.读取模块,用于按照所述增强音频数据中单位时间内播放的音频的数据量读取所述增强音频数据;
40.第三确定模块,用于在增强音频数据中每帧音频数据的播放时长内,基于所述增强音频数据中单位时间内播放的音频的数据量,确定所述增强音频数据中每帧音频的质量,所述每帧音频的质量包括静音和破音。
41.在本技术的一示例性实施例中,所述第三确定模块包括比较单元、第一确定单元、采集单元和第二确定单元,所述比较单元用于在所述每帧音频数据的播放时长内,将增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量与0进行比较;在所述每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量均为0,所述第一确定单元用于将增强音频数据中相应帧音频数据的质量确定为静音;在所述每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中部分单位时间内播放的音频的数据量大于0或每帧音频数据中所有单位时间内播放的音频的数据均大于0,所述采集单元用于获取在所述每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值的第一次数;若所述第一次数大于预设第二次数阈值,第二确定单元用于将增强音频数据中相应帧音频的质量确定为破音。
42.第四个方面,本技术提供一种音频异常检测系统,所述音频异常检测系统包括:
43.采集模块,用于获取增强音频数据和第一系统参数,所述第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,所述第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;
44.第一确定模块,用于根据所述第一音频通道数、第一采样个数及第一采样位数,确定所述增强音频数据中单位时间内播放的音频的数据量;
45.第二确定模块,用于基于所述第一采样频率,确定所述增强音频数据中每帧音频数据的播放时长;
46.读取模块,用于按照所述增强音频数据中单位时间内播放的音频的数据量读取所述增强音频数据;
47.第三确定模块,用于在增强音频数据中每帧音频数据的播放时长内,基于所述增强音频数据中单位时间内播放的音频的数据量,确定所述增强音频数据中每帧音频的质量,所述每帧音频的质量包括静音和破音。
48.第四确定模块,若所述增强音频数据中音频的质量为静音或破音,用于将静音或破音对应帧音频数据确定为音频异常位置。
49.第五个方面,本技术提供一种电子设备,所述电子设备包括:
50.一个或多个处理器;
51.存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现如上所述的方法。
52.第六个方面,本技术提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被计算机的处理器执行时,使计算机执行如上所述的方法。
53.本发明的有益效果:
54.本技术通过获取增强音频数据和第一系统参数,根据第一音频通道数、第一采样个数及第一采样位数,确定增强音频数据中单位时间内播放的音频的数据量,基于所述第一采样频率,确定增强音频数据中每帧音频数据的播放时长,按照增强音频数据中单位时间内播放的音频的数据量读取增强音频数据,在增强音频数据中每帧音频数据的播放时长内,基于增强音频数据中单位时间内播放的音频的数据量,确定增强音频数据中每帧音频的质量,若音频质量存在异常,可根据异常对应帧音频数据确定音频异常位置。
55.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
附图说明
56.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
57.图1为本技术的一示例性实施例示出的音频质量确定方法的流程图;
58.图2为图1所示实施例中步骤s150中确定增强音频数据中每帧音频的质量在一示例性实施例中的流程图;
59.图3为本技术的另一示例性实施例示出的音频质量确定方法的流程图;
60.图4为图3所示实施例中步骤s350中确定原始音频数据中每帧音频的质量在一示例性实施例中的流程图;
61.图5为本技术的另一示例性实施例示出的音频异常检测方法的流程图;
62.图6为本技术的一示例性实施例示出的音频异常检测系统的框图;
63.图7为本技术的一示例性实施例示出的音频异常检测系统的框图;
64.图8示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。
具体实施方式
65.以下将参照附图和优选实施例来说明本发明的实施方式,本领域技术人员可由本说明书中所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。应当理解,优选实施例仅为了说明本发明,而不是为了限制本发明的保护范围。
66.需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
67.在下文描述中,探讨了大量细节,以提供对本发明实施例的更透彻的解释,然而,对本领域技术人员来说,可以在没有这些具体细节的情况下实施本发明的实施例是显而易见的,在其他实施例中,以方框图的形式而不是以细节的形式来示出公知的结构和设备,以避免使本发明的实施例难以理解。
68.请参阅图1,图1为本技术的一示例性实施例示出的音频质量确定方法的流程图,该音频质量确定方法用于确定音频质量,若音频质量存在异常,可根据异常对应帧音频数据确定音频异常位置。
69.如图1所示,在本技术的一示例性实施例中,音频质量确定方法至少包括步骤s110至步骤s150,详细介绍如下:
70.步骤s110.获取增强音频数据和第一系统参数;
71.需要说明的是,第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;
72.步骤s120.根据第一音频通道数、第一采样个数及第一采样位数,确定增强音频数据中单位时间内播放的音频的数据量;
73.具体的,第一音频通道数、第一采样个数及第一采样位数三者的乘积即为增强音频数据中单位时间内播放的音频的数据量。
74.步骤s130.基于第一采样频率,确定增强音频数据中每帧音频数据的播放时长;
75.具体的,第一采样频率的倒数即为增强音频数据中每帧音频数据的播放时长。
76.步骤s140.按照增强音频数据中单位时间内播放的音频的数据量读取增强音频数据;
77.步骤s150.在增强音频数据中每帧音频数据的播放时长内,基于增强音频数据中单位时间内播放的音频的数据量,确定增强音频数据中每帧音频的质量。
78.需要说明的是,每帧音频的质量包括静音和破音。
79.请参阅图2,图2为图1所示实施例中步骤s150中确定增强音频数据中每帧音频的质量在一示例性实施例中的流程图。
80.如图2所示,在本技术的一示例性实施例中,图1所示实施例中步骤s150中确定增强音频数据中每帧音频的质量的过程包括步骤s210至步骤s240,详细介绍如下:
81.步骤s210.在每帧音频数据的播放时长内将增强音频数据中每帧音频数据中各单
位时间内播放的音频的数据量与0进行比较;
82.步骤s220.在每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量均为0,将增强音频数据中相应帧音频数据的质量确定为静音;
83.步骤s230.在每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中部分单位时间内播放的音频的数据量大于0或每帧音频数据中所有单位时间内播放的音频的数据均大于0,获取在每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值的第一次数;
84.需要说明的是,每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值的第一次数是指增强音频数据中每帧音频数据中单位时间内播放的音频的数据量大于预设数据量阈值的连续次数。
85.步骤s240.若第一次数大于预设第一次数阈值,将增强音频数据中相应帧音频的质量确定为破音。
86.预设第一次数阈值可自行设定,此次不再赘述。
87.如图3所示,在本技术的另一示例性实施例中,音频质量确定方法还包括步骤s310至步骤s350,详细介绍如下:
88.步骤s310.获取原始音频数据和第二系统参数;
89.需要说明的是,第二系统参数为对原始音频数据进行采样的采样系统的参数,第二系统参数包括第二采样频率、第二音频通道数、第二采样个数及第二采样位数;
90.步骤s320.根据第二音频通道数、第二采样个数及第二采样位数,确定所述原始音频数据中单位时间内播放的音频的数据量;
91.具体的,第二音频通道数、第二采样个数及第二采样位数三者的乘积即为原始音频数据中单位时间内播放的音频的数据量;
92.步骤s330.基于第二采样频率,确定原始音频数据中每帧音频数据的播放时长;
93.具体的,第二采样频率的倒数即为原始音频数据中每帧音频数据的播放时长。
94.步骤s340.按照原始音频数据中单位时间内播放的音频的数据量读取原始音频数据;
95.步骤s350.在原始音频数据中每帧音频数据的播放时长内,基于原始音频数据中单位时间内播放的音频的数据量,确定原始音频数据中每帧音频的质量。
96.需要说明的是,每帧音频的质量包括静音和破音。
97.请参阅图4,图4为图3所示实施例中步骤s350中确定原始音频数据中每帧音频的质量在一示例性实施例中的流程图。
98.如图4所示,在本技术的一示例性实施例中,图3所示实施例中步骤s350中确定原始音频数据中每帧音频的质量的过程包括步骤s410至步骤s440,详细介绍如下:
99.步骤s410.在每帧音频数据的播放时长内将原始音频数据中每帧音频数据中各单位时间内播放的音频的数据量与0进行比较;
100.步骤s420.在每帧音频数据的播放时长内,若原始音频数据中每帧音频数据中各单位时间内播放的音频的数据量均为0,将原始音频数据中相应帧音频数据的质量确定为静音;
101.步骤s430.在每帧音频数据的播放时长内,若原始音频数据中每帧音频数据中部分单位时间内播放的音频的数据量大于0或每帧音频数据中所有单位时间内播放的音频的数据均大于0,获取在每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值的第二次数;
102.需要说明的是,每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值的第二次数是指原始音频数据中每帧音频数据中单位时间内播放的音频的数据量大于预设数据量阈值的连续次数。
103.步骤s450.若第二次数大于预设第二次数阈值,将原始音频数据中相应帧音频的质量确定为破音。
104.预设第二次数阈值可自行设定,此次不再赘述。
105.请参阅图5,图5为本技术的一示例性实施例示出的音频异常检测方法的流程图。
106.如图5所示,在本技术的一示例性实施例中,音频异常检测方法至少包括步骤s510至步骤s560,详细介绍如下:
107.步骤s510.获取增强音频数据和第一系统参数;
108.需要说明的是,第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;
109.步骤s520.根据第一音频通道数、第一采样个数及第一采样位数,确定增强音频数据中单位时间内播放的音频的数据量;
110.具体的,第一音频通道数、第一采样个数及第一采样位数三者的乘积即为增强音频数据中单位时间内播放的音频的数据量。
111.步骤s530.基于第一采样频率,确定增强音频数据中每帧音频数据的播放时长;
112.具体的,第一采样频率的倒数即为增强音频数据中每帧音频数据的播放时长。
113.步骤s540.按照增强音频数据中单位时间内播放的音频的数据量读取增强音频数据;
114.步骤s550.在增强音频数据中每帧音频数据的播放时长内,基于增强音频数据中单位时间内播放的音频的数据量,确定增强音频数据中每帧音频的质量。
115.需要说明的是,每帧音频的质量包括静音和破音。
116.步骤s560.若增强音频数据中音频的质量为静音或破音,将静音或破音对应帧音频数据确定为音频异常位置。
117.在一具体实施例中,音频异常检测方法步骤如下:
118.音频接收装置接收增强音频数据和第一系统参数,第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;
119.将第一音频通道数、第一采样个数及第一采样位数三者相乘得到增强音频数据中单位时间内播放的音频的数据量。
120.基于第一采样频率,确定第一采样频率的倒数,得到增强音频数据中每帧音频数据的播放时长;
121.按照增强音频数据中单位时间内播放的音频的数据量读取增强音频数据;
122.在每帧音频数据的播放时长内,将增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量与0进行比较;
123.在每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量均为0,将增强音频数据中相应帧音频数据的质量确定为静音;
124.在每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中部分单位时间内播放的音频的数据量大于0或每帧音频数据中所有单位时间内播放的音频的数据均大于0,获取在每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值20k的第一次数;
125.若第一次数大于预设第一次数阈值5次,将增强音频数据中相应帧音频的质量确定为破音;
126.若增强音频数据中音频的质量为静音或破音,将静音或破音对应帧音频数据确定为音频异常位置;
127.音频接收装置接收原始音频数据和第二系统参数,第二系统参数为对原始音频数据进行采样的采样系统的参数,第二系统参数包括第二采样频率、第二音频通道数、第二采样个数及第二采样位数;
128.将第二音频通道数、第二采样个数及第二采样位数三者相乘得到原始音频数据中单位时间内播放的音频的数据量;
129.基于第二采样频率,确定第二采样频率的倒数,得到原始音频数据中每帧音频数据的播放时长;
130.按照原始音频数据中单位时间内播放的音频的数据量读取原始音频数据;
131.在每帧音频数据的播放时长内,将原始音频数据中每帧音频数据中各单位时间内播放的音频的数据量与0进行比较;
132.在每帧音频数据的播放时长内,若原始音频数据中每帧音频数据中各单位时间内播放的音频的数据量均为0,将原始音频数据中相应帧音频数据的质量确定为静音;
133.在每帧音频数据的播放时长内,若原始音频数据中每帧音频数据中部分单位时间内播放的音频的数据量大于0或每帧音频数据中所有单位时间内播放的音频的数据均大于0,获取在每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值20k的第二次数;
134.若第二次数大于预设第二次数阈值5次,将原始音频数据中相应帧音频的质量确定为破音;
135.若原始音频数据中音频的质量为静音或破音,将静音或破音对应帧音频数据确定为音频异常位置。
136.请参阅图6,本技术实施例还提供一种音频质量确定系统m600,该音频质量确定系统m600包括:
137.采集模块m610,用于获取增强音频数据和第一系统参数;
138.需要说明的是,第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;
139.第一确定模块m620,用于根据第一音频通道数、第一采样个数及第一采样位数,确
定增强音频数据中单位时间内播放的音频的数据量;
140.第二确定模块m630,用于基于第一采样频率,确定增强音频数据中每帧音频数据的播放时长;
141.读取模块m640,用于按照增强音频数据中单位时间内播放的音频的数据量读取所述增强音频数据;
142.第三确定模块m650,用于在增强音频数据中每帧音频数据的播放时长内,基于增强音频数据中单位时间内播放的音频的数据量,确定增强音频数据中每帧音频的质量,每帧音频的质量包括静音和破音。
143.在本技术的一示例性实施例中,第三确定模块包括比较单元、第一确定单元、采集单元和第二确定单元,比较单元用于在每帧音频数据的播放时长内,将增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量与0进行比较;在每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量均为0,第一确定单元用于将增强音频数据中相应帧音频数据的质量确定为静音;在每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中部分单位时间内播放的音频的数据量大于0或每帧音频数据中所有单位时间内播放的音频的数据均大于0,采集单元用于获取在每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值的第一次数;若第一次数大于预设第一次数阈值,第二确定单元用于将增强音频数据中相应帧音频的质量确定为破音。
144.请参阅图7,本技术实施例还提供一种音频异常检测系统m700,音频异常检测系统m700包括:
145.采集模块m710,用于获取增强音频数据和第一系统参数;
146.需要说明的是,第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;
147.第一确定模块m720,用于根据第一音频通道数、第一采样个数及第一采样位数,确定所述增强音频数据中单位时间内播放的音频的数据量;
148.第二确定模块m730,用于基于第一采样频率,确定增强音频数据中每帧音频数据的播放时长;
149.读取模块m740,用于按照增强音频数据中单位时间内播放的音频的数据量读取增强音频数据;
150.第三确定模块m750,用于在增强音频数据中每帧音频数据的播放时长内,基于增强音频数据中单位时间内播放的音频的数据量,确定增强音频数据中每帧音频的质量;
151.需要说明的是,每帧音频的质量包括静音和破音。
152.第四确定模块m960,若增强音频数据中音频的质量为静音或破音,用于将静音或破音对应帧音频数据确定为音频异常位置。
153.需要说明的是,上述实施例所提供的音频质量确定系统与上述实施例所提供的音频质量确定方法属于同一构思,上述实施例所提供的音频异常检测系统与上述实施例所提供的音频异常检测方法属于同一构思,其中各个模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。上述实施例所提供的音频质量确定系统和在
音频异常检测系统实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能,本处也不对此进行限制。
154.本技术的实施例还提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现上述各个实施例中提供的音频质量确定方法或音频异常检测方法。
155.图8示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。需要说明的是,图8示出的电子设备的计算机系统800仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
156.如图8所示,计算机系统800包括中央处理单元(central processing unit,cpu)801,其可以根据存储在只读存储器(read-only memory,rom)802中的程序或者从储存部分808加载到随机访问存储器(random access memory,ram)803中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在ram 803中,还存储有系统操作所需的各种程序和数据。cpu 801、rom 802以及ram 803通过总线804彼此相连。输入/输出(input/output,i/o)接口1005也连接至总线804。
157.以下部件连接至i/o接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(cathode ray tube,crt)、液晶显示器(liquid crystal display,lcd)等以及扬声器等的输出部分807;包括硬盘等的储存部分808;以及包括诸如lan(local area network,局域网)卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至i/o接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入储存部分808。
158.特别地,根据本技术的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(cpu)801执行时,执行本技术的系统中限定的各种功能。
159.需要说明的是,本技术实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(erasable programmable read only memory,eprom)、闪存、光纤、便携式紧凑磁盘只读存储器(compact disc read-only memory,cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采样多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发
送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
160.附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
161.描述于本技术实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
162.本技术的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机的处理器执行时,使计算机执行如前所述的音频质量确定方法或音频异常检测方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中。
163.本技术的另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个实施例中提供的音频质量确定方法或音频异常检测方法。
164.上述实施例仅示例性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,但凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

技术特征:


1.一种音频质量确定方法,其特征在于,所述音频质量确定方法包括:获取增强音频数据和第一系统参数,所述第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,所述第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;根据所述第一音频通道数、第一采样个数及第一采样位数,确定所述增强音频数据中单位时间内播放的音频的数据量;基于所述第一采样频率,确定所述增强音频数据中每帧音频数据的播放时长;按照所述增强音频数据中单位时间内播放的音频的数据量读取所述增强音频数据;在增强音频数据中每帧音频数据的播放时长内,基于所述增强音频数据中单位时间内播放的音频的数据量,确定所述增强音频数据中每帧音频的质量,所述每帧音频的质量包括静音和破音。2.根据权利要求1所述的音频质量确定方法,其特征在于,确定所述增强音频数据中每帧音频的质量,包括:在所述每帧音频数据的播放时长内,将增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量与0进行比较;在所述每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量均为0,将增强音频数据中相应帧音频数据的质量确定为静音;在所述每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中部分单位时间内播放的音频的数据量大于0或每帧音频数据中所有单位时间内播放的音频的数据均大于0,获取在所述每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值的第一次数;若所述第一次数大于预设第一次数阈值,将增强音频数据中相应帧音频的质量确定为破音。3.根据权利要求1所述的音频质量确定方法,其特征在于,所述音频质量确定方法还包括:获取原始音频数据和第二系统参数,所述第二系统参数为对原始音频数据进行采样的采样系统的参数,所述第二系统参数包括第二采样频率、第二音频通道数、第二采样个数及第二采样位数;根据所述第二音频通道数、第二采样个数及第二采样位数,确定所述原始音频数据中单位时间内播放的音频的数据量;基于所述第二采样频率,确定所述原始音频数据中每帧音频数据的播放时长;按照所述原始音频数据中单位时间内播放的音频的数据量读取所述原始音频数据;在原始音频数据中每帧音频数据的播放时长内,基于所述原始音频数据中单位时间内播放的音频的数据量,确定所述原始音频数据中每帧音频的质量,所述每帧音频的质量包括静音和破音。4.根据权利要求3所述的音频质量确定方法,其特征在于,确定所述原始音频数据中每帧音频的质量,包括:在所述每帧音频数据的播放时长内,将原始音频数据中每帧音频数据中各单位时间内播放的音频的数据量与0进行比较;
在所述每帧音频数据的播放时长内,若原始音频数据中每帧音频数据中各单位时间内播放的音频的数据量均为0,将原始音频数据中相应帧音频数据的质量确定为静音;在所述每帧音频数据的播放时长内,若原始音频数据中每帧音频数据中部分单位时间内播放的音频的数据量大于0或每帧音频数据中所有单位时间内播放的音频的数据均大于0,获取在所述每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值的第二次数;若所述第二次数大于预设第二次数阈值,将原始音频数据中相应帧音频的质量确定为破音。5.一种音频异常检测方法,其特征在于,所述音频异常检测方法包括:获取增强音频数据和第一系统参数,所述第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,所述第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;根据所述第一音频通道数、第一采样个数及第一采样位数,确定所述增强音频数据中单位时间内播放的音频的数据量;基于所述第一采样频率,确定所述增强音频数据中每帧音频数据的播放时长;按照所述增强音频数据中单位时间内播放的音频的数据量读取所述增强音频数据;在增强音频数据中每帧音频数据的播放时长内,基于所述增强音频数据中单位时间内播放的音频的数据量,确定所述增强音频数据中每帧音频的质量,所述每帧音频的质量包括静音和破音。若所述增强音频数据中音频的质量为静音或破音,将静音或破音对应帧音频数据确定为音频异常位置。6.一种音频质量确定系统,其特征在于,所述音频质量确定系统包括:采集模块,用于获取增强音频数据和第一系统参数,所述第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,所述第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;第一确定模块,用于根据所述第一音频通道数、第一采样个数及第一采样位数,确定所述增强音频数据中单位时间内播放的音频的数据量;第二确定模块,用于基于所述第一采样频率,确定所述增强音频数据中每帧音频数据的播放时长;读取模块,用于按照所述增强音频数据中单位时间内播放的音频的数据量读取所述增强音频数据;第三确定模块,用于在增强音频数据中每帧音频数据的播放时长内,基于所述增强音频数据中单位时间内播放的音频的数据量,确定所述增强音频数据中每帧音频的质量,所述每帧音频的质量包括静音和破音。7.根据权利要求6所述的音频质量确定系统,其特征在于,所述第三确定模块包括比较单元、第一确定单元、采集单元和第二确定单元,所述比较单元用于在所述每帧音频数据的播放时长内,将增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量与0进行比较;在所述每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量均为0,所述第一确定单元用于将增强音频数据中相应帧音频数
据的质量确定为静音;在所述每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中部分单位时间内播放的音频的数据量大于0或每帧音频数据中所有单位时间内播放的音频的数据均大于0,所述采集单元用于获取在所述每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值的第一次数;若所述第一次数大于预设第一次数阈值,第二确定单元用于将增强音频数据中相应帧音频的质量确定为破音。8.一种音频异常检测系统,其特征在于,所述音频异常检测系统包括:采集模块,用于获取增强音频数据和第一系统参数,所述第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,所述第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;第一确定模块,用于根据所述第一音频通道数、第一采样个数及第一采样位数,确定所述增强音频数据中单位时间内播放的音频的数据量;第二确定模块,用于基于所述第一采样频率,确定所述增强音频数据中每帧音频数据的播放时长;读取模块,用于按照所述增强音频数据中单位时间内播放的音频的数据量读取所述增强音频数据;第三确定模块,用于在增强音频数据中每帧音频数据的播放时长内,基于所述增强音频数据中单位时间内播放的音频的数据量,确定所述增强音频数据中每帧音频的质量,所述每帧音频的质量包括静音和破音。第四确定模块,若所述增强音频数据中音频的质量为静音或破音,用于将静音或破音对应帧音频数据确定为音频异常位置。9.一种电子设备,其特征在于,所述电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现如权利要求1-5中任一项所述的方法。10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,当所述计算机程序被计算机的处理器执行时,使计算机执行如权利要求1-5中任一项所述的方法。

技术总结


本申请提供音频质量确定方法、异常检测方法、系统、设备及介质,该音频质量确定方法包括获取增强音频数据和第一系统参数,根据第一音频通道数、第一采样个数及第一采样位数,确定增强音频数据中单位时间内播放的音频的数据量,基于第一采样频率,确定增强音频数据中每帧音频数据的播放时长,按照增强音频数据中单位时间内播放的音频的数据量读取增强音频数据,在增强音频数据中每帧音频数据的播放时长内,基于增强音频数据中单位时间内播放的音频的数据量,确定增强音频数据中每帧音频的质量,若音频质量存在异常,可根据异常对应帧音频数据确定音频异常位置。频数据确定音频异常位置。频数据确定音频异常位置。


技术研发人员:

王雪 高斯雄

受保护的技术使用者:

重庆长安汽车股份有限公司

技术研发日:

2022.11.28

技术公布日:

2023/3/28

本文发布于:2024-09-22 19:23:34,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/82457.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:音频   数据   所述   时间内
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议