一种检测和消除噪声的方法、装置、编码方法、介质及设备与流程



1.本技术涉及蓝牙技术领域,特别涉及一种检测和消除噪声的方法、装置、编码方法、介质及设备。


背景技术:



2.hiss噪声是一种全频带的平稳加性噪声,听起来

咝咝’的声音,如一些老唱片使用数字化存储时,其过程经常会引入此类噪声,另外,主播在直播时,由于录音设备等原因,也容易引入此类噪声,降低了用户体验。为了消除噪声,现有技术在抑制hiss噪声的处理流程包括:1.输入待处理的音频信号(pcm格式);2.分析窗;3.傅里叶变换;4.识别帧类型;5.hiss噪声估计与更新;6.频谱增益;7.频谱平滑;8.相乘;9.傅里叶反变换;10.综合窗;11.重叠相加;12.输出抑制hiss噪声后的音频信号。在现有的蓝牙应用领域,有着高音质、低功耗以及低延迟的要求。首先上述的处理过程流程多且复杂,增加蓝牙设备的功耗。同时上述方法中采用重叠相加法以保证帧间信号的平滑,但是该种处理方法会增加延迟,不符合蓝牙的低延迟的目标或要求,影响用户的使用体验。


技术实现要素:



3.针对在进行hiss噪声的检测和消除时,流程复杂,功耗高,高延迟的问题,本技术提出一种检测和消除噪声的方法、装置、编码方法、介质及设备。
4.第一方面,本技术提出一种检测和消除噪声的方法,包括:在具有改进型离散余弦变换处理的编解码器对音频的编码或解码过程中,获取当前帧音频对应的原始频域谱系数;根据原始频域谱系数计算当前帧音频的伪谱平坦度;在伪谱平坦度大于预设门限的条件下,根据伪谱平坦度设定噪声更新速度参数;根据噪声更新速度参数计算当前帧音频的噪声能量;以及根据原始频域谱系数和噪声能量计算得到当前帧音频的更新谱系数,并根据更新谱系数进行后续的编码或解码过程。
5.可选的,在具有改进型离散余弦变换处理的编解码器对音频的编码或解码过程中,获取当前帧音频对应的原始频域谱系数,包括:在编解码器的标准编码或解码过程中,对当前帧音频进行改进型离散余弦变换,得到原始频域谱系数。
6.可选的,根据原始频域谱系数计算当前帧音频的伪谱平坦度,包括:根据原始频域谱系数计算当前帧音频对应的伪谱;根据伪谱,计算并得到当前帧音频对应的伪谱几何平均值和伪谱算术平均值;根据伪谱几何平均值和伪谱算术平均值计算得到伪谱平坦度。
7.可选的,在伪谱平坦度大于预设门限的条件下,根据伪谱平坦度设定噪声更新速度参数,包括:根据伪谱平坦度的大小设定噪声更新速度参数,其中噪声更新速度参数的大小与伪谱平坦度的大小成正比例关系。
8.可选的,在伪谱平坦度大于预设门限的条件下,根据伪谱平坦度设定噪声更新速度参数,还包括:在伪谱平坦度大于预设门限的条件下,判断在当前帧音频之前的预设数目帧音频中,是否存在一个音频帧对应的伪谱平坦度小于预设门限;若否,则根据当前帧音频
对应的伪谱平坦度的大小设定噪声更新速度参数。
9.可选的,根据噪声更新速度参数计算当前帧音频的噪声能量,包括:选择当前帧音频的非语音频带,并计算当前帧音频对应的伪谱中值;根据伪谱中值、噪声更新速度参数以及上一帧音频的滑动平均能量,计算得到当前帧音频对应的当前帧滑动平均能量,并作为当前帧音频的噪声能量。
10.第二方面,本技术提出一种检测和消除噪声的装置,其特征在于,包括:频域谱系数获取模块,其在具有改进型离散余弦变换处理的编解码器对音频的编码或解码过程中,获取当前帧音频对应的原始频域谱系数;伪谱平坦度计算模块,其根据原始频域谱系数计算当前帧音频的伪谱平坦度;噪声更新速度参数确定模块,其在伪谱平坦度大于预设门限的条件下,根据伪谱平坦度设定噪声更新速度参数;噪声能量计算模块,其根据噪声更新速度参数计算当前帧音频的噪声能量;以及谱系数更新模块,其根据原始频域谱系数和噪声能量计算得到当前帧音频的更新谱系数,并根据更新谱系数进行后续的编码或解码过程。
11.第三方面,本技术提出一种音频编码方法,其特征在于,包括:在具有改进型离散余弦变换处理的编码器对音频的编码过程中,获取当前帧音频对应的原始频域谱系数;根据原始频域谱系数计算当前帧音频的伪谱平坦度;在伪谱平坦度大于预设门限的条件下,根据伪谱平坦度设定噪声更新速度参数;根据噪声更新速度参数计算当前帧音频的噪声能量;以及根据原始频域谱系数和噪声能量计算得到当前帧音频的更新谱系数;根据更新谱系数对编码器中的其他编码模块进行更新,并利用更新后的编码模块对当前帧音频继续进行编码。
12.第四方面,本技术提供一种计算机可读存储介质,其存储有计算机程序,其中计算机程序被操作以执行方案一中的检测和消除噪声的方法或方案三中的音频编码方法。
13.第五方面,本技术提供一种计算机设备,其包括处理器和存储器,存储器存储有计算机程序,其中:处理器操作计算机程序以执行方案一中的检测和消除噪声的方法或方案三中的音频编码方法。
14.本技术的检测和消除噪声的方法通过利用编码器中已有的编码流程对音频数据进行编码,同时利用伪谱平坦度设定噪声更新速度参数,进行多帧之间的过渡,具有低功耗、低延迟的特点,提升用户使用体验。
附图说明
15.为了更清楚地说明本技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图示例性的示出了本技术的一些实施例。
16.图1示出了本技术检测和消除噪声的方法的一个实施方式的示意图;
17.图2示出了本技术一段噪声及其对应的噪声平坦度的示意图;
18.图3示出了本技术一段人声及其对应的人声谱平坦度的示意图;
19.图4示出了本技术检测和消除噪声的装置的一个实施方式的示意图;
20.图5示出了本技术音频编码方法的一个实施方式的示意图。
21.通过上述附图,已示出本技术明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本技术构思的范围,而是通过参考特定实施例为
本领域技术人员说明本技术的概念。
具体实施方式
22.下面结合附图对本技术的较佳实施例进行详细阐述,以使本技术的优点和特征能更易于被本领域技术人员理解,从而对本技术的保护范围做出更为清楚明确的界定。
23.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
24.hiss噪声是一种全频带的平稳加性噪声,听起来

咝咝’的声音,如一些老唱片使用数字化存储时,其过程经常会引入此类噪声,另外,主播在直播时,由于录音设备等原因,也容易引入此类噪声,降低了用户体验。为了消除噪声,现有技术在抑制hiss噪声的处理流程包括:1.输入待处理的音频信号(pcm格式);2.分析窗;3.傅里叶变换;4.识别帧类型;5.hiss噪声估计与更新;6.频谱增益;7.频谱平滑;8.相乘;9.傅里叶反变换;10.综合窗;11.重叠相加;12.输出抑制hiss噪声后的音频信号。在现有的蓝牙应用领域,有着高音质、低功耗以及低延迟的要求。首先上述的处理过程流程多且复杂,增加蓝牙设备的功耗。同时上述方法中采用重叠相加法以保证帧间信号的平滑,但是该种处理方法会增加延迟,不符合蓝牙的低延迟的目标或要求,影响用户的使用体验。
25.针对上述问题,本技术提出一种检测和消除噪声的方法、装置、编码方法、介质及设备,该方法包括:在具有改进型离散余弦变换处理的编解码器对音频的编码或解码过程中,获取当前帧音频对应的原始频域谱系数;根据原始频域谱系数计算当前帧音频的伪谱平坦度;在伪谱平坦度大于预设门限的条件下,根据伪谱平坦度设定噪声更新速度参数;根据噪声更新速度参数计算当前帧音频的噪声能量;以及根据原始频域谱系数和噪声能量计算得到当前帧音频的更新谱系数,并根据更新谱系数进行后续的编码或解码过程。本技术的技术方案主要针对hiss噪声。其中噪声的种类很多,有平稳的和非平稳的,有加性的和乘法的,对于其中的加性平稳噪声,本技术也是有效的。
26.本技术的检测和消除噪声的方法通过利用具有改进型离散余弦变换处理的编解码器中已有的编码或解码流程对音频进行编码或解码,获取原始频域谱系数,并得到伪谱平坦度,同时利用伪谱平坦度设定噪声更新速度参数,进行多帧之间的过渡,具有低功耗、低延迟的特点,提升用户使用体验。
27.下面,以具体的实施例对本技术的技术方案以及本技术的技术方案如何解决上述技术问题进行详细说明。下面述及的具体的实施例可以相互结合形成新的实施例。对于在一个实施例中描述过的相同或相似的思想或过程,可能在其他某些实施例中不再赘述。下面将结合附图,对本技术的实施例进行描述。
28.图1示出了本技术检测和消除噪声的方法的一个实施方式的示意图。
29.在图1所示的实施方式中,本技术的检测和消除噪声的方法包括过程s101,在具有
改进型离散余弦变换处理的编解码器对音频的编码或解码过程中,获取当前帧音频对应的原始频域谱系数。
30.在该实施方式中,在本技术的检测和消除噪声的方法中,利用编解码器中对音频已有的标准编码或解码流程,通过改进型离散余弦变换处理,在编码或解码过程中获得当前帧音频的原始频域谱系数,然后通过原始频域谱系数进行后续噪音的检测。
31.可选的,在具有改进型离散余弦变换处理的编解码器对音频的编码或解码过程中,获取当前帧音频对应的原始频域谱系数,包括:在编解码器的标准编码或解码过程中,对当前帧音频进行改进型离散余弦变换,得到原始频域谱系数。
32.在该可选实施例中,为了叙述方便,对于具有改进型离散余弦变换处理的编解码器,本技术以lc3编解码器对音频的编码过程为例,对本技术的技术方案进行说明。其中,对于其他具有改进型离散余弦变换处理的编解码器的处理过程类似。
33.利用lc3编码器中的已有的改进型离散余弦变换模块对当前帧音频进行编码,得到当前帧音频对应的原始频域谱系数,然后利用该原始频域谱系数进行音频数据中hiss噪音的检测。在背景技术中介绍到,现有技术在进行hiss噪音的消除时,包括分析窗、傅里叶变换、傅里叶反变换等过程,从而存在高功耗、高延迟,用户体验较差的问题。而在本技术的方法中,由于借助编码器中已有的编码模块,上述的处理过程均可以省略,从而降低功耗,降低对整个编码系统的存储空间、运算能力的要求。同时,现有技术的方案中,傅里叶变换与逆变换、综合窗和分析窗等过程都会引入一定的误差,而本技术省略了这些模块从而避免了高延迟对音质的影响,由于本技术没有引入算法延迟,提升了用户体验;另外本技术中的技术方案对算力要求较低,确保了蓝牙嵌入式设备的续航时间。
34.具体的,以lc3编码器对10ms帧长、48khz采样率的音频数据进行编码得到频域谱系数为例,对音频的原始频域谱系数的获取过程进行说明。根据lc3编码器的标准编码处理过程对输入的10ms帧长的音频数据完成低延迟改进型离散余弦变换即ld-mdct计算,得到对应的原始频域谱系数。其中,当前帧的音频数据,n=0,1,xs(n)2,

,nf,
35.t(n)=xs(z-nf+n),for n=0
…2·nf-1-z
36.t(2n
f-z+n)=0,for n=0

z-1
[0037][0038]
上述公式中,基于lc3标准规范,nf是480,z是180,w
nms_nf
(n)是低延迟mdct窗,x(k)是当前帧时域音频数据xs(n)对应的频域谱系数。
[0039]
在图1所示的实施方式中,本技术的检测和消除噪声的方法包括过程s102,根据原始频域谱系数计算当前帧音频的伪谱平坦度。
[0040]
可选的,根据原始频域谱系数计算当前帧音频数据的伪谱平坦度,包括:根据原始频域谱系数计算当前帧音频的伪谱平坦度,包括:根据原始频域谱系数计算当前帧音频对应的伪谱;根据伪谱,计算并得到当前帧音频对应的伪谱几何平均值和伪谱算术平均值;根据伪谱几何平均值和伪谱算术平均值计算得到伪谱平坦度。
[0041]
具体的,根据原始频域谱系数计算当前帧音频数据的伪谱平坦度的过程如下:
[0042]
计算伪谱:
[0043][0044]
其中x(k)=0,当k=-1或nf时
[0045]
计算伪谱几何平均值:
[0046][0047]
计算伪谱算术平均值:
[0048][0049]
计算伪谱平坦度:
[0050][0051]
在图1所示的实施方式中,本技术的检测和消除噪声的方法包括过程s103,在伪谱平坦度大于预设门限的条件下,根据伪谱平坦度设定噪声更新速度参数。
[0052]
在该实施方式中,在进行音频的噪声消除时,因为是对音频帧中的噪声数据进行消除,因此可能存在连续两帧的噪声消除的程度不同,而使得原本平滑的音频出现较大的波动,从而降低用户体验。为了保证噪声处理后,多帧之间过渡的平滑性,本技术在进行噪声消除的过程中,设置噪声更新速度参数,以调整不同音频帧之间噪声消除的程度,保证音频音质,进行噪声的消除。
[0053]
具体的,设置预设门限为0.15,其中预设门限用来区分当前帧音频为正常音频的音调帧还是包含噪音的浊音帧。如果伪谱平坦度小于此门限则当前帧为音调信号,为音调帧,不需要进行噪音的消除处理;如果伪谱平坦度大于或等于该预设门限,则说明该音频帧为浊音帧,需要进行噪音的消除处理。
[0054]
可选的,在伪谱平坦度大于预设门限的条件下,根据伪谱平坦度设定噪声更新速度参数,包括:根据伪谱平坦度的大小设定噪声更新速度参数,其中噪声更新速度参数的大小与伪谱平坦度的大小成正比例关系。
[0055]
在该可选实施例中,在确定噪声更新速度参数时,根据伪谱平坦度的大小进行合理的设置。其中,噪声更新速度参数的大小与伪谱平坦度的大小成正比例关系。当前帧音频数据的伪谱平坦度越大,相应的设置更大的噪声更新速度参数;当前帧音频数据的伪谱平坦度越小,相应的设置更小的噪声更新速度参数。
[0056]
可选的,在伪谱平坦度大于预设门限的条件下,根据伪谱平坦度设定噪声更新速度参数,还包括:在伪谱平坦度大于预设门限的条件下,判断在当前帧音频之前的预设数目帧音频中,是否存在一个音频帧对应的伪谱平坦度小于预设门限;若否,则根据当前帧音频对应的伪谱平坦度的大小设定噪声更新速度参数。
[0057]
在该可选实施例中,在判断当前帧音频的伪谱平坦度大于或等于该预设门限,为包含噪音的浊音帧时,特别的,对于语音来说,浊音帧之后的清音一般谱平坦度类似噪声,为了噪声处理过程更加精确,所以设置音调帧延迟因子,如果当前帧是音调帧,则后续几帧
都被认为是音调帧,不论其谱平坦度大小。如果当前帧为音调帧,说明没有hiss噪声或其能量很小,此时不执行谱系数更新,避免对音质的损伤,但此时仍然更新噪声的计算,便于未来某一帧需要更新谱系数时有较为合理的噪声估计。具体的,预设数目帧的帧数可设置为5帧,需要说明的是,关于预设门限和预设数目帧的选择,可根据实际的处理要求进行合理的调整,本技术不进行具体限制。
[0058]
另外,根据谱平坦度设定噪声更新的速度α,即谱平坦度越低,说明音调成分越强,噪声更新速度就越慢,反之越快。具体的,可设置谱平坦度0.1时更新速度α取0.05,谱平坦度0.8时更新速度α取0.25,可以得出其线性关系如下,其他取值根据下式得出。
[0059][0060]
图2示出了本技术一段噪声及其对应的噪声平坦度的示意图。图3示出了本技术一段人声及其对应的人声谱平坦度的示意图。
[0061]
在图1所示的实施方式中,本技术的检测和消除噪声的方法包括过程s104,根据噪声更新速度参数计算当前帧音频的噪声能量。
[0062]
可选的,根据噪声更新速度参数计算当前帧音频的噪声能量,包括:选择当前帧音频的非语音频带,并计算当前帧音频对应的伪谱中值;根据伪谱中值、噪声更新速度参数以及上一帧音频的滑动平均能量,计算得到当前帧音频对应的当前帧滑动平均能量,并作为当前帧音频的噪声能量。
[0063]
具体的,选择非语音频带并计算伪谱中值,通常语音频带主要的能量集中在300hz~3400hz,以当前配置的采样率48hz为例,其有效带宽是24khz,可以选择8khz~20khz的频带计算并判断hiss噪声,其对应的谱系数索引k的范围是160~400,具体实施时,k的选择主要避开语音频带和高频衰减即可,其主要是麦克风和a/d等导致,具体可测,本发明并无限制。
[0064]
当前帧的非语音频带伪谱中值:
[0065]
x
pseudo-med
=median(x
pseudo
(k)),k=160~400,median()操作表示取其中的中值。
[0066]
当前帧的滑动平均能量为:
[0067]
p
ma
=α*p
ma-la
+(1-α)*x
pseudo-me
,其中p
ma-last
是上一帧的滑动平均能量,α是滑动平均因子,用来控制噪声更新的速度,避免帧间噪声估计的突变,典型的取值0.95。
[0068]
在图1所示的实施方式中,本技术的检测和消除噪声的方法包括过程s105,根据原始频域谱系数和噪声能量计算得到当前帧音频的更新谱系数,并根据更新谱系数进行后续的编码或解码过程。
[0069]
具体的,如前,当谱平坦度大于0.15时,表示当前帧音频中存在噪音,开始进行噪声处理,通过更新谱系数消除噪声:
[0070][0071]
其中,谱系数的更新如上述公式所示,在得到新的谱系数后,在编码器中,继续完成编码器其余模块的编码过程。根据lc3标准规范完成其余的编码模块,包括变换域噪声整形、时域噪声整形、量化和噪声电平估计、算术与残差编码、码流封装。
[0072]
本技术的检测和消除噪声的方法可应用在具有的改进型离散余弦变换处理的编
码器编码或解码器解码的过程中,进行hiss噪声的检测和消除。另外,本技术的检测和消除噪声的方法通过利用编码器中已有的编码流程对音频数据进行编码,同时利用伪谱平坦度设定噪声更新速度参数,进行多帧之间的过渡,具有低功耗、低延迟的特点,提升用户体验。
[0073]
图4示出了本技术检测和消除噪声的装置的一个实施方式。
[0074]
在图4所示的实施方式中,本技术的检测和消除噪声的装置包括:频域谱系数获取模块401,其在具有改进型离散余弦变换处理的编解码器对音频的编码或解码过程中,获取当前帧音频对应的原始频域谱系数;伪谱平坦度计算模块402,其根据原始频域谱系数计算当前帧音频的伪谱平坦度;噪声更新速度参数确定模块403,其在伪谱平坦度大于预设门限的条件下,根据伪谱平坦度设定噪声更新速度参数;噪声能量计算模块404,其根据噪声更新速度参数计算当前帧音频的噪声能量;以及谱系数更新模块405,其根据原始频域谱系数和噪声能量计算得到当前帧音频的更新谱系数,并根据更新谱系数进行后续的编码或解码过程。
[0075]
可选的,在频域谱系数获取模块401中,在编解码器的标准编码或解码过程中,对当前帧音频进行改进型离散余弦变换,得到原始频域谱系数。
[0076]
可选的,在伪谱平坦度计算模块402中,根据原始频域谱系数计算当前帧音频对应的伪谱;根据伪谱,计算并得到当前帧音频对应的伪谱几何平均值和伪谱算术平均值;根据伪谱几何平均值和伪谱算术平均值计算得到伪谱平坦度。
[0077]
可选的,在噪声更新速度参数确定模块403中,根据伪谱平坦度的大小设定噪声更新速度参数,其中噪声更新速度参数的大小与伪谱平坦度的大小成正比例关系。
[0078]
可选的,在噪声更新速度参数确定模块403中,在伪谱平坦度大于预设门限的条件下,判断在当前帧音频之前的预设数目帧音频中,是否存在一个音频帧对应的伪谱平坦度小于预设门限;若否,则根据当前帧音频对应的伪谱平坦度的大小设定噪声更新速度参数。
[0079]
可选的,在噪声能量计算模块404中,选择当前帧音频的非语音频带,并计算当前帧音频对应的伪谱中值;根据伪谱中值、噪声更新速度参数以及上一帧音频的滑动平均能量,计算得到当前帧音频对应的当前帧滑动平均能量,并作为当前帧音频的噪声能量。
[0080]
本技术的检测和消除噪声的装置通过利用编码器中已有的编码流程对音频数据进行编码,同时利用伪谱平坦度设定噪声更新速度参数,进行多帧之间的过渡,具有低功耗、低延迟的特点,提升用户使用体验。
[0081]
图5示出了本技术音频编码方法的一个实施方式。
[0082]
在图5所示的实施方式中,本技术的音频编码方法包括:过程s501,在具有改进型离散余弦变换处理的编码器对音频的编码过程中,获取当前帧音频对应的原始频域谱系数;过程s502,根据原始频域谱系数计算当前帧音频的伪谱平坦度;过程s503,在伪谱平坦度大于预设门限的条件下,根据伪谱平坦度设定噪声更新速度参数;过程s504,根据噪声更新速度参数计算当前帧音频的噪声能量;以及过程s505,根据原始频域谱系数和噪声能量计算得到当前帧音频的更新谱系数;以及过程s506,根据更新谱系数对编码器中的其他编码模块进行更新,并利用更新后的编码模块对当前帧音频继续进行编码。
[0083]
可选的,在具有改进型离散余弦变换处理的编解码器对音频的编码或解码过程中,获取当前帧音频对应的原始频域谱系数,包括:在编解码器的标准编码或解码过程中,对当前帧音频进行改进型离散余弦变换,得到原始频域谱系数。
[0084]
可选的,根据原始频域谱系数计算当前帧音频的伪谱平坦度,包括:根据原始频域谱系数计算当前帧音频对应的伪谱;根据伪谱,计算并得到当前帧音频对应的伪谱几何平均值和伪谱算术平均值;根据伪谱几何平均值和伪谱算术平均值计算得到伪谱平坦度。
[0085]
可选的,在伪谱平坦度大于预设门限的条件下,根据伪谱平坦度设定噪声更新速度参数,包括:根据伪谱平坦度的大小设定噪声更新速度参数,其中噪声更新速度参数的大小与伪谱平坦度的大小成正比例关系。
[0086]
可选的,在伪谱平坦度大于预设门限的条件下,根据伪谱平坦度设定噪声更新速度参数,还包括:在伪谱平坦度大于预设门限的条件下,判断在当前帧音频之前的预设数目帧音频中,是否存在一个音频帧对应的伪谱平坦度小于预设门限;若否,则根据当前帧音频对应的伪谱平坦度的大小设定噪声更新速度参数。
[0087]
可选的,根据噪声更新速度参数计算当前帧音频的噪声能量,包括:选择当前帧音频的非语音频带,并计算当前帧音频对应的伪谱中值;根据伪谱中值、噪声更新速度参数以及上一帧音频的滑动平均能量,计算得到当前帧音频对应的当前帧滑动平均能量,并作为当前帧音频的噪声能量。
[0088]
本技术的音频编码方法通过利用编码器中已有的编码流程对音频数据进行编码,同时利用伪谱平坦度设定噪声更新速度参数,进行多帧之间的过渡,具有低功耗、低延迟的特点,提升用户使用体验。
[0089]
在本技术的一个实施方式中,一种计算机可读存储介质,其存储有计算机指令,其中计算机指令被操作以执行任一实施例描述的检测和消除噪声的方法或音频编码方法。其中,该存储介质可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
[0090]
软件模块可驻留在ram存储器、快闪存储器、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、可装卸盘、cd-rom或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
[0091]
处理器可以是中央处理单元(英文:central processing unit,简称:cpu),还可以是其他通用处理器、数字信号处理器(英文:digital signal processor,简称:dsp)、专用集成电路(英文:application specific integrated circuit,简称:asic)、现场可编程门阵列(英文:field programmable gate array,简称:fpga)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如dsp与微处理器的组合、多个微处理器、结合dsp核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在asic中。asic可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
[0092]
在本技术的一个具体实施方式中,一种计算机设备,其包括处理器和存储器,存储器存储有计算机指令,其中:处理器操作计算机指令以执行任一实施例描述的检测和消除噪声的方法或音频编码方法。
[0093]
在本技术所提供的实施方式中,应该理解到,所揭露的装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集
成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0094]
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0095]
以上仅为本技术的实施例,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。

技术特征:


1.一种检测和消除噪声的方法,其特征在于,包括:在具有改进型离散余弦变换处理的编解码器对音频的编码或解码过程中,获取当前帧音频对应的原始频域谱系数;根据所述原始频域谱系数计算所述当前帧音频的伪谱平坦度;在所述伪谱平坦度大于预设门限的条件下,根据所述伪谱平坦度设定噪声更新速度参数;根据所述噪声更新速度参数计算所述当前帧音频的噪声能量;以及根据所述原始频域谱系数和所述噪声能量计算得到所述当前帧音频的更新谱系数,并根据所述更新谱系数进行后续的编码或解码过程。2.根据权利要求1所述的检测和消除噪声的方法,其特征在于,所述在具有改进型离散余弦变换处理的编解码器对音频的编码或解码过程中,获取当前帧音频对应的原始频域谱系数,包括:在所述编解码器的标准编码或解码过程中,对所述当前帧音频进行改进型离散余弦变换,得到所述原始频域谱系数。3.根据权利要求1所述的检测和消除噪声的方法,其特征在于,所述根据所述原始频域谱系数计算所述当前帧音频的伪谱平坦度,包括:根据所述原始频域谱系数计算所述当前帧音频对应的伪谱;根据所述伪谱,计算并得到所述当前帧音频对应的伪谱几何平均值和伪谱算术平均值;根据所述伪谱几何平均值和所述伪谱算术平均值计算得到所述伪谱平坦度。4.根据权利要求1所述的检测和消除噪声的方法,其特征在于,所述在所述伪谱平坦度大于预设门限的条件下,根据所述伪谱平坦度设定噪声更新速度参数,包括:根据所述伪谱平坦度的大小设定所述噪声更新速度参数,其中所述噪声更新速度参数的大小与所述伪谱平坦度的大小成正比例关系。5.根据权利要求4所述的检测和消除噪声的方法,其特征在于,所述在所述伪谱平坦度大于预设门限的条件下,根据所述伪谱平坦度设定噪声更新速度参数,还包括:在所述伪谱平坦度大于预设门限的条件下,判断在所述当前帧音频之前的预设数目帧音频中,是否存在一个音频帧对应的伪谱平坦度小于所述预设门限;若否,则根据所述当前帧音频对应的所述伪谱平坦度的大小设定所述噪声更新速度参数。6.根据权利要求1所述的检测和消除噪声的方法,其特征在于,所述根据所述噪声更新速度参数计算所述当前帧音频的噪声能量,包括:选择所述当前帧音频的非语音频带,并计算所述当前帧音频对应的伪谱中值;根据所述伪谱中值、所述噪声更新速度参数以及上一帧音频的滑动平均能量,计算得到所述当前帧音频对应的当前帧滑动平均能量,并作为所述当前帧音频的噪声能量。7.一种检测和消除噪声的装置,其特征在于,包括:频域谱系数获取模块,其在具有改进型离散余弦变换处理的编解码器对音频的编码或解码过程中,获取所述当前帧音频对应的原始频域谱系数;伪谱平坦度计算模块,其根据所述原始频域谱系数计算所述当前帧音频的伪谱平坦
度;噪声更新速度参数确定模块,其在所述伪谱平坦度大于预设门限的条件下,根据所述伪谱平坦度设定噪声更新速度参数;噪声能量计算模块,其根据所述噪声更新速度参数计算所述当前帧音频的噪声能量;以及谱系数更新模块,其根据所述原始频域谱系数和所述噪声能量计算得到所述当前帧音频的更新谱系数,并根据所述更新谱系数进行后续的编码或解码过程。8.一种音频编码方法,其特征在于,包括:在具有改进型离散余弦变换处理的编码器对音频的编码过程中,获取当前帧音频对应的原始频域谱系数;根据所述原始频域谱系数计算所述当前帧音频的伪谱平坦度;在所述伪谱平坦度大于预设门限的条件下,根据所述伪谱平坦度设定噪声更新速度参数;根据所述噪声更新速度参数计算所述当前帧音频的噪声能量;以及根据所述原始频域谱系数和所述噪声能量计算得到所述当前帧音频的更新谱系数;根据所述更新谱系数对编码器中的其他编码模块进行更新,并利用更新后的编码模块对所述当前帧音频继续进行编码。9.一种计算机可读存储介质,其存储有计算机程序,其中所述计算机程序被操作以执行权利要求1-6中任一项所述的检测和消除噪声的方法或权利要求8中所述的音频编码方法。10.一种计算机设备,其包括处理器和存储器,所述存储器存储有计算机程序,其中:所述处理器操作所述计算机程序以执行权利要求1-6中任一项所述的检测和消除噪声的方法或权利要求8中所述的音频编码方法。

技术总结


本申请公开了一种检测和消除噪声的方法、装置、编码方法、介质及设备,属于蓝牙技术领域,该方法包括:在具有改进型离散余弦变换处理的编解码器对音频的编码或解码过程中,获取当前帧音频对应的原始频域谱系数;根据原始频域谱系数计算伪谱平坦度;在伪谱平坦度大于预设门限的条件下,根据伪谱平坦度设定噪声更新速度参数并计算当前帧音频的噪声能量;以及根据原始频域谱系数和噪声能量计算得到当前帧音频的更新谱系数,并根据更新谱系数进行后续的编码或解码过程。本申请通过利用编码器中已有的编码流程对音频数据进行编码,同时利用伪谱平坦度设定噪声更新速度参数,进行多帧之间的过渡,降低功耗和延迟,提升用户使用体验。提升用户使用体验。提升用户使用体验。


技术研发人员:

李强 王尧 叶东翔 朱勇

受保护的技术使用者:

北京百瑞互联技术股份有限公司

技术研发日:

2022.09.29

技术公布日:

2023/3/7

本文发布于:2024-09-22 18:18:31,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/70632.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:噪声   谱系   音频   平坦
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议