音频的处理方法、装置、设备和系统与流程



1.本发明涉及录音技术领域,具体涉及一种音频的处理方法、装置、设备和系统。


背景技术:



2.除了录音笔以外,手机、智能手表等设备,也具备一定的录音功能。目前大部分具备录音功能的设备通过降噪算法消除环境噪音,凸显人声,以提升人声的清晰度与语音识别的准确性。
3.但是,现有技术中采用的降噪算法具有一定的局限性,当被录音的人离录音笔过远时,声音小,录音效果差,语音识别精度低;当被录音的人离录音笔过近时,录取声音过大,导致齿音与爆破声的问题突出。无论被录音的人离录音笔过远还是过近,都会导致语音不清晰。为了保证清晰的录音,需要被录音的人在一个较小的距离范围内使用录音设备,导致使用不便。


技术实现要素:



4.有鉴于此,本发明的目的在于提供一种音频的处理方法、装置、设备和系统,以克服目前为了保证清晰的录音,需要被录音的人在一个较小的距离范围内使用录音设备,导致使用不便的问题。
5.为实现以上目的,本发明采用如下技术方案:
6.一方面,本发明提供了一种音频的处理方法,包括:
7.获取待处理的音频信息
8.判断所述音频信息中,是否包含有预先采集的声音信息;
9.若所述音频信息中包含有预先采集的声音信息,则提取所述声音信息;
10.调整模拟数字转换器的输出增益,以使所述声音信息的音量在预设的音量区间内。
11.进一步的,以上所述的音频的处理方法,所述调整模拟数字转换器的输出增益,以使所述声音信息的音量在预设的音量区间内,包括:
12.判断所述声音信息的音量参数值是否在预设的音量参数区间内;
13.若所述声音信息的音量参数值没有在所述预设的音量参数区间内,并且,所述声音信息的音量参数值大于所述预设的音量参数区间的上限值,则降低所述模拟数字转换器的输出增益,以使所述声音信息的音量在预设的音量区间内;
14.若所述声音信息的音量参数值没有在所述预设的音量参数区间内,并且,所述声音信息的音量参数值小于所述预设的音量参数区间的下限值,则提高所述模拟数字转换器的输出增益,以使所述声音信息的音量在预设的音量区间内。
15.进一步的,以上所述的音频的处理方法,所述音量参数包括振幅。
16.进一步的,以上所述的音频的处理方法,所述音量参数区间为40~60分贝。
17.进一步的,以上所述的音频的处理方法,所述调整模拟数字转换器的输出增益,包
括:
18.向所述模拟数字转换器的寄存器写入预设数值,以调整所述模拟数字转换器的输出增益。
19.进一步的,以上所述的音频的处理方法,所述模拟数字转换器的输出增益包括输出电压增益。
20.进一步的,以上所述的音频的处理方法,所述判断所述音频信息中,是否包含有预先采集的声音特征信息之前,还包括:
21.采集特征音频信息;
22.解析并存储所述特征音频信息中的所述声音信息。
23.另一方面,本发明还提供了一种音频的处理装置,包括:
24.获取模块,用于获取待处理的音频信息;
25.判断模块,用于判断所述音频信息中,是否包含有预先采集的声音信息;
26.提取模块,用于若所述音频信息中包含有预先采集的声音信息,则提取所述声音信息;
27.调整模块,用于调整模拟数字转换器的输出增益,以使所述声音信息的音量在预设的音量区间内。
28.另一方面,本发明还提供了一种音频的处理设备,包括处理器和存储器,所述处理器与存储器相连:
29.其中,所述处理器,用于调用并执行所述存储器中存储的程序;
30.所述存储器,用于存储所述程序,所述程序至少用于执行以上任一项所述的音频的处理方法。
31.进一步的,以上所述的音频的处理设备,所述音频的处理设备包括但不限于录音笔、手机和平板电脑。
32.另一方面,本发明还提供了一种音频的处理系统,包括录音设备和云端服务器;
33.所述录音设备和云端服务器无线通讯连接;
34.所述录音设备用于获取待处理的音频信息,将所述音频信息发送给云端服务器;
35.所述云端服务器用于判断所述音频信息中,是否包含有预先采集的声音信息,若所述音频信息中包含有预先采集的声音信息,则提取所述声音信息,并将所述声音信息发送给所述录音设备;
36.所述录音设备,用于调整模拟数字转换器的输出增益,以使所述声音信息的音量在预设的音量区间内。
37.进一步的,以上所述的音频的处理系统,所述录音设备包括但不限于录音笔、手机和平板电脑。
38.本发明的音频的处理方法、装置、设备和系统,方法包括获取待处理的音频信息,判断音频信息中,是否包含有预先采集的声音信息,若音频信息中包含有预先采集的声音信息,则提取声音信息,调整模拟数字转换器的输出增益,以使声音信息的音量在预设的音量区间内。采用本发明的技术方案,能够锁定一个或多个声音信息并进行提取,以过滤掉齿音、爆破声等环境杂音。由于本技术能够通过调整模拟数字转换器的输出增益对声音信息的音量进行调整,不仅使用户能够在一个较大的距离范围内使用录音设备,方便用户的使
用,而且在进行放大时不会放大环境杂音,进一步保证了声音信息的清晰度。
附图说明
39.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
40.图1是本发明音频的处理方法一种实施例提供的流程图;
41.图2是本发明音频的处理装置一种实施例提供的结构示意图;
42.图3是本发明音频的处理设备一种实施例提供的结构示意图;
43.图4是本发明音频的处理系统一种实施例提供的结构示意图。
具体实施方式
44.为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
45.图1是本发明音频的处理方法一种实施例提供的流程图。如图1,本实施例的音频的处理方法可以包括以下步骤:
46.s11、获取待处理的音频信息。
47.本技术的实施例中,可以获取待处理的音频信息。
48.在一个可选的实施例中,待处理的音频信息可以通过具备录音功能的设备获取,例如,通过录音笔、具备录音功能的手机、平板电脑和计算机等设备获取待处理的音频信息。
49.s12、判断音频信息中,是否包含有预先采集的声音信息。
50.本技术的实施例中,可以进一步检测上述获取到的音频信息中,是否包含有预先采集的声音信息。具体的,可以分析音频信息中,是否包含预先采集的声音信息的声纹特征,如果音频信息中,包含预先采集的声音信息的声纹特征,则表示音频信息中包含有预先采集的声音信息。
51.需要说明的是,本步骤可以通过现有技术中的语音识别技术实现声纹特征的识别,进而确定音频信息中是否包含有预先采集的声音信息。例如,现有技术中科大讯飞声纹识别技术能提取声纹特征并进行身份识别。因此,本领域的技术人员参照现有技术即可,此处不做赘述。
52.s13、若音频信息中包含有预先采集的声音信息,则提取声音信息。
53.如果经过判断,确定音频信息中包含有预先采集的声音信息,那么可以将该声音信息从音频信息中单独提取出来。
54.s14、调整模拟数字转换器的输出增益,以使声音信息的音量在预设的音量区间内。
55.本步骤中,可以通过调整模拟数字转换器的输出增益,实现对声音信息的音量调
整,避免声音的音量过大或者过小,影响正常播放。
56.具体的,可以通过如下步骤调整模拟数字转换器的输出增益,以使声音信息的音量在预设的音量区间内:
57.步骤一、判断声音信息的音量参数值是否在预设的音量参数区间内;
58.步骤二、若声音信息的音量参数值没有在预设的音量参数区间内,并且,声音信息的音量参数值大于预设的音量参数区间的上限值,则降低模拟数字转换器的输出增益,以使声音信息的音量在预设的音量区间内;
59.步骤三、若声音信息的音量参数值没有在预设的音量参数区间内,并且,声音信息的音量参数值小于预设的音量参数区间的下限值,则提高模拟数字转换器的输出增益,以使声音信息的音量在预设的音量区间内。
60.具体的,当检测到声音信息的音量参数值没有在预设的音量参数区间内,并且,声音信息的音量参数值大于预设的音量参数区间的上限值,则说明当前的音量较大,可以降低模拟数字转换器的输出增益进一步降低音量,以使声音信息的音量在预设的音量区间内;当检测到声音信息的音量参数值没有在预设的音量参数区间内,并且,声音信息的音量参数值小于预设的音量参数区间的下限值,则说明当前的音量较小,可以提高模拟数字转换器的输出增益进一步提高音量,以使声音信息的音量在预设的音量区间内;如果声音信息的音量参数值在预设的音量参数区间内,则可以不做调整。
61.在一个可选的实施例中,可以将声音的振幅作为音量参数。可以将音量参数区间设置为40~60分贝。一般的,10~20分贝为低音量,20~40分贝为中低音量,60~80分贝为中高音量,80~100分贝为高分贝,100分贝以上即为超高音量。若音量参数区间在40~60分贝之外,则需要对调整模拟数字转换器的输出增益进行调整,以使声音信息的音量在预设的音量区间内。
62.在一个可选的实施例中,具体可以通过如下步骤对模拟数字转换器的输出增益进行调整:向模拟数字转换器的寄存器写入预设数值,以调整模拟数字转换器的输出增益。
63.具体的,可以调用模拟数字转换器驱动程序通过i2c总线向模拟数字转换器的寄存器写入值,通过在模拟数字转换器的寄存器中写入值,改变模拟数字转换器内部电气数值,实现对输出电压增益的调整。例如,0
×
20为控制增益的寄存器地址,写入的数值0
×
03为比现在提高一级增益,以实现增大模拟数字转换器的输出增益。
64.在一个可选的实施例中,模拟数字转换器的输出增益包括输出电压增益。即若声音信息的音量参数值没有在预设的音量参数区间内,并且,声音信息的音量参数值大于预设的音量参数区间的上限值,则降低模拟数字转换器的输出电压增益;若声音信息的音量参数值没有在预设的音量参数区间内,并且,声音信息的音量参数值小于预设的音量参数区间的下限值,则提高模拟数字转换器的输出电压增益。
65.本实施例的音频的处理方法,包括获取待处理的音频信息,判断音频信息中,是否包含有预先采集的声音信息,若音频信息中包含有预先采集的声音信息,则提取声音信息,调整模拟数字转换器的输出增益,以使声音信息的音量在预设的音量区间内。采用本发明的技术方案,能够锁定一个或多个声音信息并进行提取,以过滤掉齿音、爆破声等环境杂音。由于本技术能够通过调整模拟数字转换器的输出增益对声音信息的音量进行调整,不仅使用户能够在一个较大的距离范围内使用录音设备,方便用户的使用,而且在进行放大
时不会放大环境杂音,进一步保证了声音信息的清晰度。而且,本实施例能够过滤无关的人声或其它噪声对录音的干扰,提高录音的专注度,适用于关键人物讲话的场所。
66.在一个可选的实施例中,在以上实施例的步骤s12之前,还包括如下步骤:
67.步骤一、采集特征音频信息;
68.步骤二、解析并存储特征音频信息中的声音信息。
69.本实施例中,可以先采集需要提取的用户的特征音频信息,解析并存储特征音频信息中的声音信息。需要说明的是,本步骤中解析特征音频信息中的声音信息,也可以基于现有技术中的声纹识别技术实现,本领域的技术人员参照现有技术即可,此处不做赘述。
70.基于一个总的发明构思,本发明还提供了一种音频的处理装置,用于实现上述方法实施例。图2是本发明音频的处理装置一种实施例提供的结构示意图,如图2所示,本实施例的装置包括:
71.获取模块21,用于获取待处理的音频信息;
72.判断模块22,用于判断音频信息中,是否包含有预先采集的声音信息;
73.提取模块23,用于若音频信息中包含有预先采集的声音信息,则提取声音信息;
74.调整模块24,用于调整模拟数字转换器的输出增益,以使声音信息的音量在预设的音量区间内。
75.在一个可选的实施例中,调整模块24,具体用于判断声音信息的音量参数值是否在预设的音量参数区间内;若声音信息的音量参数值没有在预设的音量参数区间内,并且,声音信息的音量参数值大于预设的音量参数区间的上限值,则降低模拟数字转换器的输出增益,以使声音信息的音量在预设的音量区间内;若声音信息的音量参数值没有在预设的音量参数区间内,并且,声音信息的音量参数值小于预设的音量参数区间的下限值,则提高模拟数字转换器的输出增益,以使声音信息的音量在预设的音量区间内。
76.在一个可选的实施例中,音量参数包括振幅。
77.在一个可选的实施例中,音量参数区间为40~60分贝。
78.在一个可选的实施例中,调整模块24,具体用于向模拟数字转换器的寄存器写入预设数值,以调整模拟数字转换器的输出增益。
79.在一个可选的实施例中,模拟数字转换器的输出增益包括输出电压增益。
80.在一个可选的实施例中,音频的处理装置还包括采集模块和解析模块;
81.采集模块,用于采集特征音频信息;
82.解析模块,用于解析并存储特征音频信息中的声音信息。
83.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
84.基于一个总的发明构思,本发明还提供了一种音频的处理设备,用于实现上述方法实施例。图3是本发明音频的处理设备一种实施例提供的结构示意图,如图3所示,本实施例的音频的处理设备包括处理器31和存储器32,处理器31与存储器32相连。其中,处理器31用于调用并执行存储器32中存储的程序;存储器32用于存储程序,程序至少用于执行以上实施例中的音频的处理方法。
85.在一个可选的实施例中,音频的处理设备包括但不限于录音笔、手机和平板电脑等电子设备。
86.基于一个总的发明构思,本发明还提供了一种音频的处理系统,用于实现上述方法实施例。图4是本发明音频的处理系统一种实施例提供的结构示意图,如图4所示,本实施例的音频的处理系统包括录音设备41和云端服务器42。其中,录音设备41和云端服务器42通过无线网进行交互,实现无线通讯连接。
87.其中,录音设备41用于获取待处理的音频信息,将音频信息发送给云端服务器42,由云端服务器42对音频信息进行解析。云端服务器42具体用于判断音频信息中,是否包含有预先采集的声音信息,若音频信息中包含有预先采集的声音信息,则提取声音信息,并将声音信息发送给录音设备。录音设备41,用于调整模拟数字转换器的输出增益,以使声音信息的音量在预设的音量区间内。
88.具体的,录音设备41从云端服务器42获取到数据后可以另外开启一个线程处理,每一秒或两秒采集一次数据。以判断声音信息的音量参数值是否在预设的音量参数区间内;若声音信息的音量参数值没有在预设的音量参数区间内,并且,声音信息的音量参数值大于预设的音量参数区间的上限值,则降低模拟数字转换器的输出增益,以使声音信息的音量在预设的音量区间内;若声音信息的音量参数值没有在预设的音量参数区间内,并且,声音信息的音量参数值小于预设的音量参数区间的下限值,则提高模拟数字转换器的输出增益,以使声音信息的音量在预设的音量区间内。
89.在一个可选的实施例中,音量参数包括振幅。
90.在一个可选的实施例中,音量参数区间为40~60分贝。
91.在一个可选的实施例中,录音设备41通过向模拟数字转换器的寄存器写入预设数值,以调整模拟数字转换器的输出增益。
92.在一个可选的实施例中,判断音频信息中,是否包含有预先采集的声音特征信息之前,录音设备41用于采集特征音频信息,并将特征音频信息发送给云端服务器42,云端服务器42解析并存储特征音频信息中的声音信息。
93.可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
94.需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
95.流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
96.应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
97.本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
98.此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
99.上述提到的存储介质可以是只读存储器,磁盘或光盘等。
100.在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
101.尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

技术特征:


1.一种音频的处理方法,其特征在于,包括:获取待处理的音频信息;判断所述音频信息中,是否包含有预先采集的声音信息;若所述音频信息中包含有预先采集的声音信息,则提取所述声音信息;调整模拟数字转换器的输出增益,以使所述声音信息的音量在预设的音量区间内。2.根据权利要求1所述的音频的处理方法,其特征在于,所述调整模拟数字转换器的输出增益,以使所述声音信息的音量在预设的音量区间内,包括:判断所述声音信息的音量参数值是否在预设的音量参数区间内;若所述声音信息的音量参数值没有在所述预设的音量参数区间内,并且,所述声音信息的音量参数值大于所述预设的音量参数区间的上限值,则降低所述模拟数字转换器的输出增益,以使所述声音信息的音量在预设的音量区间内;若所述声音信息的音量参数值没有在所述预设的音量参数区间内,并且,所述声音信息的音量参数值小于所述预设的音量参数区间的下限值,则提高所述模拟数字转换器的输出增益,以使所述声音信息的音量在预设的音量区间内。3.根据权利要求2所述的音频的处理方法,其特征在于,所述音量参数包括振幅。4.根据权利要求2所述的音频的处理方法,其特征在于,所述音量参数区间为40~60分贝。5.根据权利要求1所述的音频的处理方法,其特征在于,所述调整模拟数字转换器的输出增益,包括:向所述模拟数字转换器的寄存器写入预设数值,以调整所述模拟数字转换器的输出增益。6.根据权利要求1所述的音频的处理方法,其特征在于,所述模拟数字转换器的输出增益包括输出电压增益。7.根据权利要求1所述的音频的处理方法,其特征在于,所述判断所述音频信息中,是否包含有预先采集的声音特征信息之前,还包括:采集特征音频信息;解析并存储所述特征音频信息中的所述声音信息。8.一种音频的处理装置,其特征在于,包括:获取模块,用于获取待处理的音频信息;判断模块,用于判断所述音频信息中,是否包含有预先采集的声音信息;提取模块,用于若所述音频信息中包含有预先采集的声音信息,则提取所述声音信息;调整模块,用于调整模拟数字转换器的输出增益,以使所述声音信息的音量在预设的音量区间内。9.一种音频的处理设备,其特征在于,包括处理器和存储器,所述处理器与存储器相连:其中,所述处理器,用于调用并执行所述存储器中存储的程序;所述存储器,用于存储所述程序,所述程序至少用于执行权利要求1-7任一项所述的音频的处理方法。10.根据权利要求9所述的音频的处理设备,其特征在于,所述音频的处理设备包括但
不限于录音笔、手机和平板电脑。11.一种音频的处理系统,其特征在于,包括录音设备和云端服务器;所述录音设备和云端服务器无线通讯连接;所述录音设备用于获取待处理的音频信息,将所述音频信息发送给云端服务器;所述云端服务器用于判断所述音频信息中,是否包含有预先采集的声音信息,若所述音频信息中包含有预先采集的声音信息,则提取所述声音信息,并将所述声音信息发送给所述录音设备;所述录音设备,用于调整模拟数字转换器的输出增益,以使所述声音信息的音量在预设的音量区间内。12.根据权利要求11所述的音频的处理系统,其特征在于,所述录音设备包括但不限于录音笔、手机和平板电脑。

技术总结


本发明涉及录音技术领域,具体涉及一种音频的处理方法、装置、设备和系统,方法包括获取待处理的音频信息,判断音频信息中,是否包含有预先采集的声音信息,若音频信息中包含有预先采集的声音信息,则提取声音信息,调整模拟数字转换器的输出增益,以使声音信息的音量在预设的音量区间内。采用本发明的技术方案,能够锁定一个或多个声音信息并进行提取,以过滤掉齿音、爆破声等环境杂音。由于本申请能够通过调整模拟数字转换器的输出增益对声音信息的音量进行调整,不仅使用户能够在一个较大的距离范围内使用录音设备,方便用户的使用,而且在进行放大时不会放大环境杂音,进一步保证了声音信息的清晰度。了声音信息的清晰度。了声音信息的清晰度。


技术研发人员:

张海伦 陈金奇 王天伦

受保护的技术使用者:

珠海格力电器股份有限公司

技术研发日:

2021.11.22

技术公布日:

2022/3/3

本文发布于:2024-09-22 01:40:40,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/4514.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:音量   所述   信息   声音
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议