声学装置的制作方法


声学装置
交叉引用
1.本技术要求于2021年4月25日提交的申请号为pct/cn2021/089670的国际申请的优先权,其全部内容通过引用结合于此。
技术领域
2.本技术涉及声学领域,特别涉及一种声学装置。


背景技术:



3.声学装置允许用户在收听音频内容、进行语音通话的同时保证用户交互内容的私密性,且收听时不打扰到周围人。声学装置通常可以分为入耳式声学装置和开放式声学装置两类。入耳式声学装置在使用过程中会堵塞用户耳部,且用户在长时间佩戴时容易产生堵塞、异物、胀痛等感受。开放式声学装置可以开放用户耳部,有利于长期佩戴,但当外界噪声较大时,其降噪效果不明显,降低得用户听觉体验。
4.因此,希望提供一种声学装置,可以开放用户双耳以及提高用户听觉体验。


技术实现要素:



5.本技术实施例之一提供一种声学装置。该声学装置可以包括麦克风阵列、处理器和至少一个扬声器。所述麦克风阵列可以被配置为拾取环境噪声。所述处理器可以被配置为利用所述麦克风阵列对目标空间位置的声场进行估计。所述目标空间位置可以比所述麦克风阵列中任一麦克风更加靠近用户耳道。所述处理器可以进一步被配置为基于所述拾取的环境噪声和所述目标空间位置的声场估计生成降噪信号。所述至少一个扬声器可以被配置为根据所述降噪信号输出目标信号。所述目标信号可以用于降低所述环境噪声。所述麦克风阵列可以设置在目标区域以使所述麦克风阵列受来自所述至少一个扬声器的干扰信号最小。
6.在一些实施例中,所述基于所述拾取的环境噪声和所述目标空间位置的声场估计生成降噪信号可以包括基于所述拾取的环境噪声估计所述目标空间位置的噪声以及基于所述目标空间位置的噪声和所述目标空间位置的声场估计生成所述降噪信号。
7.在一些实施例中,所述声学装置可以进一步包括一个或多个传感器,用于获取所述声学装置的运动信息。所述处理器可以进一步被配置为基于所述运动信息更新所述目标空间位置的噪声和所述目标空间位置的声场估计以及基于所述更新后的目标空间位置的噪声和所述更新后的目标空间位置的声场估计生成所述降噪信号。
8.在一些实施例中,所述基于所述拾取的环境噪声估计所述目标空间位置的噪声可以包括确定一个或多个与所述拾取的环境噪声有关的空间噪声源以及基于所述空间噪声源,估计所述目标空间位置的噪声。
9.在一些实施例中,所述利用所述麦克风阵列对目标空间位置的声场进行估计可以包括基于所述麦克风阵列构建虚拟麦克风,所述虚拟麦克风包括数学模型或机器学习模
型,用于表示若所述目标空间位置处包括麦克风后所述麦克风采集的音频数据,以及基于所述虚拟麦克风对所述目标空间位置的声场进行估计。
10.在一些实施例中,所述基于所述拾取的环境噪声和所述目标空间位置的声场估计生成降噪信号可以包括基于所述虚拟麦克风估计所述目标空间位置的噪声以及基于所述目标空间位置的噪声和所述目标空间位置的声场估计生成所述降噪信号。
11.在一些实施例中,所述至少一个扬声器可以是骨导扬声器。所述干扰信号可以包括所述骨导扬声器的漏音信号和振动信号。所述目标区域可以为传递到所述麦克风阵列的所述骨导扬声器的所述漏音信号和所述振动信号的总能量最小的区域。
12.在一些实施例中,所述目标区域的位置可以与所述麦克风阵列中的麦克风的振膜的朝向有关。所述麦克风的振膜的朝向可以降低所述麦克风接收到的所述骨导扬声器的所述振动信号的大小。所述麦克风的振膜的朝向可以使得所述麦克风接收到的所述骨导扬声器的所述振动信号与所述麦克风接收到的所述骨导扬声器的所述漏音信号至少部分互相抵消。所述麦克风接收到的所述骨导扬声器的所述振动信号可以降低所述麦克风接收到的所述骨导扬声器的所述漏音信号5-6db。
13.在一些实施例中,所述至少一个扬声器可以是气导扬声器。所述目标区域可以为所述气导扬声器的辐射声场的声压级最小区域。
14.在一些实施例中,所述处理器可以进一步被配置为基于传递函数处理所述降噪信号。所述传递函数可以包括第一传递函数和第二传递函数。所述第一传递函数可以表示从所述至少一个扬声器发出到所述目标信号和所述环境噪声抵消的位置所述目标信号的参数的变化。所述第二传递函数可以表示从所述目标空间位置到所述目标信号和所述环境噪声抵消的位置所述环境噪声的参数的变化。所述至少一个扬声器可以进一步被配置为根据所述处理后的降噪信号输出所述目标信号。
15.在一些实施例中,所述基于所述拾取的环境噪声和所述目标空间位置的声场估计生成降噪信号可以包括将所述拾取的环境噪声划分为多个频带,所述多个频带对应不同的频率范围,以及对于所述多个频带中的至少一个,生成与所述至少一个频带中的每一个对应的降噪信号。
16.在一些实施例中,所述处理器可以进一步被配置为基于所述目标空间位置的声场估计对所述目标空间位置的噪声进行幅度和相位调整以生成所述降噪信号。
17.在一些实施例中,所述声学装置可以进一步包括固定结构,被配置为将所述声学装置固定在用户耳朵附近且不堵塞用户耳道的位置。
18.在一些实施例中,所声学装置可以进一步包括壳体结构,被配置为承载或容纳所述麦克风阵列、所述处理器和所述至少一个扬声器。
19.本技术实施例之一提供一种降噪方法。所述降噪方法可以包括由麦克风阵列拾取环境噪声。所述降噪方法可以包括由处理器利用所述麦克风阵列对目标空间位置的声场进行估计。所述目标空间位置可以比所述麦克风阵列中任一麦克风更加靠近用户耳道。所述降噪方法可以包括基于所述拾取的环境噪声和所述目标空间位置的声场估计生成降噪信号。所述降噪方法可以进一步包括由至少一个扬声器,根据所述降噪信号输出目标信号。所述目标信号可以用于降低所述环境噪声。所述麦克风阵列可以设置在目标区域以使所述麦克风阵列受来自所述至少一个扬声器的干扰信号最小。
20.本技术的一部分附加特性可以在下面的描述中进行说明。通过对以下描述和相应附图的研究或者对实施例的生产或操作的了解,本技术的一部分附加特性对于本领域技术人员是明显的。本技术的特征可以通过实践或使用以下详细实例中阐述的方法、工具和组合的各个方面来实现和获得。
附图说明
21.本技术将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
22.图1是根据本技术的一些实施例所示的示例性声学装置的结构示意图;
23.图2是根据本技术的一些实施例所示的示例性处理器的结构示意图;
24.图3是根据本技术的一些实施例所示的声学装置的示例性降噪流程图;
25.图4是根据本技术的一些实施例所示的声学装置的示例性降噪流程图;
26.图5a-d是根据本技术一些实施例所示的麦克风阵列的示例性排布方式的示意图;
27.图6a-b是根据本技术一些实施例所示的麦克风阵列的示例性排布方式的示意图;
28.图7是根据本技术一些实施例所示的估计目标空间位置的噪声的示例性流程图;
29.图8是根据本技术一些实施例所示的估计目标空间位置的噪声的示意图;
30.图9是根据本技术一些实施例所示的估计目标空间位置的声场和噪声的示例性流程图;
31.图10是根据本技术一些实施例所示的构建虚拟麦克风的示意图;
32.图11是根据本技术一些实施例所示的骨导扬声器在1000hz时的三维声场漏音信号分布示意图;
33.图12是根据本技术一些实施例所示的骨导扬声器在1000hz时的二维声场漏音信号分布示意图;
34.图13是根据本技术一些实施例所示的骨导扬声器的振动信号和漏音信号的总信号的频率响应示意图;
35.图14a-b是根据本技术一些实施例所示的气导扬声器的声场分布示意图;
36.图15是根据本技术一些实施例所示的基于传递函数输出目标信号的示例性流程图;以及
37.图16是根据本技术一些实施例所示的估计目标空间位置的噪声的示例性流程图。
具体实施方式
38.为了更清楚地说明本技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本技术的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本技术应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
39.应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
40.如本技术和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
41.本技术中使用了流程图用来说明根据本技术的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
42.开放式声学装置(例如开放式声学耳机)是一种可以开放用户耳部的声学设备。开放式声学装置可以通过固定结构(例如,耳挂、头挂、眼镜脚等)将扬声器固定于用户耳朵附近且不堵塞用户耳道的位置。当用户使用开放式声学装置时,外界环境噪音也可以被用户听到,这就使得用户的听觉体验较差。例如,在外界环境噪音较大的场所(例如,街道、景区等),用户在使用开放式声学装置进行音乐播放时,外界环境的噪音会直接进入用户耳道,使得用户听到较大的环境噪音,环境噪音会干扰用户的听音乐体验。又例如,当用户佩戴开放式声学装置进行通话时,麦克风不仅会拾取用户自身的说话声音,也会拾取环境噪音,使得用户通话体验较差。
43.基于上述问题,本技术实施例中提供一种声学装置。该声学装置可以包括麦克风阵列、处理器以及至少一个扬声器。麦克风阵列可以被配置为拾取环境噪声。处理器可以被配置为利用麦克风阵列对目标空间位置的声场进行估计。目标空间位置可以比麦克风阵列中任一麦克风更加靠近用户耳道。可以理解的是,麦克风阵列中的各麦克风可以分布于用户耳道附近的不同位置,利用麦克风阵列中的各麦克风来估计靠近用户耳道位置处(例如,目标空间位置)的声场。处理器可以进一步被配置为基于拾取的环境噪声和目标空间位置的声场估计生成降噪信号。至少一个扬声器可以被配置为根据降噪信号输出目标信号。该目标信号可以用于降低环境噪声。另外,麦克风阵列可以设置在目标区域以使麦克风阵列受来自至少一个扬声器的干扰信号最小。当至少一个扬声器是骨导扬声器时,干扰信号可以包括骨导扬声器的漏音信号和振动信号,目标区域可以为传递到麦克风阵列的骨导扬声器的漏音信号和振动信号的总能量最小的区域。当至少一个扬声器是气导扬声器时,目标区域可以为气导扬声器的辐射声场的声压级最小区域。
44.在本技术的实施例中,通过上述设置利用至少一个扬声器输出的目标信号降低用户耳道(例如,目标空间位置)处的环境噪声,实现了声学装置的主动降噪,提高了用户在使用该声学装置过程中的听觉体验。
45.进一步,在本技术的实施例中,麦克风阵列(也可以称为前馈麦克风)可以同时实现对环境噪声的拾取和对用户耳道(例如,目标空间位置)处声场的估计。
46.另外,在本技术的实施例中,麦克风阵列设置在目标区域,减少或避免了麦克风阵列拾取至少一个扬声器发出的干扰信号(例如,目标信号),从而保障了开放式声学装置的主动降噪的实现。
47.图1是根据本技术的一些实施例所示的示例性声学装置100的结构示意图。在一些实施例中,声学装置100可以为开放式的声学装置。如图1所示,声学装置100可以包括麦克风阵列110、处理器120和扬声器130。在一些实施例中,麦克风阵列110可以拾取环境噪声,
并将拾取到的环境噪声转换为电信号传递至处理器120进行处理。处理器120可以耦接(例如,电连接)麦克风阵列110和扬声器130。处理器120可以接收麦克风阵列110传递的电信号并对其进行处理以生成降噪信号并将生成的降噪信号传递至扬声器130。扬声器130可以根据降噪信号输出目标信号。该目标信号可以用于降低或抵消用户耳道位置处(例如,目标空间位置)的环境噪声,从而实现声学装置100的主动降噪,提高用户在使用声学装置100过程中的听觉体验。
48.麦克风阵列110可以被配置为拾取环境噪声。在一些实施例中,环境噪声可以指用户所处环境中的多种外界声音的组合。仅作为示例,环境噪声可以包括交通噪声、工业噪声、建筑施工噪声、社会噪声等中的一种或多种。交通噪声可以包括但不限于机动车辆的行驶噪声、鸣笛噪声等。工业噪声可以包括但不限于工厂动力机械运转噪声等。建筑施工噪声可以包括但不限于动力机械挖掘噪声、打洞噪声、搅拌噪声等。社会生活环境噪声可以包括但不限于众集会噪声、文娱宣传噪声、人喧闹噪声、家用电器噪声等。在一些实施例中,麦克风阵列110可以设置于用户耳道附近位置,用于拾取传递至用户耳道处的环境噪声,并将拾取的环境噪声转换为电信号传递至处理器120进行处理。在一些实施例中,麦克风阵列110可以设置于用户的左耳和/或右耳处。例如,麦克风阵列110可以包括第一子麦克风阵列和第二子麦克风阵列。第一子麦克风阵列可以位于用户的左耳处,第二子麦克风阵列可以位于用户的右耳处。第一子麦克风阵列和第二子麦克风阵列可以同时进入工作状态或二者中的一个进入工作状态。
49.在一些实施例中,环境噪声可以包括用户讲话的声音。例如,麦克风阵列110可以根据声学装置100的通话状态拾取环境噪声。当声学装置100处于未通话状态时,用户自身说话产生的声音可以被视为环境噪声,麦克风阵列110可以同时拾取用户自身说话的声音以及其他环境噪声。当声学装置100处于通话状态时,用户自身说话产生的声音可以不被视为环境噪声,麦克风阵列110可以拾取除用户自身说话的声音之外环境噪声。例如,麦克风阵列110可以拾取距离麦克风阵列110一定距离(例如,0.5米、1米)之外的噪声源发出的噪声。
50.在一些实施例中,麦克风阵列110可以包括一个或多个气导麦克风。例如,用户在使用声学装置100听取音乐时,气导麦克风可以同时获取外界环境的噪声和用户说话时的声音并将获取的外界环境的噪声和用户说话时的声音一起作为环境噪声。在一些实施例中,麦克风阵列110还可以包括一个或多个骨导麦克风。骨导麦克风可以直接与用户的皮肤接触,用户说话时骨骼或肌肉产生的振动信号可以直接传递给骨导麦克风,进而骨导麦克风将振动信号转换为电信号,并将电信号传递至处理器120进行处理。骨导麦克风也可以不与人体直接接触,用户说话时骨骼或肌肉产生的振动信号可以先传递至声学装置100的壳体结构,再由壳体结构传递至骨导麦克风。在一些实施例中,用户在通话状态时,处理器120可以将气导麦克风采集的声音信号作为环境噪声并利用该环境噪声进行降噪,骨导麦克风采集的声音信号作为语音信号传输至终端设备,从而保证用户通话时的通话质量。
51.在一些实施例中,处理器120可以基于声学装置100的工作状态控制骨导麦克风和气导麦克风的开关状态。声学装置100的工作状态可以指用户佩戴声学装置100时所使用的用途状态。仅作为示例,声学装置100的工作状态可以包括但不限于通话状态、未通话状态(例如,音乐播放状态)、发送语音消息状态等。在一些实施例中,麦克风阵列110拾取环境噪
声时,麦克风阵列110中的骨导麦克风的开关状态和气导麦克风的开关状态可以根据声学装置100的工作状态决定。例如,用户佩戴声学装置100进行音乐播放时,骨导麦克风的开关状态可以为待机状态,气导麦克风的开关状态可以为工作状态。又例如,用户佩戴声学装置100进行发送语音消息时,骨导麦克风的开关状态可以为工作状态,气导麦克风的开关状态可以为工作状态。在一些实施例中,处理器120可以通过发送控制信号控制麦克风阵列110中的麦克风(例如,骨导麦克风、气导麦克风)的开关状态。
52.在一些实施例中,当声学装置100的工作状态为未通话状态(例如,音乐播放状态)时,处理器120可以控制骨导麦克风为待机状态,气导麦克风为工作状态。声学装置100在未通话状态下,用户自身说话的声音信号可以视为环境噪声。这种情况下,气导麦克风拾取的环境噪声中包括的用户自身说话的声音信号可以不被滤除,从而使得用户自身说话的声音信号作为环境噪声的一部分也可以与扬声器130输出的目标信号相抵消。当声学装置100的工作状态为通话状态时,处理器120可以控制骨导麦克风为工作状态,气导麦克风为工作状态。声学装置100在通话状态下,用户自身说话的声音信号需要保留。这种情况下,处理器120可以发送控制信号控制骨导麦克风为工作状态,骨导麦克风拾取用户说话的声音信号,处理器120从气导麦克风拾取的环境噪声中去除骨导麦克风拾取的用户说话的声音信号,以使用户自身说话的声音信号不与扬声器130输出的目标信号相抵消,从而保证用户正常的通话状态。
53.在一些实施例中,当声学装置100的工作状态为通话状态时,若环境噪声的声压大于预设阈值时,处理器120可以控制骨导麦克风保持工作状态。环境噪声的声压可以反映环境噪声的强度。这里的预设阈值可以是预先存储在声学装置100中的数值,例如,50db、60db或70db等其它任意数值。当环境噪声的声压大于预设阈值时,环境噪声会影响用户的通话质量。处理器120可以通过发送控制信号控制骨导麦克风保持工作状态,骨导麦克风可以获取用户讲话时的面部肌肉的振动信号,而基本不会拾取外部环境噪声,此时将骨导麦克风拾取的振动信号作为通话时的语音信号,从而保证用户的正常通话。
54.在一些实施例中,当声学装置100的工作状态为通话状态时,若环境噪声的声压小于预设阈值时,处理器120可以控制骨导麦克风由工作状态切换至待机状态。当环境噪声的声压小于预设阈值时,环境噪声的声压相对于用户说话产生的声音信号的声压较小,通过第一声径传输至用户耳部某个位置的用户说话产生的声音信号被扬声器130输出的通过第二声径传输至用户耳部某个位置的目标信号抵消一部分后,剩余的用户说话产生的声音信号仍可以被用户听觉中枢接收足以保证用户的正常通话。这种情况下,处理器120可以通过发送控制信号控制骨导麦克风由工作状态切换至待机状态,进而降低信号处理复杂度以及声学装置100的功率损耗。
55.在一些实施例中,根据麦克风的工作原理,麦克风阵列110可以包括动圈式麦克风、带式麦克风、电容式麦克风、驻极体式麦克风、电磁式麦克风、碳粒式麦克风等,或其任意组合。在一些实施例中,麦克风阵列110的排布方式可以包括线性阵列(例如,直线形、曲线形)、平面阵列(例如,十字形、圆形、环形、多边形、网状形等规则和/或不规则形状)、立体阵列(例如,圆柱状、球状、半球状、多面体等)等,或其任意组合。关于麦克风阵列110的排布方式的更多介绍可以参考本技术其它地方,例如,图5a-d、图6a-b及其相应描述。
56.处理器120可以被配置为利用麦克风阵列110对目标空间位置的声场进行估计。目
标空间位置的声场可以指声波在目标空间位置处或目标空间位置附近的分布和变化(例如,随时间的变化,随位置的变化)。描述声场的物理量可以包括声压、声音频率,声音幅值、声音相位、声源振动速度、或媒质(例如空气)密度等。通常,这些物理量可以是位置和时间的函数。目标空间位置可以指靠近用户耳道特定距离的空间位置。该目标空间位置可以比麦克风阵列110中任一麦克风更加靠近用户耳道。这里的特定距离可以是固定的距离,例如,0.5cm、1cm、2cm、3cm等。在一些实施例中,目标空间位置可以与麦克风阵列110中各麦克风的数量、相对于用户耳道的分布位置相关。通过调整麦克风阵列110中各麦克风的数量和/或相对于用户耳道的分布位置可以对目标空间位置进行调整。例如,通过增加麦克风阵列110中麦克风的数量可以使目标空间位置更加靠近用户耳道。又例如,还可以通过减小麦克风阵列110中各麦克风的间距使目标空间位置更加靠近用户耳道。再例如,还可以通过改变麦克风阵列110中各麦克风的排列方式使目标空间位置更加靠近用户耳道。
57.处理器120可以进一步被配置为基于拾取的环境噪声和目标空间位置的声场估计生成降噪信号。具体地,处理器120可以接收麦克风阵列110传递的环境噪声转换的电信号并对其进行处理以获取环境噪声的参数(例如,幅值、相位等)。处理器120可以进一步基于目标空间位置的声场估计调整环境噪声的参数(例如,幅值、相位等)以生成降噪信号。该降噪信号的参数(例如,幅值、相位等)与环境噪声的参数相对应。仅作为示例,降噪信号的幅值可以与环境噪声的幅值近似相等,降噪信号的相位可以与环境噪声的相位近似相反。在一些实施例中,处理器120可以包括硬件模块和软件模块。仅作为示例,硬件模块可以包括数字信号处理(digital signal processor,dsp)芯片、高级精简指令集机器(advanced risc machines,arm),软件模块可以包括算法模块。关于处理器120的更多介绍可以参考本技术其它地方,例如,图2及其相应描述。
58.扬声器130可以被配置为根据降噪信号输出目标信号。该目标信号可以用于降低或消除传递到用户耳朵的某个位置处(例如,鼓膜、基底膜)的环境噪声。在一些实施例中,当用户佩戴声学装置100时,扬声器130可以位于用户耳部的附近位置。在一些实施例中,根据扬声器的工作原理,扬声器130可以包括电动式扬声器(例如,动圈式扬声器)、磁式扬声器、离子扬声器、静电式扬声器(或电容式扬声器)、压电式扬声器等中的一种或多种。在一些实施例中,根据扬声器输出的声音的传播方式,扬声器130可以包括气导扬声器和/或骨导扬声器。在一些实施例中,扬声器130的数量可以为一个或多个。当扬声器130的数量为一个时,该扬声器130可以用于输出目标信号以消除环境噪声且可以用于向用户传递用户需要听取的声音信息(例如,设备媒体音频、通话远端音频)。例如,当扬声器130的数量为一个且为气导扬声器时,该气导扬声器可以用于输出目标信号以消除环境噪声。在这种情况下,目标信号可以为声波(即空气的振动),该声波可以通过空气传递到目标空间位置处并与环境噪声在目标空间位置处相互抵消。同时,该气导扬声器还可以用于向用户传递用户需要听取的声音信息。又例如,当扬声器130的数量为一个且为骨导扬声器时,该骨导扬声器可以用于输出目标信号以消除环境噪声。在这种情况下,目标信号可以为振动信号(例如,扬声器壳体的振动),该振动信号可以通过骨头或组织传递到用户的基底膜并与环境噪声在用户的基底膜处相互抵消。同时,该骨导扬声器还可以用于向用户传递用户需要听取的声音信息。当扬声器130的数量为多个时,多个扬声器130中的一部分可以用于输出目标信号以消除环境噪声,另一部分可以用于向用户传递用户需要听取的声音信息(例如,设备媒体
音频、通话远端音频)。例如,当扬声器130的数量为多个且包括骨导扬声器和气导扬声器时,气导扬声器可以用于输出声波以降低或消除环境噪声,骨导扬声器可以用于向用户传递用户需要听取的声音信息。相比于气导扬声器,骨导扬声器可以将机械振动直接通过用户的身体(例如,骨骼、皮肤组织等)传递至用户的听觉神经,在此过程中对于拾取环境噪声的气导麦克风的干扰较小。
59.需要注意的是,扬声器130可以是独立的功能器件,也可以是能够实现多个功能的单个器件的一部分。仅作为示例,扬声器130可以和处理器120集成在一起和/或形成为一体。在一些实施例中,当扬声器130的数量为多个时,多个扬声器130的排布方式可以包括线性阵列(例如,直线形、曲线形)、平面阵列(例如,十字形、网状形、圆形、环形、多边形等规则和/或不规则形状)、立体阵列(例如,圆柱状、球状、半球状、多面体等)等,或其任意组合,本技术在此不做限定。在一些实施例中,扬声器130可以设置于用户的左耳和/或右耳处。例如,扬声器130可以包括第一子扬声器和第二子扬声器。第一子扬声器可以位于用户的左耳处,第二子扬声器可以位于用户的右耳处。第一子扬声器和第二子扬声器可以同时进入工作状态或二者中的一个进入工作状态。在一些实施例中,扬声器130可以为具有定向声场的扬声器,其主瓣的指向用户耳道处。
60.在一些实施例中,声学装置100还可以包括一个或多个传感器140。一个或多个传感器140可以与声学装置100的其他部件(例如,处理器120)电连接。一个或多个传感器140可以用于获取声学装置100的物理位置和/或运动信息。仅作为示例,一个或多个传感器140可以包括惯性测量单元(inertial measurement unit,imu)、全球定位系统(global position system,gps)、雷达等。运动信息可以包括运动轨迹、运动方向、运动速度、运动加速度、运动角速度、运动相关的时间信息(例如运动开始时间,结束时间)等,或其任意组合。以imu为例,imu可以包括微电子机械系统(microelectro mechanical system,mems)。该微电子机械系统可以包括多轴加速度计、陀螺仪、磁力计等,或其任意组合。imu可以用于检测声学装置100的物理位置和/或运动信息,以启用基于物理位置和/或运动信息对声学装置100的控制。关于基于物理位置和/或运动信息对声学装置100的控制的更多介绍可以参考本技术其它地方,例如,图4及其相应描述。
61.在一些实施例中,声学装置100可以包括信号收发器150。信号收发器150可以与声学装置100的其他部件(例如,处理器120)电连接。在一些实施例中,信号收发器150可以包括蓝牙、天线等。声学装置100可以通过信号收发器150与其他外部设备(例如,移动电话、平板电脑、智能手表)进行通信。例如,声学装置100可以通过蓝牙与其他设备进行无线通信。
62.在一些实施例中,声学装置100可以包括壳体结构160。壳体结构160可以被配置为承载声学装置100的其他部件(例如,麦克风阵列110、处理器120、扬声器130、一个或多个传感器140、信号收发器150)。在一些实施例中,壳体结构160可以是内部中空的封闭式或半封闭式结构,且声学装置100的其他部件位于壳体结构内或上。在一些实施例中,壳体结构的形状可以为长方体、圆柱体、圆台等规则或不规则形状的立体结构。当用户佩戴声学装置100时,壳体结构可以位于靠近用户耳朵附近的位置。例如,壳体结构可以位于用户耳廓的周侧(例如,前侧或后侧)。又例如,壳体结构可以位于用户耳朵上但不堵塞或覆盖用户的耳道。在一些实施例中,声学装置100可以为骨导耳机,壳体结构的至少一侧可以与用户的皮肤接触。骨导耳机中声学驱动器(例如,振动扬声器)将音频信号转换为机械振动,该机械振
动可以通过壳体结构以及用户的骨骼传递至用户的听觉神经。在一些实施例中,声学装置100可以为气导耳机,壳体结构的至少一侧可以与用户的皮肤接触或不接触。壳体结构的侧壁上包括至少一个导声孔,气导耳机中的扬声器将音频信号转换为气导声音,该气导声音可以通过导声孔向用户耳朵的方向进行辐射。
63.在一些实施例中,声学装置100可以包括固定结构170。固定结构170可以被配置为将声学装置100固定在用户耳朵附近且不堵塞用户耳道的位置。在一些实施例中,固定结构170可以与声学装置100的壳体结构160物理连接(例如,卡接、螺纹连接等)。在一些实施例中,声学装置100的壳体结构160可以为固定结构170的一部分。在一些实施例中,固定结构170可以包括耳挂、后挂、弹性带、眼镜腿等,使得声学装置100可以更好地固定在用户耳朵附近位置,防止用户在使用时发生掉落。例如,固定结构170可以为耳挂,耳挂可以被配置为围绕耳部区域佩戴。在一些实施例中,耳挂可以是连续的钩状物,并可以被弹性地拉伸以佩戴在用户的耳部,同时耳挂还可以对用户的耳廓施加压力,使得声学装置100牢固地固定在用户的耳部或头部的特定位置上。在一些实施例中,耳挂可以是不连续的带状物。例如,耳挂可以包括刚性部分和柔性部分。刚性部分可以由刚性材料(例如,塑料或金属)制成,刚性部分可以与声学装置100的壳体结构160通过物理连接(例如,卡接、螺纹连接等)的方式进行固定。柔性部分可以由弹性材料(例如,布料、复合材料或/和氯丁橡胶)制成。又例如,固定结构170可以为颈带,被配置为围绕颈/肩区域佩戴。再例如,固定结构170可以为眼镜腿,其作为眼镜的一部分,被架设在用户耳部。
64.在一些实施例中,声学装置100还可以包括用于调整目标信号声压的交互模块(未示出)。在一些实施例中,交互模块可以包括按钮、语音助手、手势传感器等。用户通过控制交互模块可以调整声学装置100的降噪模式。具体地,用户通过控制交互模块可以调整(例如,放大或缩小)降噪信号的幅值信息,以改变扬声器阵列130发出的目标信号的声压,进而达到不同的降噪效果。仅作为示例,降噪模式可以包括强降噪模式、中级降噪模式、弱降噪模式等。例如,用户在室内佩戴声学装置100时,外界环境噪声较小,用户可以通过交互模块将声学装置100的降噪模式关闭或调整为弱降噪模式。又例如,当用户在街边等公共场合行走时佩戴声学装置100,用户需要在收听音频信号(例如,音乐、语音信息)的同时,保持对周围环境的一定感知能力,以应对突发状况,此时用户可以通过交互模块(例如,按钮或语音助手)选择中级降噪模式,以保留周围环境噪声(如警报声、撞击声、汽车鸣笛声等)。再例如,用户在乘坐地铁或飞机等交通工具时,用户可以通过交互模块选择强降噪模式,以进一步降低周围环境噪声。在一些实施例中,处理器120还可以基于环境噪声强度范围向声学装置100或与声学装置100通信连接的终端设备(例如,手机、智能手表等)发出提示信息,以提醒用户调整降噪模式。
65.应当注意的是,以上关于图1的描述仅仅是出于说明的目的而提供的,并不旨在限制本技术的范围。对于本领域的普通技术人员来说,根据本技术的指导可以做出多种变化和修改。在一些实施例中,声学装置100中的一个或多个部件(例如,一个或多个传感器140、信号收发器150、固定结构170、交互模块等)可以省略。在一些实施例中,声学装置100中的一个或多个部件可以被其他能实现类似功能的元件替代。例如,声学装置100可以不包括固定结构170,壳体结构160或其一部分可以为具有人体耳朵适配形状(例如圆环形、椭圆形、多边形(规则或不规则)、u型、v型、半圆形)的壳体结构,以便壳体结构可以挂靠在用户的耳
朵附近。在一些实施例中,声学装置100中的一个部件可以拆分成多个子部件,或者多个部件可以合并为单个部件。这些变化和修改不会背离本技术的范围。
66.图2是根据本技术的一些实施例所示的示例性处理器120的结构示意图。如图2所示,处理器120可以包括模数转换单元210、噪声估计单元220、幅相补偿单元230和数模转换单元240。
67.在一些实施例中,模数转换单元210可以被配置为将麦克风阵列110输入的信号转换为数字信号。具体的,麦克风阵列110拾取环境噪声,并将拾取到的环境噪声转换为电信号传递至处理器120。接收到麦克风阵列110发送的环境噪声的电信号后,模数转换单元210可以将电信号转换为数字信号。在一些实施例中,模数转换单元210可以与麦克风阵列110电连接并进一步与处理器120的其他部件(例如,噪声估计单元220)电连接。进一步,模数转换单元210可以将转换的环境噪声的数字信号传递到噪声估计单元220。
68.在一些实施例中,噪声估计单元220可以被配置为根据接收的环境噪声的数字信号对环境噪声进行估计。例如,噪声估计单元220可以根据接收的环境噪声的数字信号估计目标空间位置处的环境噪声的相关参数。仅作为示例,所述参数可以包括目标空间位置处的噪声的噪声源(例如,噪声源的位置,方位)、传递方向、幅值、相位等,或其任意组合。在一些实施例中,噪声估计单元220还可以被配置为利用麦克风阵列110对目标空间位置的声场进行估计。关于估计目标空间位置的声场的更多介绍可以参考本技术其它地方,例如,图4及其相应描述。在一些实施例中,噪声估计单元220可以与处理器120的其他部件(例如,幅相补偿单元230)电连接。进一步,噪声估计单元220可以将估计的环境噪声相关的参数和目标空间位置的声场传递到幅相补偿单元230。
69.在一些实施例中,幅相补偿单元230可以被配置为根据目标空间位置的声场对估计的环境噪声相关的参数进行补偿。例如,幅相补偿单元230可以根据目标空间位置的声场对环境噪声的幅值和相位进行补偿以获得数字降噪信号。在一些实施例中,幅相补偿单元230可以调整环境噪声的幅值并对环境噪声的相位进行反向补偿以获得数字降噪信号。数字降噪信号的幅值可以与环境噪声对应的数字信号幅值近似相等,数字降噪信号的相位可以与环境噪声对应的数字信号的相位近似相反。在一些实施例中,幅相补偿单元230可以与处理器120的其他部件(例如,数模转换单元240)电连接。进一步,幅相补偿单元230可以将数字降噪信号传递到数模转换单元240。
70.在一些实施例中,数模转换单元240可以被配置为将数字降噪信号转换为模拟信号以获得降噪信号(例如,电信号)。仅作为示例,数模转换单元240可以包括脉冲宽度调制(pulse width modulation,pmw)。在一些实施例中,数模转换单元240可以与处理器120的其他部件(例如,扬声器130)电连接。进一步,数模转换单元240可以将降噪信号传递至扬声器130。
71.在一些实施例中,处理器120可以包括信号放大单元250。信号放大单元250可以被配置为放大输入的信号。例如,信号放大单元250可以放大麦克风阵列110输入的信号。仅作为示例,当声学装置100处于通话状态时,信号放大单元250可以用于放大麦克风阵列110输入的用户说话的声音。又例如,信号放大单元250可以根据目标空间位置的声场对环境噪声的幅值进行放大。在一些实施例中,信号放大单元250可以与处理器120的其他部件(例如,麦克风阵列110、噪声估计单元220、幅相补偿单元230)电连接。
72.应当注意的是,以上关于图2的描述仅仅是出于说明的目的而提供的,并不旨在限制本技术的范围。对于本领域的普通技术人员来说,根据本技术的指导可以做出多种变化和修改。在一些实施例中,处理器120中的一个或多个部件(例如,信号放大单元250)可以省略。在一些实施例中,处理器120中的一个部件可以拆分成多个子部件,或者多个部件可以合并为单个部件。例如,噪声估计单元220和幅相补偿单元230可以集成为一个部件用于实现噪声估计单元220和幅相补偿单元230的功能。这些变化和修改不会背离本技术的范围。
73.图3是根据本技术的一些实施例所示的声学装置的示例性降噪流程图。在一些实施例中,流程300可以由声学装置100执行。如图3所示,流程300可以包括:
74.在步骤310中,拾取环境噪声。在一些实施例中,该步骤可以由麦克风阵列110执行。
75.根据图1中的相关描述,环境噪声可以指用户所处环境中的多种外界声音(例如,交通噪声、工业噪声、建筑施工噪声、社会噪声)的组合。在一些实施例中,麦克风阵列110可以位于用户耳道的附近位置,用于拾取传递至用户耳道处的环境噪声。进一步,麦克风阵列110可以将拾取的环境噪声信号转换为电信号并传递至处理器120进行处理。
76.在步骤320中,基于拾取的环境噪声估计目标空间位置的噪声。在一些实施例中,该步骤可以由处理器120执行。
77.在一些实施例中,处理器120可以对拾取的环境噪声进行信号分离。在一些实施例中,麦克风阵列110拾取的环境噪声可以包括各种声音。处理器120可以对麦克风阵列110拾取的环境噪声进行信号分析,以分离该各种声音。具体地,处理器120可以根据各种声音在空间、时域、频域等不同维度的统计分布特性及结构化特征,自适应调整滤波器的参数,估计环境噪声中各个声音信号的参数信息,并根据各个声音信号的参数信息完成信号分离过程。在一些实施例中,噪声的统计分布特性可以包括概率分布密度、功率谱密度、自相关函数、概率密度函数、方差、数学期望等。在一些实施例中,噪声的结构化特征可以包括噪声分布、噪声强度、全局噪声强度、噪声率等,或其任意组合。全局噪声强度可以指平均噪声强度或加权平均噪声强度。噪声率可以指噪声分布的分散程度。仅作为示例,麦克风阵列110拾取的环境噪声可以包括第一信号、第二信号、第三信号。处理器120获取第一信号、第二信号、第三信号在空间(例如,信号所处位置)、时域(例如,延迟)、频域(例如,幅值、相位)的差异,并根据三种维度上的差异将第一信号、第二信号、第三信号分离,得到相对纯净的第一信号、第二信号、第三信号。进一步,处理器120可以根据分离得到的信号的参数信息(例如,频率信息、相位信息、幅值信息)更新环境噪声。例如,处理器120可以根据第一信号的参数信息确定第一信号为用户的通话声音,并从环境噪声中去除第一信号从而更新环境噪声。在一些实施例中,被去除第一信号可以被传输至通话远端。例如,用户佩戴声学装置100进行语音通话时,第一信号可以被传输至通话远端。
78.目标空间位置是基于麦克风阵列110确定的位于用户耳道或用户耳道附近的位置。根据图1中的相关描述,目标空间位置可以指靠近用户耳道(例如,耳孔)特定距离(例如,0.5cm、1cm、2cm、3cm)的空间位置。在一些实施例中,目标空间位置比麦克风阵列110中任一麦克风更加靠近用户耳道。根据图1中的相关描述,目标空间位置与麦克风阵列110中各麦克风的数量、相对于用户耳道的分布位置相关,通过调整麦克风阵列110中各麦克风的数量和/或相对于用户耳道的分布位置可以对目标空间位置进行调整。在一些实施例中,基
于拾取的环境噪声(或更新后的环境噪声)估计目标空间位置的噪声还可以包括确定一个或多个与拾取的环境噪声有关的空间噪声源,基于空间噪声源估计目标空间位置的噪声。麦克风阵列110拾取的环境噪声可以是来自不同方位、不同种类的空间噪声源。每一个空间噪声源对应的参数信息(例如,频率信息、相位信息、幅值信息)是不同的。在一些实施例中,处理器120可以根据不同类型的噪声在不同维度(例如,空域、时域、频域等)的统计分布和结构化特征将目标空间位置的噪声进行信号分离提取,从而获取不同类型(例如不同频率、不同相位等)的噪声,并估计每种噪声所对应的参数信息(例如,幅值信息、相位信息等)。在一些实施例中,处理器120还可以将根据目标空间位置处不同类型噪声对应的参数信息确定目标空间位置的噪声的整体参数信息。关于基于一个或多个空间噪声源估计目标空间位置的噪声的更多内容可以参考本技术说明书其它地方,例如,图7-8及其相应描述。
79.在一些实施例中,基于拾取的环境噪声(或更新后的环境噪声)估计目标空间位置的噪声还可以包括基于麦克风阵列110构建虚拟麦克风以及基于虚拟麦克风估计目标空间位置的噪声。关于基于虚拟麦克风估计目标空间位置的噪声的更多内容可以参考本技术说明书其它地方,例如图9-10及其相应描述。
80.在步骤330中,基于目标空间位置的噪声生成降噪信号。在一些实施例中,该步骤可以由处理器120执行。
81.在一些实施例中,处理器120可以基于步骤320中获得的目标空间位置的噪声的参数信息(例如,幅值信息、相位信息等)生成降噪信号。在一些实施例中,降噪信号的相位与目标空间位置的噪声的相位的相位差可以小于或等于预设相位阈值。该预设相位阈值可以处于90-180度范围内。该预设相位阈值可以根据用户的需要在该范围内进行调整。例如,当用户不希望被周围环境的声音打扰时,该预设相位阈值可以为较大值,例如180度,即降噪信号的相位与目标空间位置的噪声的相位相反。又例如,当用户希望对周围环境保持敏感时,该预设相位阈值可以为较小值,例如90度。需要注意的是,用户希望接收越多周围环境的声音,该预设相位阈值可以越接近90度,用户希望接收越少周围环境的声音,该预设相位阈值可以越接近180度。在一些实施例中,当降噪信号的相位与目标空间位置的噪声的相位一定的情况下(例如相位相反),目标空间位置的噪声的幅值与该降噪信号的幅值的幅值差可以小于或等于预设幅值阈值。例如,当用户不希望被周围环境的声音打扰时,该预设幅值阈值可以为较小值,例如0db,即降噪信号的幅值与目标空间位置的噪声的幅值相等。又例如,当用户希望对周围环境保持敏感时,该预设幅值阈值可以为较大值,例如约等于目标空间位置的噪声的幅值。需要注意的是,用户希望接收越多周围环境的声音,该预设幅值阈值可以越接近目标空间位置的噪声的幅值,用户希望接收越少周围环境的声音,该预设幅值阈值可以越接近0db。
82.在一些实施例中,扬声器130可以基于处理器120生成的降噪信号输出目标信号。例如,扬声器130可以将降噪信号(例如,电信号)基于扬声器130中的振动组件转化为目标信号(即振动信号),该目标信号可以与环境噪声相互抵消。在一些实施例中,目标空间位置的噪声为多个空间噪声源时,扬声器130可以基于降噪信号输出与多个空间噪声源相对应的目标信号。例如,多个空间噪声源包括第一空间噪声源和第二空间噪声源,扬声器130可以输出与第一空间噪声源的噪声相位近似相反、幅值近似相等的第一目标信号以抵消第一空间噪声源的噪声,与第二空间噪声源的噪声相位近似相反、幅值近似相等的第二目标信
号以抵消第二空间噪声源的噪声。在一些实施例中,当扬声器130为气导扬声器时,目标信号与环境噪声向抵消的位置可以为目标空间位置。目标空间位置与用户耳道之间的间距较小,目标空间位置的噪声可以近似视为用户耳道位置的噪声,因此,降噪信号与目标空间位置的噪声相互抵消,可以近似为传递至用户耳道的环境噪声被消除,实现声学装置100的主动降噪。在一些实施例中,当扬声器130为骨导扬声器时,目标信号与环境噪声向抵消的位置可以为基底膜。目标信号与环境噪声在用户的基底膜被抵消,从而实现声学装置100的主动降噪。
83.应当注意的是,上述有关流程300的描述仅仅是为了示例和说明,而不限定本技术的适用范围。对于本领域技术人员来说,在本技术的指导下可以对流程300进行各种修正和改变。例如,还可以增加、省略或合并流程300中的步骤。又例如,还可以对环境噪声进行信号处理(例如,滤波处理等)。这些修正和改变仍在本技术的范围之内。
84.图4是根据本技术的一些实施例所示的声学装置的示例性降噪流程图。在一些实施例中,流程400可以由声学装置100执行。如图4所示,流程400可以包括:
85.在步骤410中,拾取环境噪声。在一些实施例中,该步骤可以由麦克风阵列110执行。在一些实施例中,可以以与步骤310类似的方式来执行步骤410,并且在此不再重复相关的描述。
86.在步骤420中,基于拾取的环境噪声估计目标空间位置的噪声。在一些实施例中,该步骤可以由处理器120执行。在一些实施例中,可以以与步骤320类似的方式来执行步骤420,并且在此不再重复相关的描述。
87.在步骤430中,对目标空间位置的声场进行估计。在一些实施例中,该步骤可以由处理器120执行。
88.在一些实施例中,处理器120可以利用麦克风阵列110对目标空间位置的声场进行估计。具体地,处理器120可以基于麦克风阵列110构建虚拟麦克风并基于虚拟麦克风对目标空间位置的声场进行估计。关于基于虚拟麦克风对目标空间位置的声场进行估计的更多内容可以参考本技术说明书其它地方,例如,图9-10及其相应描述。
89.在步骤440中,基于目标空间位置的噪声和目标空间位置的声场估计生成降噪信号。在一些实施例中,步骤440可以由处理器120执行。
90.在一些实施例中,处理器120可以根据步骤430中得到的目标空间位置的声场相关的物理量(例如,声压、声音频率,声音幅值、声音相位、声源振动速度、或媒质(例如空气)密度等),调整目标空间位置的噪声的参数信息(例如,频率信息、幅值信息、相位信息)以生成降噪信号。例如,处理器120可以判断与该声场相关的物理量(例如,声音频率,声音幅值、声音相位)与目标空间位置的噪声的参数信息是否相同。如果与该声场相关的物理量与目标空间位置的噪声的参数信息相同,处理器120可以不调整目标空间位置的噪声的参数信息。如果与该声场相关的物理量与目标空间位置的噪声的参数信息不相同,处理器120可以确定与该声场相关的物理量与目标空间位置的噪声的参数信息的差值,并基于该差值调整目标空间位置的噪声的参数信息。仅作为示例,当该差值大于一定范围,处理器120可以将该声场相关的物理量与目标空间位置的噪声的参数信息的平均值作为调整后的目标空间位置的噪声的参数信息并基于调整后的目标空间位置的噪声的参数信息生成降噪信号。又例如,由于环境中的噪声是不断变化的,当处理器120生成降噪信号时,实际环境中目标空间
位置的噪声可能已经发生了细微变化,因此,处理器120可以根据麦克风阵列拾取环境噪声的时间信息和当前时间信息以及目标空间位置的声场相关的物理量(例如,声源振动速度、媒质(例如空气)密度)估计目标空间位置的环境噪声的参数信息的变化量,并基于该变化量调整目标空间位置的噪声的参数信息。经过上述调整可以使得降噪信号的幅值信息、频率信息与当前目标空间位置的环境噪声的幅值信息、频率信息更加吻合,且降噪信号的相位信息与当前目标空间位置的环境噪声的反相位信息更加吻合,从而使得降噪信号可以更加精准的消除环境噪声,提高降噪效果和用户的听觉体验。
91.在一些实施例中,当声学装置100的位置发生变化,例如,佩戴声学装置100的用户的头部发生转动时,环境噪声(例如噪声方向、幅值、相位)随之发生变化,声学装置100执行降噪的速度难以跟上环境噪声改变的速度,导致主动降噪功能失效甚至噪声增大。为此,处理器120可以基于声学装置100的一个或多个传感器140获取的声学装置100的运动信息(例如,运动轨迹、运动方向、运动速度、运动加速度、运动角速度、运动相关的时间信息)更新目标空间位置的噪声和目标空间位置的声场估计。进一步,基于更新后的目标空间位置的噪声和目标空间位置的声场估计,处理器120可以生成降噪信号。一个或多个传感器140可以记录声学装置100的运动信息,进而处理器120可以对降噪信号进行快速的更新,这可以提高声学装置100的噪声跟踪性能,使得降噪信号可以更加精准的消除环境噪声,进一步提高降噪效果和用户的听觉体验。
92.在一些实施例中,处理器120可以将拾取的环境噪声划分为多个频带。多个频带对应不同的频率范围。例如,处理器120可以将拾取的环境噪声划分为100-300hz、300-500hz、500-800hz、800-1500hz四个频带。在一些实施例中,每个频带中包含了对应频率范围的环境噪声的参数信息(例如,频率信息、幅值信息、相位信息)。对于多个频带中的至少一个,处理器120可以对其执行步骤420-440以生成与该至少一个频带中的每一个对应的降噪信号。例如,处理器120可以对四个频带中频带300-500hz和频带500-800hz执行步骤420-440以生成分别与频带300-500hz和频带500-800hz对应的降噪信号。进一步,在一些实施例中,扬声器130可以基于对应各个频带的降噪信号输出与各个频带对应的目标信号。例如,扬声器130可以输出与频带300-500hz的噪声相位近似相反、幅值近似相等的目标信号以抵消频带300-500hz的噪声,与频带500-800hz的噪声相位近似相反、幅值近似相等的目标信号以抵消频带500-800hz的噪声。
93.在一些实施例中,处理器120还可以根据用户的手动输入更新降噪信号。例如,用户在比较嘈杂的外界环境中佩戴声学装置100进行音乐播放时,用户自身的听觉体验效果不理想,用户可以根据自身的听觉效果手动调整降噪信号的参数信息(例如,频率信息、相位信息、幅值信息)。又例如,特殊用户(例如,听力受损用户或者年龄较大用户)在使用声学装置100的过程中,特殊用户的听力能力与普通用户的听力能力存在差异,声学装置100本身生成的降噪信号无法满足特殊用户的需要,导致特殊用户的听觉体验较差。这种情况下,可以预先设置一些降噪信号的参数信息的调整倍数,特殊用户可以根据自身的听觉效果和预先设置的降噪信号的参数信息的调整倍数调整降噪信号,从而更新降噪信号以提高特殊用户的听觉体验。在一些实施例中,用户可以通过声学装置100上的按键手动调整降噪信号。在另一些实施例中,用户可以是通过终端设备调整降噪信号。具体地,声学装置100或者与声学装置100通信连接外部设备(例如,手机、平板电脑、电脑)上可以显示给用户建议的
降噪信号的参数信息,用户可以根据自身的听觉体验情况进行参数信息的微调。
94.应当注意的是,上述有关流程400的描述仅仅是为了示例和说明,而不限定本技术的适用范围。对于本领域技术人员来说,在本技术的指导下可以对流程400进行各种修正和改变。例如,还可以增加、省略或合并流程400中的步骤。这些修正和改变仍在本技术的范围之内。
95.图5a-d是根据本技术一些实施例所示的麦克风阵列(例如麦克风阵列110)的示例性排布方式的示意图。在一些实施例中,麦克风阵列的排布方式可以是规则几何形状。如图5a所示,麦克风阵列可以为线形阵列。在一些实施例中,麦克风阵列的排布方式也可以是其他形状。例如,如图5b所示,麦克风阵列可以为十字形阵列。又例如,如图5c所示,麦克风阵列可以为圆形阵列。在一些实施例中,麦克风阵列的排布方式也可以是不规则几何形状。例如,如图5d所示,麦克风阵列可以为不规则阵列。需要说明的是,麦克风阵列的排布方式不限于图5a-d所示的线形阵列、十字形阵列、圆形阵列、不规则阵列,也可以是其他形状的阵列,例如,三角形阵列、螺旋形阵列、平面阵列、立体阵列、辐射型阵列等,本技术对此不做限定。
96.在一些实施例中,图5a-d中的每一条短实线可以视为一个麦克风或一组麦克风。当每一条短实线被视为一组麦克风时,每组麦克风的数量可以相同或不同,每组麦克风的种类可以相同或不同,每组麦克风的朝向可以相同或不同。麦克风的种类、数量以及朝向可以根据实际应用情况进行适应性调整,本技术对此不做限定。
97.在一些实施例中,麦克风阵列中的麦克风之间可以是均匀分布。这里的均匀分布可以指麦克风阵列中的任意相邻两个麦克风之间的间距相同。在一些实施例中,麦克风阵列中的麦克风也可以是非均匀分布。这里的非均匀分布可以指麦克风阵列中的任意相邻两个麦克风之间的间距不同。麦克风阵列中的麦克风之间的间距可以根据实际情况做适应性调整,本技术对此不做限定。
98.图6a-b是根据本技术一些实施例所示的麦克风阵列(例如麦克风阵列110)的示例性排布方式的示意图。如图6a所示,当用户佩戴具有麦克风阵列的声学装置,麦克风阵列以半圆形排布的排布方式设置于人耳处或周围,如图6b所示,麦克风阵列以线形排布的排布方式是设置于人耳处。需要说明的是,麦克风阵列的排布方式不限于图6a和图6b中所示的半圆形和线形,麦克风阵列的设置位置也不限于图6a和图6b中所示的位置,这里的半圆形和线形以及麦克风阵列的设置位置只出于说明的目的。
99.图7是根据本技术一些实施例所示的估计目标空间位置的噪声的示例性流程图。如图7所示,流程700可以包括:
100.在步骤710中,确定一个或多个与麦克风阵列拾取的环境噪声有关的空间噪声源。在一些实施例中,该步骤可以由处理器120执行。如本文中所述,确定空间噪声源指的是确定空间噪声源相关信息,例如,空间噪声源的位置(包括空间噪声源的方位、空间噪声源与目标空间位置的距离等)、空间噪声源的相位以及空间噪声源的幅值等。
101.在一些实施例中,与环境噪声有关的空间噪声源是指其声波可传递至用户耳道处(例如,目标空间位置)或靠近用户耳道处的噪声源。在一些实施例中,空间噪声源可以为用户身体不同方向(例如,前方、后方等)的噪声源。例如,用户身体前方存在人喧闹噪声、用户身体左方存在车辆鸣笛噪声,这种情况下,空间噪声源包括用户身体前方的人喧闹噪
声源和用户身体左方的车辆鸣笛噪声源。在一些实施例中,麦克风阵列(例如麦克风阵列110)可以拾取用户身体各个方向的空间噪声,并将空间噪声转化为电信号传递至处理器120,处理器120可以将空间噪声对应的电信号进行分析,得到所述拾取的各个方向的空间噪声的参数信息(例如,频率信息、幅值信息、相位信息等)。处理器120根据各个方向的空间噪声的参数信息确定各个方向的空间噪声源的信息,例如,空间噪声源的方位、空间噪声源的距离、空间噪声源的相位以及空间噪声源的幅值等。在一些实施例中,处理器120可以基于麦克风阵列(例如麦克风阵列110)拾取的空间噪声通过噪声定位算法确定空间噪声源。噪声定位算法可以包括波束形成算法、超分辨空间谱估计算法、到达时差算法(也可以称为时延估计算法)等中的一种或多种。波束形成算法是一种基于最大输出功率的可控波束形成的声源定位方法。仅作为示例,波束形成算法可以包括可控响应功率和相位变换(steering response power-phase transform,spr-phat)算法、延迟-叠加波束形成(delay-and-sum beamforming)、差分麦克风算法、旁瓣相消(generalized sidelobe canceller,gsc)算法、最小方差无失真响应(minimum variance distortionless response,mvdr)算法等。超分辨空间谱估计算法可以包括自回归ar模型、最小方差谱估计(mv)和特征值分解方法(例如,多信号分类(multiple signal classification,music)算法)等,这些方法都可以通过获取麦克风阵列拾取的声音信号(例如,空间噪声)来计算空间谱的相关矩阵,并对空间噪声源的方向进行有效估计。到达时差算法可以先进行声音到达时间差估计,并从中获取麦克风阵列中麦克风之间的声延迟(time difference of arrival,tdoa),再利用获取的声音到达时间差,结合已知的麦克风阵列的空间位置进一步定位出空间噪声源的位置。
102.例如,时延估计算法可以通过计算环境噪声信号传递到麦克风阵列中的不同麦克风的时间差,进而通过几何关系确定噪声源的位置。又例如,spr-phat算法可以通过在每一个噪声源的方向上进行波束形成,其波束能量最强的方向可以近似认为是噪声源的方向。再例如,music算法可以是通过对麦克风阵列拾取的环境噪声信号的协方差矩阵进行特征值分解,得到环境噪声信号的子空间,从而分离出环境噪声的方向。关于确定噪声源的更多内容可以参考本技术说明书其它地方,例如,图8及其相应描述。
103.在一些实施例中,可以通过合成孔径、稀疏恢复、互素阵列等方法形成环境噪声的空间超分辨图像,该空间超分辨图像可以用于反映环境噪声的信号反射图,以进一步提高空间噪声源的定位精度。
104.在一些实施例中,处理器120可以将拾取的环境噪声按照特定的频带宽度(例如,每500hz作为一个频带)划分为多个频带,每个频带可以分别对应不同的频率范围,并在至少一个频带上确定与该频带对应的空间噪声源。例如,处理器120可以对环境噪声划分的频带进行信号分析,得到每个频带对应的环境噪声的参数信息,并根据参数信息确定与每个频带对应的空间噪声源。又例如,处理器120可以通过噪声定位算法确定与每个频带对应的空间噪声源。
105.在步骤720中,基于空间噪声源,估计目标空间位置的噪声。在一些实施例中,该步骤可以由处理器120执行。如本文中所述,估计目标空间位置的噪声指的是估计目标空间位置处的噪声的参数信息,例如,频率信息、幅值信息、相位信息等。
106.在一些实施例中,处理器120可以基于步骤710中得到的位于用户身体各个方向的
空间噪声源的参数信息(例如,频率信息、幅值信息、相位信息等),估计各个空间噪声源分别传递至目标空间位置的噪声的参数信息,从而估计出目标空间位置的噪声。例如,用户身体第一方位(例如,前方)和第二方位(例如,后方)分别有一个空间噪声源,处理器120可以根据第一方位空间噪声源的位置信息、频率信息、相位信息或幅值信息,估计第一方位空间噪声源的噪声传递到目标空间位置时,第一方位空间噪声源的频率信息、相位信息或幅值信息。处理器120可以根据第二方位空间噪声源的位置信息、频率信息、相位信息或幅值信息,估计第二方位空间噪声源的噪声传递到目标空间位置时,第二方位空间噪声源的频率信息、相位信息或幅值信息。进一步,处理器120可以基于第一方位空间噪声源和第二方位空间噪声源的频率信息、相位信息或幅值信息,估计目标空间位置的噪声信息,从而估计目标空间位置的噪声的噪声信息。仅作为示例,处理器120可以利用虚拟传声器技术或其他方法估计目标空间位置的噪声信息。在一些实施例中,处理器120可以通过特征提取的方法从麦克风阵列拾取的空间噪声源的频率响应曲线提取空间噪声源的噪声的参数信息。在一些实施例中,提取空间噪声源的噪声的参数信息的方法可以包括但不限于主成分分析(principal components analysis,pca)、独立成分分析(independent component algorithm,ica)、线性判别分析(linear discriminant analysis,lda)、奇异值分解(singular value decomposition,svd)等。
107.应当注意的是,上述有关流程700的描述仅仅是为了示例和说明,而不限定本技术的适用范围。对于本领域技术人员来说,在本技术的指导下可以对流程700进行各种修正和改变。例如,流程700还可以包括对空间噪声源进行定位,提取空间噪声源的噪声的参数信息等步骤。又例如,步骤710和步骤720可以合并为一个步骤。这些修正和改变仍在本技术的范围之内。
108.图8是根据本技术一些实施例所示的估计目标空间位置的噪声的示意图。下面以到达时差算法为例说明空间噪声源的定位是如何实现的。如图8所示,处理器(例如,处理器120)可以计算噪声源(例如,811、812、813)产生的噪声信号传递到麦克风阵列820中的不同麦克风(例如,麦克风821、麦克风822等)的时间差,进而结合已知的麦克风阵列820的空间位置,通过麦克风阵列820和噪声源的位置关系(比如,距离、相对方位)确定噪声源的位置。
109.获得噪声源(例如,811、812、813)的位置后,处理器可以根据噪声源的位置估计噪声源发出的噪声信号从噪声源传递至目标空间位置830的相位延迟和幅值变化。根据该相位延迟、幅值变化和空间噪声源发出的噪声信号的参数信息(例如,频率信息、幅值信息、相位信息等),处理器可以获得环境噪声传递至目标空间位置830时的参数信息(例如,频率信息、幅值信息、相位信息等),从而估计出目标空间位置的噪声。
110.需要说明的是,图8中所描述的噪声源811、812和813、麦克风阵列820以及麦克风阵列820中的麦克风821和822、目标空间位置830仅仅是为了示例和说明,而不限定本技术的适用范围。对于本领域技术人员来说,在本技术的指导下可以进行各种修正和改变。例如,麦克风阵列820中的麦克风并不限于麦克风821和麦克风822,麦克风阵列820还可以包括更多个麦克风等。这些修正和改变仍在本技术的范围之内。
111.图9是根据本技术一些实施例所示的估计目标空间位置的噪声和声场的示例性流程图。如图9所示,流程900可以包括:
112.在步骤910中,基于麦克风阵列(例如麦克风阵列110、麦克风阵列820)构建虚拟麦
克风。在一些实施例中,该步骤可以由处理器120执行。
113.在一些实施例中,虚拟麦克风可以用于表示或模拟若目标空间位置处设置麦克风后所述麦克风采集的音频数据。即通过虚拟麦克风得到的音频数据可以近似或等效为若目标空间位置处放置物理麦克风后该物理麦克风所采集的音频数据。
114.在一些实施例中,虚拟麦克风可以包括数学模型。该数学模型可以体现目标空间位置的噪声或声场估计与麦克风阵列拾取的环境噪声的参数信息(例如,频率信息、幅值信息、相位信息等)和麦克风阵列的参数之间的关系。麦克风阵列的参数可以包括麦克风阵列的排布方式、各个麦克风之间的间距、麦克风阵列中麦克风的数量和位置等中的一种或多种。该数学模型可以基于初始数学模型以及麦克风阵列的参数和麦克风阵列拾取的声音(例如环境噪声)的参数信息(例如,频率信息、幅值信息、相位信息等)通过计算获得。例如,初始数学模型可以包括对应麦克风阵列的参数和麦克风阵列拾取的环境噪声的参数信息的参数以及模型参数。将麦克风阵列的参数和麦克风阵列拾取的声音的参数信息和模型参数的初始值带入初始数学模型获得预测的目标空间位置的噪声或声场。然后将该预测噪声或声场与目标空间位置处设置的物理麦克风获得的数据(噪声和声场估计)进行比较以对数学模型的模型参数进行调整。基于上述调整方法,通过大量数据(例如,麦克风阵列的参数和麦克风阵列拾取的环境噪声的参数信息),多次调整,从而获得该数学模型。
115.在一些实施例中,虚拟麦克风可以包括机器学习模型。该机器学习模型可以基于麦克风阵列的参数和麦克风阵列拾取的声音(例如,环境噪声)的参数信息(例如,频率信息、幅值信息、相位信息等)通过训练获得。例如,将麦克风阵列的参数和麦克风阵列拾取的声音的参数信息作为训练样本对初始机器学习模型(例如,神经网络模型)进行训练获得该机器学习模型。具体的,可以将麦克风阵列的参数和麦克风阵列拾取的声音的参数信息输入初始机器学习模型,并获得预测结果(例如,目标空间位置的噪声和声场估计)。然后,将该预测结果与目标空间位置处设置的物理麦克风获得的数据(噪声和声场估计)进行比较以对初始机器学习模型的参数进行调整。基于上述调整方法,通过大量数据(例如,麦克风阵列的参数和麦克风阵列拾取的环境噪声的参数信息),经过多次迭代,优化初始机器学习模型的参数,直至初始机器学习模型的预测结果与目标空间位置处设置的物理麦克风获得的数据相同或近似相同时,获得机器学习模型。
116.虚拟麦克风技术可以将物理麦克风从难以放置麦克风的位置(例如,目标空间位置)移开。例如,为了实现开放用户双耳不堵塞用户耳道的目的,物理麦克风不能设置于用户耳孔的位置(例如,目标空间位置)。此时,可以通过虚拟麦克风技术将麦克风阵列设置于靠近用户耳朵且不堵塞耳道的位置,例如,用户耳廓处等,然后通过麦克风阵列构建处于用户耳孔的位置的虚拟麦克风。虚拟麦克风可以利用处于第一位置物理麦克风(即麦克风阵列)来预测处于第二位置(例如,目标空间位置)的声音数据(例如,幅值、相位、声压、声场等)。在一些实施例中,虚拟麦克风预测得到的第二位置(也可以称为特定位置,例如目标空间位置)的声音数据可以根据虚拟麦克风与物理麦克风(即麦克风阵列)之间的距离、虚拟麦克风的类型(例如,数学模型虚拟麦克风、机器学习虚拟麦克风)等调整。例如,虚拟麦克风与物理麦克风(即麦克风阵列)之间的距离越近,虚拟麦克风预测得到的第二位置的声音数据越准确。又例如,在一些特定应用场景中,机器学习虚拟麦克风预测得到的第二位置的声音数据比数学模型虚拟麦克的更准确。在一些实施例中,虚拟麦克风对应的位置(即第二
位置,例如目标空间位置)可以在麦克风阵列的附近,也可以远离麦克风阵列。
117.在步骤920中,基于虚拟麦克风估计目标空间位置的噪声和声场。在一些实施例中,该步骤可以由处理器120执行。
118.在一些实施例中,当虚拟麦克风为数学模型时,处理器120可以实时将麦克风阵列拾取的环境噪声的参数信息(例如,频率信息、幅值信息、相位信息等)和麦克风阵列的参数(例如,麦克风阵列的排布方式、各个麦克风之间的间距、麦克风阵列中麦克风的数量)作为数学模型的参数输入数学模型以估计目标空间位置的噪声和声场。
119.在一些实施例中,当虚拟麦克风为机器学习模型时,处理器120可以实时将麦克风阵列拾取的环境噪声的参数信息(例如,频率信息、幅值信息、相位信息等)和麦克风阵列的参数(例如,麦克风阵列的排布方式、各个麦克风之间的间距、麦克风阵列中麦克风的数量)输入机器学习模型并基于机器学习模型的输出估计目标空间位置的噪声和声场。
120.应当注意的是,上述有关流程900的描述仅仅是为了示例和说明,而不限定本技术的适用范围。对于本领域技术人员来说,在本技术的指导下可以对流程900进行各种修正和改变。例如,步骤920可以被分两个步骤以分别估计目标空间位置的噪声和声场。这些修正和改变仍在本技术的范围之内。
121.图10是根据本技术一些实施例所示的构建虚拟麦克风的示意图。如图10所示,目标空间位置1010可以位于用户耳道附近。为了实现开放用户双耳且不堵塞耳道的目的,目标空间位置1010不能设置物理麦克风,从而目标空间位置1010的噪声和声场不能通过物理麦克风直接估计。
122.为了估计目标空间位置1010的噪声和声场,可以在目标空间位置1010的附近设置麦克风阵列1020。仅作为示例,如图10所示,麦克风阵列1020可以包括第一麦克风1021、第二麦克风1022、第三麦克风1023。麦克风阵列1020中的各个麦克风(例如,第一麦克风1021、第二麦克风1022、第三麦克风1023)可以拾取用户所在空间的环境噪声。根据麦克风阵列1020中的各个麦克风拾取的环境噪声的参数信息(例如,频率信息、幅值信息、相位信息等)和麦克风阵列1020的参数(例如,麦克风阵列1020的排布方式、各个麦克风之间的间距、麦克风阵列1020中麦克风的数量),处理器120可以构建虚拟麦克风。进一步,基于该虚拟麦克风,处理器120可以估计目标空间位置1010处的噪声和声场。
123.需要说明的是,图10中所描述的目标空间位置1010和麦克风阵列1020以及麦克风阵列1020中的第一麦克风1021、第二麦克风1022、第三麦克风1023仅仅是为了示例和说明,而不限定本技术的适用范围。对于本领域技术人员来说,在本技术的指导下可以进行各种修正和改变。例如,麦克风阵列1020中的麦克风并不限于第一麦克风1021、第二麦克风1022和第三麦克风1023,麦克风阵列1020还可以包括更多个麦克风等。这些修正和改变仍在本技术的范围之内。
124.在一些实施例中,麦克风阵列(例如,麦克风阵列110、麦克风阵列820、麦克风阵列1020)在拾取环境噪声的同时,也可能会拾取扬声器发出的干扰信号(例如,目标信号和其他声音信号)。为了避免麦克风阵列拾取扬声器发出的干扰信号,麦克风阵列可以设置于远离扬声器的位置。但是,当设置于远离扬声器的位置时,麦克风阵列可能因为距离目标空间位置过远而无法对目标空间位置的声场和/噪声进行准确的估计。为了解决上述问题,麦克风阵列可以设置在目标区域以使麦克风阵列受来自扬声器的干扰信号最小。
125.在一些实施例中,目标区域可以是扬声器的声压级最小区域。声压级最小区域可以为扬声器辐射的声音较小的区域。在一些实施例中,扬声器可以形成至少一组声学偶极子。例如,扬声器振膜正面和振膜背面输出的一组相位近似相反、幅值近似相同的声音信号可以视为两个点声源。该两个点声源可以构成声学偶极子或类似声学偶极子,其向外辐射的声音具有明显的指向性。理想情况下,在两个点声源连线所在的直线方向,扬声器辐射的声音较大,其余方向辐射声音明显减小,在两个点声源连线的中垂线(或中垂线附近)区域扬声器辐射的声音最小。
126.在一些实施例中,声学装置(例如声学装置100)中的扬声器(例如扬声器130)可以是骨导扬声器。当扬声器为骨导扬声器且干扰信号为骨导扬声器的漏音信号时,目标区域可以是骨导扬声器的漏音信号的声压级最小区域。漏音信号的声压级最小区域可以指骨导扬声器辐射的漏音信号最小的区域。麦克风阵列设置于骨导扬声器的漏音信号的声压级最小区域,可以降低麦克风阵列拾取的骨导扬声器的干扰信号,也可以有效地解决麦克风阵列距离目标空间位置过远而导致无法准确估计目标空间位置的声场的问题。
127.图11是根据本技术一些实施例所示的骨导扬声器在1000hz时的三维声场漏音信号分布示意图。图12是根据本技术一些实施例所示的骨导扬声器在1000hz时的二维声场漏音信号分布示意图。如图11-12所示,声学装置1100可以包括接触面1110。接触面1110可以被配置为当用户佩戴声学装置1100时与用户身体(例如,脸部、耳部)接触。骨导扬声器可以设置于声学装置1100内部。如图11所示,声学装置1100上的颜可以表示骨导扬声器的漏音信号,不同的颜深度可以表示漏音信号的大小不同。颜越浅,表示骨导扬声器的漏音信号越大;颜越深,表示骨导扬声器的漏音信号越小。如图11所示,相对于其他区域,虚线所在的区域1120的颜较深,漏音信号较小,因此虚线所在的区域1120可以为骨导扬声器的漏音信号的声压级最小区域。仅作为示例,麦克风阵列可以设置在虚线所在的区域1120(例如,位置1),从而接收到来自骨导扬声器的漏音信号较小。
128.在一些实施例中,骨导扬声器的声压级最小区域的声压比骨导扬声器的最大输出声压可以降低5-30db。在一些实施例中,骨导扬声器的声压级最小区域的声压比骨导扬声器的最大输出声压可以降低7-28db。在一些实施例中,骨导扬声器的声压级最小区域的声压比骨导扬声器的最大输出声压可以降低9-26db。在一些实施例中,骨导扬声器的声压级最小区域的声压比骨导扬声器的最大输出声压可以降低11-24db。在一些实施例中,骨导扬声器的声压级最小区域的声压比骨导扬声器的最大输出声压可以降低13-22db。在一些实施例中,骨导扬声器的声压级最小区域的声压比骨导扬声器的最大输出声压可以降低15-20db。在一些实施例中,骨导扬声器的声压级最小区域的声压比骨导扬声器的最大输出声压可以降低17-18db。在一些实施例中,骨导扬声器的声压级最小区域的声压比骨导扬声器的最大输出声压可以降低15db。
129.图12所示的二维声场分布是图11的三维声场漏音信号分布的二维截面图。如图12所示,截面上的颜可以表示骨导扬声器的漏音信号,不同的颜深度可以表示漏音信号的大小不同。颜越浅,表示骨导扬声器的漏音信号越大,颜越深,表示骨导扬声器的漏音信号越小。如图12所示,相对于其他区域,虚线所在的区域1210和1220的颜较深,漏音信号较小。因此,虚线所在的区域1210和1220可以为骨导扬声器的漏音信号的声压级最小区域。仅作为示例,麦克风阵列可以设置在虚线所在的区域1210和1220(例如,位置a和位置
b),从而接收到来自骨导扬声器的漏音信号较小。
130.在一些实施例中,骨导扬声器在振动的过程中发出的振动信号较大,因此不仅骨导扬声器的漏音信号会对麦克风阵列产生干扰,骨导扬声器的振动信号也会对麦克风阵列产生干扰。此处骨导扬声器的振动信号可以指骨导扬声器的振动部件的振动带动的声学装置的其他部件(例如壳体、麦克风阵列)的振动。在这种情况下,骨导扬声器的干扰信号可以包括骨导扬声器的漏音信号和振动信号。为了避免麦克风阵列拾取骨导扬声器的干扰信号,麦克风阵列所处的目标区域可以是传递到麦克风阵列的骨导扬声器的漏音信号和振动信号的总能量最小的区域。骨导扬声器的漏音信号和振动信号是相对独立的信号,骨导扬声器的漏音信号的声压级最小区域不能表示骨导扬声器的漏音信号和振动信号的总能量最小的区域。因此,目标区域的确定需要对骨导扬声器的振动信号和漏音信号的总信号进行分析。
131.图13是根据本技术一些实施例所示的骨导扬声器的振动信号和漏音信号的总信号的频率响应示意图。图13示出了骨导扬声器的振动信号和漏音信号的总信号在图11中的声学装置1100上的位置1、位置2、位置3和位置4处的频率响应曲线。如图13所示,横坐标可以表示频率,纵坐标可以表示骨导扬声器的振动信号和漏音信号的总信号的声压。根据图11的相关描述,仅考虑骨导扬声器的漏音信号时,位置1位于扬声器130的声压级最小区域可以作为设置麦克风阵列(例如麦克风阵列110、麦克风阵列820、麦克风阵列1020)的目标区域。当同时考虑骨导扬声器的振动信号和漏音信号时,设置麦克风阵列的目标区域(即骨导扬声器的振动信号和漏音信号的总信号的声压最小的区域)却不一定为位置1。参照图13,相对于其他位置,位置2对应的骨导扬声器的振动信号和漏音信号的总信号的声压较小,因此,位置2可以作为设置麦克风阵列的目标区域。
132.在一些实施例中,目标区域的位置可以与麦克风阵列中的麦克风的振膜的朝向有关。麦克风的振膜的朝向可以影响麦克风接收到的骨导扬声器的振动信号的大小。例如,当麦克风的振膜与骨导扬声器的振动部件垂直时,麦克风可以采集的骨导扬声器的振动信号较小。又例如,当麦克风的振膜与骨导扬声器的振动部件平行时,麦克风可以采集的骨导扬声器的振动信号较大。在一些实施例中,可以通过设置麦克风振膜的朝向,从而减低麦克风接收到的骨导扬声器的振动信号。例如,当麦克风的振膜与骨导扬声器的振动部件垂直时,确定设置麦克风阵列的目标位置的过程中可以忽略骨导扬声器的振动信号,仅考虑骨导扬声器的漏音信号,即根据图11和图12的描述确定设置麦克风阵列的目标位置。又例如,当麦克风的振膜与骨导扬声器的振动部件平行时,确定设置麦克风阵列的目标位置的过程中可以同时考虑骨导扬声器的振动信号和漏音信号,即根据图13的描述确定设置麦克风阵列的目标位置。
133.在一些实施例中,通过调节麦克风的振膜的朝向可以调节麦克风接收到的骨导扬声器的振动信号的相位,使得麦克风接收到的骨导扬声器的振动信号与麦克风接收到的骨导扬声器的漏音信号的相位近似相反且大小近似相等,从而使麦克风接收到的骨导扬声器的振动信号与麦克风接收到的骨导扬声器的漏音信号可以至少部分相抵消,以此来实现降低麦克风阵列接收到的骨导扬声器的发出的干扰信号。在一些实施例中,麦克风接收到的骨导扬声器的振动信号可以降低麦克风接收到的骨导扬声器的漏音信号5-6db。
134.在一些实施例中,声学装置(例如声学装置100)中的扬声器(例如扬声器130)可以
是气导扬声器。当扬声器为气导扬声器且干扰信号为气导扬声器的发出的声音信号(即辐射声场)时,目标区域可以是气导扬声器的辐射声场的声压级最小区域。麦克风阵列设置于气导扬声器的辐射声场的声压级最小区域,可以降低麦克风阵列拾取的气导扬声器的干扰信号,也可以有效地解决麦克风阵列距离目标空间位置过远而导致无法准确估计目标空间位置的声场的问题。
135.图14a-b是根据本技术一些实施例所示的气导扬声器的声场分布示意图。如图14a-b所示,气导扬声器可以设置在开放式声学装置1400内并从开放式声学装置1400的两个导声孔(例如图14a-b中的1401和1402)向外辐射声音,且发出的声音可以形成偶极子(以图14a-b中所示的“+”、
“‑”
来表示)。
136.如图14a所示,开放式声学装置1400被设置以使偶极子的连线与用户脸部区域近似垂直。在这种情况下,偶极子辐射的声音可以形成三个较强的声场区域1421、1422和1423)。声场区域1421和1423之间以及声场区域1422和1423之间可以形成气导扬声器的辐射声场的声压级最小区域(也可以称为声压较小区域),例如,图14a中的虚线及其附近区域。该声压级最小区域可以指开放式声学装置1400输出的声音强度相对较小的区域。在一些实施例中,麦克风阵列中的麦克风1430可以设置于该声压级最小区域。例如,麦克风阵列中的麦克风1430可以设置于图14中虚线与开放式声学装置1400的壳体相交的位置,这样可以使麦克风1430在采集外部环境噪声的同时收到尽量少的气导扬声器发出的声音信号,降低气导扬声器发出的声音信号对开放式声学装置1400的主动降噪功能的干扰。
137.如图14b所示,开放式声学装置1400被设置以使偶极子的连线与用户脸部区域近似平行。在这种情况下,偶极子辐射的声音可以形成两个较强的声场区域1424和1425)。声场区域1424和1425之间可以形成气导扬声器的辐射声场的声压级最小区域,例如,图14b中的虚线及其附近区域。在一些实施例中,麦克风阵列中的麦克风1440可以设置于该声压级最小区域。例如,麦克风阵列中的麦克风1440可以设置于图14中虚线与开放式声学装置1400的壳体相交的位置,这样可以使麦克风1440在采集外部环境噪声的同时尽量少收到气导扬声器发出的声音信号,降低气导扬声器发出的声音信号对开放式声学装置1400的主动降噪功能的干扰。
138.图15是根据本技术一些实施例所示的基于传递函数输出目标信号的示例性流程图。如图15所示,流程1500可以包括:
139.在步骤1510中,基于传递函数处理降噪信号。在一些实施例中,该步骤可以由处理器120(例如,幅相补偿单元230)执行。关于降噪信号的更多介绍可以参考本技术其它地方,例如,图3及其相应描述。另外,根据图3的描述,扬声器(例如扬声器130)可以基于处理器120生成的降噪信号输出目标信号。
140.在一些实施例中,扬声器输出的目标信号可以通过第一声径传送到用户耳朵中的特定位置(也可以称为噪声抵消位置),环境噪声可以通过第二声径传送到用户耳朵的特定位置,并在特定位置处,目标信号与环境噪声相互抵消,从而用户无法感知到环境噪声或者可以感知较为微弱的环境噪声。在一些实施例中,当扬声器为气导扬声器时,目标信号与环境噪声相互抵消的特定位置可以为用户耳道或其附近,例如,目标空间位置。第一声径可以为目标信号从气导扬声器经空气传输到目标空间位置的路径,第二声径可以为环境噪声从的噪声源传输到目标空间位置的路径。在一些实施例中,当扬声器为骨导扬声器时,目标信
号与环境噪声相互抵消的特定位置可以为用户的基底膜处。第一声径可以为目标信号从骨导扬声器,经用户的骨骼或组织到用户的基底膜的路径,第二声径可以为环境噪声从噪声源,经用户的耳道、鼓膜到用户的基底膜的路径。
141.在一些实施例中,扬声器(例如,扬声器130)可以设置于用户耳道附近且不堵塞用户耳道的位置,从而扬声器与噪声抵消位置(例如,目标空间位置、基底膜)有一定的距离。因此,当扬声器输出的目标信号传递到与噪声抵消位置时,目标信号的相位信息和幅值信息可能会发生变化。结果,可能出现扬声器输出的目标信号无法实现降低环境噪声信号的作用,甚至会增强环境噪声,从而导致声学装置(例如,开放式声学输出装置100)的主动降噪功能无法实现。
142.基于上述情况,处理器120可以获得目标信号从扬声器发出到噪声抵消位置的传递函数。传递函数可以包括第一传递函数和第二传递函数。第一传递函数可以表示从扬声器发出到噪声抵消位置,目标信号的参数随声径(即第一声径)的变化(例如,幅值的变化、相位的变化)。在一些实施例中,当扬声器为骨导扬声器时,骨导扬声器发出到目标信号为骨导信号,骨导扬声器发出的目标信号和环境噪声抵消的位置为用户的基底膜。在这种情况下,第一传递函数可以表示从骨导扬声器发出到传递到用户的基底膜,该目标信号的参数(例如,相位、幅值)的变化。在一些实施例中,当扬声器为骨导扬声器时,第一传递函数可以通过实验获得。例如,骨导扬声器输出目标信号,同时在用户耳道附近位置播放一个与目标信号频率相同的气导声音信号,观测目标信号与气导声音信号的抵消效果。当目标信号与气导声音信号互相抵消时,可以基于气导声音信号和骨导扬声器输出的目标信号获得骨导扬声器的第一传递函数。在一些实施例中,当扬声器为气导扬声器时,气导扬声器发出到目标信号为气导声音信号,第一传递函数可以通过声学扩散场仿真和计算获得。例如,可以利用声学扩散场仿真气导扬声器发出的目标信号的声场,并基于该声场计算气导扬声器的第一传递函数。第二传递函数可以表示从目标空间位置到目标信号和环境噪声抵消的位置,环境噪声的参数(例如,幅值的变化、相位的变化)的变化。仅作为示例,当扬声器为骨导扬声器时,第二传递函数可以表示从目标空间位置到用户的基底膜,环境噪声的参数的变化。在一些实施例中,第二传递函数可以通过声学扩散场仿真和计算获得。例如,可以利用声学扩散场仿真环境噪声的声场,并基于该声场计算第二传递函数。
143.在一些实施例中,在目标信号的传递过程中,不仅会存在相位改变,也可能会存在信号的能量损耗。因此传递函数可以包括相位传递函数和幅值传递函数。在一些实施例中,相位传递函数和幅值传递函数都可以通过上述方法获得。
144.进一步,处理器120可以基于获得的传递函数处理降噪信号。在一些实施例中,处理器120可以基于获得的传递函数对降噪信号的幅值和相位进行调整。在一些实施例中,处理器120可以基于获得的相位传递函数调整降噪信号的相位并基于幅值传递函数调整降噪信号的幅值。
145.在步骤1520中,根据处理后的降噪信号输出目标信号。在一些实施例中,该步骤可以由扬声器130执行。
146.在一些实施例中,扬声器130可以基于步骤1510中处理后的降噪信号输出目标信号,以使得扬声器130基于处理后的降噪信号输出的目标信号传递至与环境噪声抵消的位置时,该目标信号与环境噪声相位和的幅值满足特定条件。在一些实施例中,目标信号的相
位与环境噪声的相位的相位差可以小于或等于一定相位阈值。该相位阈值可以处于90-180度范围内。该相位阈值可以根据用户的需要在该范围内进行调整。例如,当用户不希望被周围环境的声音打扰时,该相位阈值可以为较大值,例如180度,即目标信号的相位与环境噪声的相位相反。又例如,当用户希望对周围环境保持敏感时,该相位阈值可以为较小值,例如90度。需要注意的是,用户希望接收越多周围环境的声音,该相位阈值可以越接近90度,用户希望接收越少周围环境的声音,该相位阈值可以越接近180度。在一些实施例中,当目标信号的相位与环境噪声的相位一定的情况下(例如相位相反),环境噪声的幅值与该目标信号的幅值之间的幅值差可以小于或等于一定幅值阈值。例如,当用户不希望被周围环境的声音打扰时,该幅值阈值可以为较小值,例如0db,即目标信号的幅值与环境噪声的幅值相等。又例如,当用户希望对周围环境保持敏感时,该幅值阈值可以为较大值,例如约等于环境噪声的幅值。需要注意的是,用户希望接收越多周围环境的声音,该幅值阈值可以越接近环境噪声的幅值,用户希望接收越少周围环境的声音,该幅值阈值可以越接近0db。从而实现降低环境噪声的目的以及声学装置(例如,声学输出装置100)的主动降噪功能,提高用户的听觉体验。
147.应当注意的是,上述有关流程1500的描述仅仅是为了示例和说明,而不限定本说明书的适用范围。对于本领域技术人员来说,在本说明书的指导下可以对流程1500进行各种修正和改变。例如,流程1500还可以包括获得传递函数的步骤。又例如,步骤1510和步骤1520可以合并为一个步骤。这些修正和改变仍在本技术的范围之内。
148.图16是根据本技术说明书一些实施例提供的估计目标空间位置的噪声的示例性流程图。如图16所示,流程1600可以包括:
149.在步骤1610中,从拾取的环境噪声中去除与骨导麦克风拾取的信号相关联的成分,以便更新环境噪声。
150.在一些实施例中,该步骤可以由处理器120执行。在一些实施例中,麦克风阵列(例如,麦克风阵列110)在拾取环境噪声时,用户自身的说话声音也会被麦克风阵列拾取,即,用户自身说话的声音也被视为环境噪声的一部分。这种情况下,扬声器(例如,扬声器130)输出的目标信号会将用户自身说话的声音抵消。在一些实施例中,特定场景下,用户自身说话的声音需要被保留,例如,用户进行语音通话、发送语音消息等场景中。在一些实施例中,声学装置(例如声学装置100)可以包括骨导麦克风,用户佩戴声学装置进行语音通话或录制语音信息时,骨导麦克风可以通过拾取用户说话时面部骨骼或肌肉产生的振动信号来拾取用户说话的声音信号,并传递至处理器120。处理器120获取来自骨导麦克风拾取的声音信号的参数信息,并从麦克风阵列(例如,麦克风阵列110)拾取的环境噪声中去除与骨导麦克风拾取的声音信号相关联的声音信号成分。处理器120根据剩余的环境噪声的参数信息更新环境噪声。更新后的环境噪声中不再包含用户自身说话的声音信号,即在用户进行语音通话时用户可以听到用户自身说话的声音信号。
151.在步骤1620中,根据更新后的环境噪声估计目标空间位置的噪声。在一些实施例中,该步骤可以由处理器120执行。可以以与步骤320类似的方式来执行步骤1620,并且在此不再重复相关的描述。
152.应当注意的是,上述有关流程1600的描述仅仅是为了示例和说明,而不限定本技术的适用范围。对于本领域技术人员来说,在本技术的指导下可以对流程1600进行各种修
正和改变。例如,还可以对骨导麦克风拾取的信号相关联的成分进行预处理,并将骨导麦克风拾取的信号作为音频信号传输至终端设备。这些修正和改变仍在本技术的范围之内。
153.上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本技术的限定。虽然此处并没有明确说明,本领域技术人员可能会对本技术进行各种修改、改进和修正。该类修改、改进和修正在本技术中被建议,所以该类修改、改进、修正仍属于本技术示范实施例的精神和范围。
154.同时,本技术使用了特定词语来描述本技术的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本技术至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本技术中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本技术的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
155.此外,本领域技术人员可以理解,本技术的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本技术的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本技术的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
156.计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、rf、或类似介质,或任何上述介质的组合。
157.此外,除非权利要求中明确说明,本技术所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本技术流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本技术实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
158.同理,应当注意的是,为了简化本技术披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本技术实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本技术对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
159.一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有
±
20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点
可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本技术一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
160.针对本技术引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本技术作为参考。与本技术内容不一致或产生冲突的申请历史文件除外,对本技术权利要求最广范围有限制的文件(当前或之后附加于本技术中的)也除外。需要说明的是,如果本技术附属材料中的描述、定义、和/或术语的使用与本技术所述内容有不一致或冲突的地方,以本技术的描述、定义和/或术语的使用为准。
161.最后,应当理解的是,本技术中所述实施例仅用以说明本技术实施例的原则。其他的变形也可能属于本技术的范围。因此,作为示例而非限制,本技术实施例的替代配置可视为与本技术的教导一致。相应地,本技术的实施例不仅限于本技术明确介绍和描述的实施例。

技术特征:


1.一种声学装置,其特征在于,所述声学装置包括:麦克风阵列,被配置为拾取环境噪声;处理器,被配置为:利用所述麦克风阵列对目标空间位置的声场进行估计,所述目标空间位置比所述麦克风阵列中任一麦克风更加靠近用户耳道,以及基于所述拾取的环境噪声和所述目标空间位置的声场估计生成降噪信号;以及至少一个扬声器,被配置为根据所述降噪信号输出目标信号,所述目标信号用于降低所述环境噪声,其中所述麦克风阵列设置在目标区域以使所述麦克风阵列受来自所述至少一个扬声器的干扰信号最小。2.根据权利要求1所述的声学装置,其特征在于,所述基于所述拾取的环境噪声和所述目标空间位置的声场估计生成降噪信号包括:基于所述拾取的环境噪声估计所述目标空间位置的噪声;以及基于所述目标空间位置的噪声和所述目标空间位置的声场估计生成所述降噪信号。3.根据权利要求2所述的声学装置,其特征在于,所述声学装置进一步包括一个或多个传感器,用于获取所述声学装置的运动信息,以及所述处理器进一步被配置为:基于所述运动信息更新所述目标空间位置的噪声和所述目标空间位置的声场估计;以及基于所述更新后的目标空间位置的噪声和所述更新后的目标空间位置的声场估计生成所述降噪信号。4.根据权利要求2所述的声学装置,其特征在于,所述基于所述拾取的环境噪声估计所述目标空间位置的噪声包括:确定一个或多个与所述拾取的环境噪声有关的空间噪声源;以及基于所述空间噪声源,估计所述目标空间位置的噪声。5.根据权利要求1所述的声学装置,其特征在于,所述利用所述麦克风阵列对目标空间位置的声场进行估计包括:基于所述麦克风阵列构建虚拟麦克风,所述虚拟麦克风包括数学模型或机器学习模型,用于表示若所述目标空间位置处包括麦克风后所述麦克风采集的音频数据;以及基于所述虚拟麦克风对所述目标空间位置的声场进行估计。6.根据权利要求5所述的声学装置,其特征在于,所述基于所述拾取的环境噪声和所述目标空间位置的声场估计生成降噪信号包括:基于所述虚拟麦克风估计所述目标空间位置的噪声;以及基于所述目标空间位置的噪声和所述目标空间位置的声场估计生成所述降噪信号。7.根据权利要求1所述的声学装置,其特征在于,所述至少一个扬声器是骨导扬声器,所述干扰信号包括所述骨导扬声器的漏音信号和振动信号,以及所述目标区域为传递到所述麦克风阵列的所述骨导扬声器的所述漏音信号和所述振动信号的总能量最小的区域。8.根据权利要求1所述的声学装置,其特征在于,
所述至少一个扬声器是气导扬声器,以及所述目标区域为所述气导扬声器的辐射声场的声压级最小区域。9.根据权利要求1所述的声学装置,其特征在于,所述处理器进一步被配置为基于传递函数处理所述降噪信号,所述传递函数包括第一传递函数和第二传递函数,所述第一传递函数表示从所述至少一个扬声器发出到所述目标信号和所述环境噪声抵消的位置所述目标信号的参数的变化,所述第二传递函数表示从所述目标空间位置到所述目标信号和所述环境噪声抵消的位置所述环境噪声的参数的变化;以及所述至少一个扬声器进一步被配置为根据所述处理后的降噪信号输出所述目标信号。10.一种降噪方法,其特征在于,所述降噪方法包括:由麦克风阵列拾取环境噪声;由处理器利用所述麦克风阵列对目标空间位置的声场进行估计,所述目标空间位置比所述麦克风阵列中任一麦克风更加靠近用户耳道;基于所述拾取的环境噪声和所述目标空间位置的声场估计生成降噪信号;以及由至少一个扬声器,根据所述降噪信号输出目标信号,所述目标信号用于降低所述环境噪声,其中所述麦克风阵列设置在目标区域以使所述麦克风阵列受来自所述至少一个扬声器的干扰信号最小。

技术总结


本申请公开一种声学装置。该声学装置可以包括麦克风阵列、处理器和至少一个扬声器。所述麦克风阵列可以被配置为拾取环境噪声。所述处理器可以被配置为利用所述麦克风阵列对目标空间位置的声场进行估计。所述目标空间位置可以比所述麦克风阵列中任一麦克风更加靠近用户耳道。所述处理器可以进一步被配置为基于所述拾取的环境噪声和所述目标空间位置的声场估计生成降噪信号。所述至少一个扬声器可以被配置为根据所述降噪信号输出目标信号。所述目标信号可以用于降低所述环境噪声。所述麦克风阵列可以设置在目标区域以使所述麦克风阵列受来自所述至少一个扬声器的干扰信号最小。列受来自所述至少一个扬声器的干扰信号最小。列受来自所述至少一个扬声器的干扰信号最小。


技术研发人员:

肖乐 郑金波 张承乾 廖风云 齐心

受保护的技术使用者:

深圳市韶音科技有限公司

技术研发日:

2021.04.30

技术公布日:

2022/10/25

本文发布于:2024-09-24 17:07:48,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/21043.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:噪声   麦克风   阵列   扬声器
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议