一种音频系统的制作方法

1.本实用新型涉及音频处理技术领域，更具体地说，涉及一种音频系统。

背景技术：

2.语音是人们进行信息传递和信息记录的最常见方式之一。现阶段，对于语音的采集、存储和播放已经是常规语音处理内容。
3.但是在实际情况中，用户还存在对语音进行文本转写，或者对语音进行翻译的需求，从而使得语音中的信息能够以其它形式或者其它语种进行表示。然而常规的音频采集或播放终端，往往只专注于语音音频的采集或播放，不能满足用户对语音音频进行转写或翻译的需求。

技术实现要素：

4.为解决上述技术问题，本实用新型提供一种音频系统，该音频系统不仅能够实现音频采集和播放，还能够对音频进行转写和/或翻译处理。
5.为达到上述目的，本实用新型具体提出如下方案：
6.一种音频系统，包括：
7.音频终端、音频处理客户端，以及音频处理服务端；
8.其中，所述音频终端，用于采集及播放音频；
9.所述音频处理客户端，包括与所述音频终端电性连接的第一处理器，用于通过调用音频处理服务端，实现对所述音频终端采集的和/或播放的音频的转写和/或翻译；
10.所述音频处理服务端，包括与所述第一处理器电性连接的音频转写服务器和/或音频翻译服务器，所述音频转写服务器用于对音频进行文本转写，所述音频翻译服务器用于对音频进行翻译。
11.可选的，所述音频终端包括由设定数量的麦克风构成的麦克风阵列，以及扬声器阵列；
12.所述麦克风阵列用于采集音频信号；
13.所述扬声器用于播放音频。
14.可选的，所述麦克风阵列包括设定数量的全向麦克风和/或定向麦克风。
15.可选的，所述麦克风阵列所包括的设定数量的麦克风设置于同一平面，并且分别置于规则多边形的各个顶点位置处。
16.可选的，所述麦克风阵列包括一个全向麦克风和设定数量的定向麦克风；
17.其中，所述全向麦克风和设定数量的定向麦克风设置于同一平面，并且，各个定向麦克风分别设置于规则多边形的各个顶点位置处，所述全向麦克风设置于所述规则多边形的中心位置处。
18.可选的，所述音频终端包括音频处理芯片，用于对采集和/或播放的音频进行预处理，所述预处理至少包括音频降噪、分离人声和环境声、角区分中的一种或多种。
19.可选的，所述音频处理芯片与所述音频处理客户端的第一处理器电性连接，以便所述音频处理芯片通过其与所述第一处理器之间的电性连接线路，将音频预处理结果发送至所述第一处理器。
20.可选的，所述音频处理客户端还包括与所述第一处理器和所述音频终端电性连接的第二处理器，用于对音频的转写结果和/或翻译结果进行编辑和/或存储。
21.可选的，所述音频处理客户端还包括与所述音频终端电性连接的音效控制器，用于识别所述音频终端的工作环境，并根据所述音频终端的工作环境，对所述音频终端的音频播放效果进行设置。
22.可选的，所述音频处理服务端还包括与所述第一处理器电性连接的角区分服务器，用于对音频进行人声角区分处理。
23.从上述介绍可以看出，本实用新型所提供的音频系统，不仅能够实现基本的语音采集和播放功能，还能够通过音频处理客户端调用音频处理服务端，实现音频转写和/或翻译功能，从而能够满足用户对音频的转写和翻译需求。
24.另外，基于音频处理客户端和音频处理服务端的设置，不仅能够对音频终端采集的音频进行转写和翻译，还能够对来自远端的需要由音频终端播放的音频进行转写和翻译，因此，该音频系统能够实现对音频终端采集的和播放的音频的全双工转写和翻译处理，从而能够加全满地满足用户需求。
附图说明
25.为了更清楚地说明本实用新型实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本实用新型的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。
26.图1是本实用新型实施例提供的一种远程会议场景示意图；
27.图2是本实用新型实施例提供的一种音频系统的结构示意图；
28.图3是本实用新型实施例提供的一种麦克风阵列示意图；
29.图4是本实用新型实施例提供的另一种麦克风阵列示意图；
30.图5是本实用新型实施例提供的又一种麦克风阵列示意图；
31.图6是本实用新型实施例提供的又一种麦克风阵列示意图；
32.图7是本实用新型实施例提供的音频系统的音频终端的结构示意图；
33.图8是本实用新型实施例提供的另一种音频系统的结构示意图；
34.图9是本实用新型实施例提供的又一种音频系统的结构示意图。
具体实施方式
35.本实用新型实施例提出一种音频系统，该音频系统不仅能够进行音频采集和音频播放，还具备语音音频转写和翻译功能，从而能够满足用户对语音进行转写和翻译的需求。
36.作为一种示例，上述的音频系统可以应用于如图1所示的应用场景，该应用场景为远程会议场景。上述的音频系统，由音频终端以及音频处理后台构成，其中，音频终端的数量为多个。
37.在该会议场景下，一个或多个本地参会人员与该音频系统的第一音频终端共处同一会议中，例如处于同一会议室(假设为第一会议室)中。与此同时，该音频系统的其他音频终端(例如第二音频终端)被设置于另一会议中，例如处于另一会议室(假设为第二会议室)中。基于该音频系统，能够实现两个会议室人员的远程语音通信，从而能够实现远程会议。
38.在会议过程中，该音频系统通过其被放置于不同会议室的音频终端，采集会议现场的语音并进行相应处理。作为基本的处理内容，该音频系统能够将第一会议室的音频终端采集的语音数据，转发至第二会议室的音频终端进行播放，同时，能够将第二会议室的音频终端采集的语音数据转发至第一会议室的音频终端进行播放，从而实现远程参会人员的语音交互。
39.除此之外，本实用新型实施例提出的音频系统，还能够实现对各个音频终端采集和/或播放的语音音频的转写和/或翻译处理，从而便于用户对会议内容进行文本记录，以及方便不同语种的参会人员都能听懂会议内容。
40.下面将结合本实用新型实施例中的附图，对本实用新型实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本实用新型一部分实施例，而不是全部的实施例。基于本实用新型中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本实用新型保护的范围。
41.本实用新型实施例提出一种音频系统，参见图2所示，该音频系统包括：
42.音频终端1、音频处理客户端2，以及音频处理服务端3。
43.其中，音频终端1是由麦克风和扬声器构成的单体硬件设备，其设备形状、尺寸等均可以灵活设置。作为优选的设置方式，音频终端1的麦克风设置于其顶部，以便于无遮挡地采集音频数据；音频终端1的扬声器可以设置于尽量远离麦克风的位置，以免其播放的音频对麦克风的音频采集造成干扰，例如，扬声器可以设置于音频终端1的侧面或底部。其中，麦克风和扬声器的数量分别可以被设置为一个或多个。当麦克风和/或扬声器的数量为多个时，各个麦克风和/或扬声器可以分散地设置于音频终端1上的不同位置处，从而能够更大范围地采集音频，或者提升音频播放效果。例如，在音频终端1上设置由多个扬声器构成的扬声器阵列，通过该扬声器阵列播放音频，能够达到立体声播放音效。
44.上述的音频终端1的数量可以为一个或多个。当该音频终端1的数量为多个时，各个音频终端1能够被设置于不同的声源环境中，从而能够从不同声源环境分别采集音频信号，以及实现不同声源环境的音频交互。
45.上述的音频处理客户端2，通过信号传输线与音频终端1连接，或者通过wifi、蓝牙等无线通信方式与音频终端连接，从而建立音频处理客户端2与音频终端1之间的通信链路。基于该通信链路，音频终端1能够将采集的音频数据发送给音频处理客户端2，以及，音频处理客户端2可以将接收到的远端音频发送给音频终端1进行播放，其中，该远端音频，可以是由远端的音频终端1采集的音频，也可以是由其他音频采集设备采集的音频，或者，还可以是预先存储的音频数据。
46.该音频处理客户端2，作为连接音频终端1与音频处理服务端3的枢纽，其具体可以是计算机等智能处理设备。具体而言，该音频处理客户端2具备基本的音频处理能力，例如音频降噪、音频存储等。以及，该音频处理客户端2与音频处理服务端3远程连接，例如通过互联网连接，音频处理服务端3对音频处理客户端暴露调用接口，从而使得音频处理客户端
2能够远程调用音频处理服务端3，从而实现运算量更大的音频处理。
47.在本实用新型实施例中，音频处理客户端2中包括与音频终端1电性连接，以及与音频处理服务端3远程连接的第一处理器21，该第一处理器21能够通过调用音频处理服务端3，实现对音频终端1采集的和/或播放的音频的转写和/或翻译。
48.在实际应用中，上述的音频处理客户端2与音频终端1配套部署。即，上述的音频处理客户端2的数量与音频终端1的数量相同，一个音频终端1与一个音频处理客户端2被设置于同一音频环境中，例如设置于同一会议场景中。基于此，音频处理客户端2可以对与其配套的音频终端1所采集的音频进行本地处理、上传互联网、发送到远端音频终端等，以及，还可以接收远程发送过来的音频，或者将本地或网络上存储的音频发送给音频终端1进行播放。
49.上述的音频处理服务端3，则主要由服务器+运行于服务器上的算法程序构成。根据服务器上的算法程序的不同，该音频处理服务器3可以包括不同功能的服务器。
50.在本实用新型实施例中，该音频处理服务端3包括音频转写服务器31和/或音频翻译服务器32。其中，音频转写服务器31和/或音频翻译服务器32分别与音频处理客户端2中的第一处理器21电性连接，例如通过互联网连接，从而使得第一处理器21能够调用音频转写服务器31和/或音频翻译服务器32。
51.上述的音频转写服务器31能够对语音音频进行语音识别，从而实现音频的文本转写。上述的音频翻译服务器32能够对语音音频进行翻译，从而实现语音音频在不同语种间的切换。
52.上述的音频处理服务端3所包含的不同功能的服务器，可以是任意类型的服务器，在实际情况中可以灵活选择。
53.通过上述介绍可见，本实用新型实施例提出的音频系统，不仅能够实现基本的语音采集和播放功能，还能够通过音频处理客户端调用音频处理服务端，实现音频转写和/或翻译功能，从而能够满足用户对音频的转写和翻译需求。
54.另外，基于音频处理客户端和音频处理服务端的设置，不仅能够对音频终端采集的音频进行转写和翻译，还能够对来自远端的需要由音频终端播放的音频进行转写和翻译，因此，该音频系统能够实现对音频终端采集的和播放的音频的全双工转写和翻译处理，从而能够加全满地满足用户需求。
55.作为一种可选的实施方式，本实用新型实施例将音频终端的麦克风和扬声器都设置为阵列形式，即，音频终端的麦克风设置为由设定数量的麦克风构成的麦克风阵列，该音频终端的扬声器也设置为多个扬声器构成的扬声器阵列的形式。
56.基于上述设置，该音频终端通过麦克风阵列采集音频，能够提供音频采集效果，同时，通过麦克风阵列采集的音频还能够实现声源定位、降噪、角区分等。
57.音频终端通过扬声器阵列播放音频，能够提高音频播放效果，例如能够实现立体声播放。
58.作为示例性的实施方式，上述的麦克风阵列可以由设定数量的全向麦克风和/或定向麦克风构成。即，可以完全由全向麦克风构成，也可以完全由定向麦克风构成，还可以全向麦克风和定向麦克风混合构成。
59.另外，关于上述麦克风阵列所包含的各个麦克风的安装位置，则可以灵活设置。示
例性的，各个麦克风可以等距或不等距地排列成任意形状的平面矩阵，例如可以排列成图3所示的矩形矩阵形状，也可以排列成图4所示的线型矩阵形状。
60.作为一种优选的实施方式，本实施例将麦克风阵列所包含的各个麦克风设置于同一平面，并且分别设置于一个规则多边形的各个定点位置处。例如图5所示，各个麦克风可以分别设置于正三角形、正方形、正五边形、正六边形、正n边形的各个顶点位置处。此时，麦克风阵列所包含的麦克风数量与各个麦克风排列所构成的多边形的顶点数量相同。
61.在上述的麦克风阵列中，各个麦克风可以是全向麦克风也可以是定向麦克风，还可以是全向麦克风和定向麦克风的组合。在本实施例中，设置如图5所示的麦克风阵列全部由全向麦克风构成。其中，各个全向麦克风的参数相同，例如均采用一致性良好的高性能硅麦，各麦克风采用≥16k/24bit的拾音采样率。在实际应用中，各个全向麦克风的具体参数，也可以视情况和需求设置为不同的参数，例如麦克风类型可以不同，麦克风采样率也可以有差异。
62.作为一种更优化的实施方式，基于上述的由全向麦克风构成的麦克风阵列，当将其应用于音频采集时，还可以对阵列中的各个麦克风进行主麦和辅麦的区分，例如将麦克风阵列中的其中一个麦克风设置为主麦，其余麦克风设置为辅麦。其中，主麦则主要用于音频采集，也就是将主麦采集的音频主要用于音频存储、语音识别等；而对于辅麦采集的音频，则可以用于声源定位、角区分等。具体的主麦和辅麦的数量，以及具体选择哪个或哪些麦克风作为主麦，哪个或哪些麦克风作为辅麦，则均可以灵活确定。
63.另外，在将具有上述的能够区分主麦和辅麦的麦克风阵列的音频终端应用于音频采集时，还可以在音频采集过程中，视音频采集效果和需求，实时调整主麦和辅麦的数量，以及切换主麦和辅麦的角。
64.上述的麦克风阵列的主麦和辅麦的设置和切换等处理，均可以由音频终端的第二处理器执行，或者由控制音频终端的远端控制器执行，具体的控制过程可参见常规的麦克风阵列控制方案，本实用新型实施例不再详述。
65.作为另一种可选的实施方式，还可以设置一个全向麦克风和设定数量的定向麦克风构成麦克风阵列。
66.示例性的，参见图6所示，该麦克风阵列所包含的全向麦克风和设定数量(假设为8个)的定向麦克风设置于同一平面，并且，各个定向麦克风分别设置于规则多边形的各个顶点位置处，而全向麦克风则设置于规则多边形的中心位置处。
67.基于上述设置，外围的各个定向麦克风分别朝向不同的方向，用于从不同方向采集音频，由各个定向麦克风采集的音频的方向性更强，更加有利于进行声源定位以及声源角区分；而中间的全向麦克风，则主要用于采集全场音频信号，其音频采集的性能更强、音频采集范围更广泛，因此权项麦克风采集的音频则适于存储和语音识别。
68.在上述的麦克风阵列中，全向麦克风和定向麦克风的具体参数可以灵活设置，例如全向麦克风和定向麦克风的类型、拾音频率、定向麦克风的朝向等，均可以灵活设置。
69.在上述各种可能的麦克风阵列设置形式中，各个麦克风之间的距离，以及麦克风的数量，均可以灵活设置。理论上，麦克风数量越多、麦克风构成的阵列矩阵范围越大，其拾音范围越大，
70.作为一种示例性的实施方式，参见图7所示，本实施例提出的音频终端1不仅包括
单体或阵列形式的麦克风11和扬声器12，还包括与麦克风11和扬声器12电性连接的音频处理芯片13，此外还包括主处理器14、接口模块15、电池相关模块16和天线模块17。
71.其中，音频处理芯片13主要用于对音频信号进行处理，例如，对麦克风11采集的音频，和/或需要发送至扬声器12进行播放的音频，进行预处理，该预处理，包括但不限于音频降噪、分离人声和环境声、角区分中的任意一种或多种，具体的预处理内容可参见相应的常规处理内容，此处不再详述。
72.上述的主处理器14与音频处理芯片13电性连接，主要用于对整个音频终端的工作进行控制，包括对音频处理芯片13的工作进行控制，例如控制其启动或停止运行等。
73.主处理器14与天线模块17电性连接，通过天线模块17接收远程控制信号，并通过解析远程控制信号，对整个音频终端的工作进行控制。
74.接口模块15与主处理器14电性连接，用于通过接口传输音频数据或者控制信号。
75.电池相关模块16与主处理器14电性连接，用于对外接电源进行电源转换，并为主处理器14供电。
76.上述的音频终端1的各个具体结构的功能和工作过程，均可以参见现有技术中的相应功能和工作过程，本实施例不再详述，本实施例只重点指出该音频终端1的具体结构以及各结构之间的连接关系。
77.作为一种优选的实施方式，本实施例设置上述音频终端1中的音频处理芯片13与音频处理客户端2的第一处理器21电性连接，例如可以通过数据线连接或者无线连接。
78.在此基础上，音频处理芯片13可以通过其与第一处理器21之间的连接线路，将其对音频数据进行预处理后的预处理结果发送给第一处理器21。
79.例如，音频处理芯片13对麦克风11采集的音频，或者扬声器12播放的音频进行分离人声或环境声、音频降噪、角区分等预处理后，将预处理结果发送给第一处理器21。第一处理器21基于接收到的预处理结果，再调用音频处理服务端3，实现对音频终端1采集和/或播放的音频的转写和/或翻译。
80.例如，第一处理器21将接收到的预处理结果，发送至音频处理服务端3，使音频处理服务端3基于对音频的预处理结果，再对该音频进行转写和/或翻译处理。待音频处理服务端3完成音频转写和/或翻译处理后，将处理结果再反馈给第一处理器21。
81.作为示例性的实施方式，本实用新型实施例提出的音频系统的音频处理客户端2，可以是电脑软件客户端的形式。该电脑软件客户端启动后，用户可以在该音频处理客户端2上登录个人账号。用户登录个人账号后，音频处理客户端2对音频终端1进行硬件权益校验，主要是校验该音频终端1的设备信息是否符合预设要求，例如其序列号或id是否为预先设置的合法序列号或id。待校验通过后，音频处理客户端2与音频终端1建立软件和硬件的连接通信，例如与音频终端1的音频处理芯片或主处理器建立连接。同时，音频处理客户端2开启调用音频处理服务端3的功能，以便调用音频处理服务端3实现音频转写和/或翻译。此外，音频处理客户端2还可以控制音频终端1的工作，例如启动音频终端1的麦克风的拾音功能、启动音频终端1的扬声器播放音频、启动音频终端1的音频处理芯片进行音频处理等。
82.参见图8所示，上述的音频处理客户端2，不仅包括第一处理器21，还包括与该第一处理器21和音频终端1电性连接的第二处理器22，该第二处理器22具体可以是任意类型的处理器，例如可以是处理芯片。该第二处理器22可以对音频处理服务端3反馈的音频的转写
结果和/或翻译结果进行编辑和/或存储。
83.其中，对音频转写结果和/或翻译结果进行编辑，包括但不限于是对转写结果和/或翻译结果进行匹配、对齐、校正等。当第二处理器22对音频转写结果进行修改后，还可以将修改内容再次发送至音频处理服务端3进行重新翻译。
84.第二处理器22对音频转写结果和/或翻译结果进行存储，一方面可以存储至本地存储器中，另一方面，可以同步存储至用户个人账号中。
85.此外，该音频处理客户端2中还包括音效控制器23。该音效控制器23与音频终端1电性连接，其可以根据音频终端1采集的音频信号，以及系统设置，确定音频终端1所处的工作环境，并根据音频终端1所处的工作环境，对音频终端1的音频播放效果进行设置。
86.具体的，音效控制器23主要用于对音频终端1的扬声器音效进行控制、调整。具体的工作环境识别及音效调整处理过程，可以参见现有技术中的相应功能的处理过程，本实施例不再详述。
87.示例性的，参见图9所示，在本实用新型的另一实施例中公开了，上述的音频处理服务端3，还包括与音频处理客户端2中的第一处理器21电性连接的角区分服务器33，用于对音频进行人声角区分处理。该角区分服务器33同样采用服务器+运行于服务器上的算法程序的构成方式，其对音频进行人声角区分处理的具体处理过程，可参见常规的语音角区分方案，本实施例不再详述。
88.综上所述，本实用新型各实施例提出的音频系统，由包括麦克风和扬声器的音频终端、包括不同功能处理器和控制器的音频处理客户端，以及包括不同服务器的音频处理服务端构成。其本地+云端的系统结构，使得该音频系统不仅可以实现基本的音频采集和播放功能，还能实现音频转写和翻译，因此具备更强、更丰富的音频处理功能，能够满足用户多样化的音频处理需求。
89.上述实施例以示例的方式，介绍了本实用新型提出的音频系统的各部分结构，以及各部分结构的组装、连接方式。其中关于各部分结构的功能的实现，均可以参照现有技术方案中的相应功能的实现而执行，本实施例不再详述。
90.需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。本技术各实施例的装置及终端中的模块和子模块可以根据实际需要进行合并、划分和删减，各实施例中记载的特征可以进行替换或者组合。
91.本技术所提供的几个实施例中，应该理解到，所揭露的终端，装置，可以通过其它的方式实现。例如，模块或子模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个子模块或模块可以结合或者可以集成到另一个模块，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。
92.作为分离部件说明的模块或子模块可以是或者也可以不是物理上分开的，作为模块或子模块的部件可以是或者也可以不是物理模块或子模块，即可以位于一个地方，或者也可以分布到多个网络模块或子模块上。可以根据实际的需要选择其中的部分或者全部模块或子模块来实现本实施例方案的目的。
93.另外，在本技术各个实施例中的各功能模块或子模块可以集成在一个处理模块
中，也可以是各个模块或子模块单独物理存在，也可以两个或两个以上模块或子模块集成在一个模块中。
94.最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。
95.对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下，在其它实施例中实现。因此，本技术将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术特征：

1.一种音频系统，其特征在于，包括：音频终端、音频处理客户端，以及音频处理服务端；其中，所述音频终端，用于采集及播放音频；所述音频处理客户端，包括与所述音频终端电性连接的第一处理器，用于通过调用音频处理服务端，实现对所述音频终端采集的和/或播放的音频的转写和/或翻译；所述音频处理服务端，包括与所述第一处理器电性连接的音频转写服务器和/或音频翻译服务器，所述音频转写服务器用于对音频进行文本转写，所述音频翻译服务器用于对音频进行翻译。2.根据权利要求1所述的音频系统，其特征在于，所述音频终端包括由设定数量的麦克风构成的麦克风阵列，以及扬声器阵列；所述麦克风阵列用于采集音频信号；所述扬声器用于播放音频。3.根据权利要求2所述的音频系统，其特征在于，所述麦克风阵列包括设定数量的全向麦克风和/或定向麦克风。4.根据权利要求2所述的音频系统，其特征在于，所述麦克风阵列所包括的设定数量的麦克风设置于同一平面，并且分别置于规则多边形的各个顶点位置处。5.根据权利要求2所述的音频系统，其特征在于，所述麦克风阵列包括一个全向麦克风和设定数量的定向麦克风；其中，所述全向麦克风和设定数量的定向麦克风设置于同一平面，并且，各个定向麦克风分别设置于规则多边形的各个顶点位置处，所述全向麦克风设置于所述规则多边形的中心位置处。6.根据权利要求1所述的音频系统，其特征在于，所述音频终端包括音频处理芯片，用于对采集和/或播放的音频进行预处理，所述预处理至少包括音频降噪、分离人声和环境声、角区分中的一种或多种。7.根据权利要求6所述的音频系统，其特征在于，所述音频处理芯片与所述音频处理客户端的第一处理器电性连接，以便所述音频处理芯片通过其与所述第一处理器之间的电性连接线路，将音频预处理结果发送至所述第一处理器。8.根据权利要求1所述的音频系统，其特征在于，所述音频处理客户端还包括与所述第一处理器和所述音频终端电性连接的第二处理器，用于对音频的转写结果和/或翻译结果进行编辑和/或存储。9.根据权利要求1所述的音频系统，其特征在于，所述音频处理客户端还包括与所述音频终端电性连接的音效控制器，用于识别所述音频终端的工作环境，并根据所述音频终端的工作环境，对所述音频终端的音频播放效果进行设置。10.根据权利要求1所述的音频系统，其特征在于，所述音频处理服务端还包括与所述第一处理器电性连接的角区分服务器，用于对音频进行人声角区分处理。

技术总结

本申请提出一种音频系统，包括：音频终端、音频处理客户端，以及音频处理服务端；其中，所述音频终端，用于采集及播放音频；所述音频处理客户端，包括与所述音频终端电性连接的第一处理器，用于通过调用音频处理服务端，实现对所述音频终端采集的和/或播放的音频的转写和/或翻译；所述音频处理服务端，包括与所述第一处理器电性连接的音频转写服务器和/或音频翻译服务器，所述音频转写服务器用于对音频进行文本转写，所述音频翻译服务器用于对音频进行翻译。该音频系统不仅能够实现基本的语音采集和播放功能，还能够实现音频转写和/或翻译功能。功能。功能。