车载多模语音性能测试方法、装置、设备及存储介质与流程

1.本技术涉及车辆技术领域，具体涉及一种车载多模语音性能测试方法、装置、设备及存储介质。

背景技术：

2.随着汽车智能化进程的不断推进，车载语音功能也在向多模态方向发展。多模语音利用dms(driver monitor status，防疲劳预警系统)摄像头和麦克风获取目标人物的唇形和语音双模特征，结合汽车出行场景，建立合理有效的多模交互配合满足用户未来出行的体验需求。
3.但传统的车载语音性能测试方法存在交互场景覆盖不够全面，需要设计更多的交互场景的问题。

技术实现要素：

4.鉴于以上所述现有技术的缺点，本发明提供一种车载多模语音性能测试方法、装置、设备及存储介质，以解决相关技术中传统的车载语音性能测试方法存在交互场景覆盖不够全面，需要设计更多的交互场景的技术问题。
5.本发明实施例提供的一种车载多模语音性能测试方法，所述方法包括：
6.获取车辆的车辆所处场景信息、预设测试语音方案和测试调整信息，所述测试调整信息包括光线信息、车窗状态、空调状态、车内音频设备状态、车速、网络状态、车内测试人员的人员特征信息中至少之一；
7.根据所述车辆所处场景信息确定所述测试调整信息的调整方案；
8.基于所述调整方案调整所述测试调整信息，得到多个测试场景，车内测试人员通过预设测试语音方案对各所述测试场景下所述车辆的车载多模语音系统的性能进行测试，得到测试结果。
9.于本发明一实施例中，所述车辆所处场景信息包括静态工况或动态工况，根据所述车辆所处场景信息确定所述测试调整信息的调整方案包括：
10.若所述车辆所处场景信息包括静态工况，所述调整方案包括调整所述空调状态、所述网络状态、所述光线信息、所述人员特征信息、所述车窗状态中至少之一；
11.若所述车辆所处场景信息包括动态工况，所述调整方案包括调整所述空调状态、所述车速、所述车窗状态、所述车内音频设备状态、所述光线信息、所述人员特征信息、所述车窗状态中至少之一。
12.于本发明一实施例中，若所述车辆所处场景信息包括静态工况，所述方法还包括，
13.获取所述车辆所处环境的背景噪音分贝值；
14.若所述背景噪音分贝值小于预设分贝值，执行免唤醒语音误触发测试，所述免唤醒语音误触发测试包括以下至少之一：
15.在所述车辆内部播放音乐音频和导航音频中至少之一，记录所述车载语音系统的
误触发次数；
16.在所述车辆的主驾驶位置上接打电话，记录所述车载语音系统的误触发次数；
17.位于非主驾驶位置的干扰人员通过预设测试语音方案对各所述测试场景下所述车辆的车载多模语音系统的性能进行测试，记录所述车载语音系统的误触发次数；
18.佩戴口罩的所述车内测试人员通过预设测试语音方案对各所述测试场景下所述车辆的车载多模语音系统的性能进行测试，记录所述车载语音系统的误触发次数；
19.所述车内测试人员与所述干扰人员进行交谈，记录所述车载语音系统的误触发次数。
20.于本发明一实施例中，若所述车辆所处场景信息包括静态工况，所述方法还包括，
21.获取所述车辆所处环境的背景噪音分贝值；
22.若所述背景噪音分贝值小于预设分贝值，执行语音响应时间测试，所述语音响应时间测试包括以下至少之一：
23.所述车内测试人员发出导航启动语音指令，根据所述导航启动语音指令的导航指令发出时间，以及所述车辆的导航设备调整到预设导航页面的页面调整时间确定导航响应时长；
24.所述车内测试人员发出音乐切换语音指令，根据所述音乐切换语音指令的切换指令发出时间，以及所述车辆的音乐播放设备完成音乐切换的切换完成时间确定切换响应时长；
25.所述车内测试人员发出拨号语音指令，根据所述拨号语音指令的拨号指令发出时间，以及所述车辆的拨号设备调整为联系人选择界面或电话拨出界面的拨号完成时间确定拨号响应时长。
26.于本发明一实施例中，执行语音响应时间测试之前，所述方法还包括以下至少之一：
27.调整所述车辆的发动机处于怠速状态；
28.调整所述车内音频设备状态为关闭；
29.调整所述空调状态为关闭。
30.于本发明一实施例中，基于预设测试语音方案对各所述测试场景下所述车辆的车载多模语音性能进行测试之前，所述方法还包括：
31.获取车辆的车机工作状态、摄像头工作状态、麦克风连接状态、所述车内测试人员的车内位置信息；
32.若车机工作正常，麦克风连接正常，摄像头工作正常，以及车内测试人员位于主驾驶位置，基于预设测试语音方案对各所述测试场景下所述车辆的车载多模语音性能进行测试；
33.若车机工作异常，麦克风连接异常，摄像头工作异常，以及车内测试人员位于非主驾驶位置中存在至少之一，提示车辆尚未处于车载多模语音性能测试状态。
34.于本发明一实施例中，所述人员特征信息包括所述车内测试人员的配饰穿戴信息、性别信息、语言信息中至少之一。
35.本发明实施例一种车载多模语音性能测试装置，所述装置包括：
36.获取模块，用于获取车辆的车辆所处场景信息、测试用语集和测试调整信息，所述
测试调整信息包括光线信息、车窗状态、空调状态、车内音频设备状态、车速、网络状态、车内测试人员的人员特征信息中至少之一；
37.方案确定模块，用于根据所述车辆所处场景信息确定所述测试调整信息的调整方案；
38.测试模块，用于基于所述调整方案调整所述测试调整信息，得到多个测试场景，车内测试人员通过预设测试语音方案对各所述测试场景下所述车辆的车载多模语音系统的性能进行测试，得到测试结果。
39.本发明实施例提供的一种电子设备，所述电子设备包括：
40.一个或多个处理器；
41.存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述电子设备实现如上述任一项实施例所述的车载多模语音性能测试方法。
42.本发明实施例提供的一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序被计算机的处理器执行时，使计算机执行如上述任一项实施例所述的车载多模语音性能测试方法。
43.本发明的有益效果：本发明中的车载多模语音性能测试方法、装置、设备及存储介质，通过获取车辆的车辆所处场景信息、预设测试语音方案和测试调整信息，根据所述车辆所处场景信息确定所述测试调整信息的调整方案，基于所述调整方案调整所述测试调整信息，得到多个测试场景，车内测试人员通过预设测试语音方案对各所述测试场景下所述车辆的车载多模语音系统的性能进行测试，得到测试结果，考虑了多种人员特征信息、多种测试调整信息，测试的交互场景覆盖更为全面，测试结果更为可靠。
44.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本技术。
附图说明
45.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本技术的实施例，并与说明书一起用于解释本技术的原理。显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术者来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：
46.图1是本技术的一示例性实施例示出的一实施环境示意图；
47.图2是本技术的一示例性实施例示出的车载多模语音性能测试方法的流程图；
48.图3是本技术的另一示例性实施例示出的车载多模语音性能测试方法的流程图；
49.图4提供了一示例性实施例示出的检查车辆状态方法的流程图；
50.图5是本技术的一示例性实施例示出的车载多模语音性能测试装置的框图；
51.图6示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。
具体实施方式
52.以下将参照附图和优选实施例来说明本发明的实施方式，本领域技术人员可由本说明书中所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同
的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。应当理解，优选实施例仅为了说明本发明，而不是为了限制本发明的保护范围。
53.需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。
54.在下文描述中，探讨了大量细节，以提供对本发明实施例的更透彻的解释，然而，对本领域技术人员来说，可以在没有这些具体细节的情况下实施本发明的实施例是显而易见的，在其他实施例中，以方框图的形式而不是以细节的形式来示出公知的结构和设备，以避免使本发明的实施例难以理解。
55.图1是本技术的一示例性实施例示出的一实施环境示意图。如图1所示，该车载多模语音性能测试系统包括客户端102和服务器101，其中，该服务器101可以包括独立运行的服务器、分布式服务器或由多个服务器组成的服务器集。服务器101 可以包括有网络通信单元、处理器和存储器等。服务器101可以存储有多个车型的预设测试语音方案和调整方案，当需要对车辆进行多模语音性能测试时，客户端通过向服务器获取当前车辆所对应的车型，或者是当前车辆所需要的调整方案和预设测试语音方案再对车辆进行车载多模语音性能测试。客户端102可以包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备、车载终端等类型的实体设备，也可以包括运行于实体设备中的软体，例如一些服务商提供给用户的网页页面，也可以为该些服务商提供给用户的应用。客户端102也可以用于执行本实施例提供的车载多模语音性能测试方法，或者通过服务器和客户端的交互以执行本实施例提供的车载多模语音性能测试方法。在此不做限定。其中，预设测试语音方案和调整方案也可以预先存储于客户端本地，不需要通过与服务器交互得到。测试得到的测试结果可以由客户端传输给服务器，以便后续使用。通过在客户端输入车辆的车辆所处场景信息、预设测试语音方案和测试调整信息后，客户端根据车辆场景信息确定测试调整信息的调整方案，客户端根据不同的车辆场景信息预先保存有多个调整方案，本领域技术人员可以根据需要选择一个或多个测试方案，以对测试调整信息进行调整。车内测试人员通过预设测试语音方案对各测试场景下车辆的车载多模语音系统的性能进行测试，得到测试结果。
56.随着汽车智能化进程的不断推进，车载语音功能也在向多模态方向发展。多模语音利用dms(driver monitor status，防疲劳预警系统)摄像头和麦克风获取目标人物的唇形和语音双模特征，结合汽车出行场景，建立合理有效的多模交互配合满足用户未来出行的体验需求。
57.多模语音主要实现了全时免唤醒和避免误触发两大核心功能，相对于传统的车载语音性能测试方法，一是交互场景覆盖不够全面，需要设计更多的交互场景，例如多模态语音融合了摄像头视觉检测，需要考虑光照角度的影响；二是测试语料的不全面，由于不同车主的说话习惯可能也不同，对语音同一控制指令的表达也不一致，所以需要设计更多的相近语料去验证多模语音识别率。
58.传统的车载语音性能测试方法存在交互场景覆盖不够全面，需要设计更多的交互
场景的问题。
59.为解决这些问题，本技术的实施例分别提出一种车载多模语音性能测试方法、一种车载多模语音性能测试装置、一种电子设备、一种计算机可读存储介质以及一种计算机程序产品，以下将对这些实施例进行详细描述。
60.请参阅图2，图2是本技术的一示例性实施例示出的车载多模语音性能测试方法的流程图。该方法可以应用于图1所示的实施环境，并由该实施环境中的服务器101 和/或客户端102具体执行。应理解的是，该方法也可以适用于其它的示例性实施环境，并由其它实施环境中的设备具体执行，本实施例不对该方法所适用的实施环境进行限制。
61.如图2所示，在一示例性的实施例中，该车载多模语音性能测试方法至少包括步骤s201至步骤s203，详细介绍如下：
62.步骤s201，获取车辆的车辆所处场景信息、预设测试语音方案和测试调整信息。
63.其中，测试调整信息包括但不限于光线信息、车窗状态、空调状态、车内音频设备状态、车速、网络状态、车内测试人员的人员特征信息等中至少之一。其中，光线信息包括但不限于光线强度、光线角度、光线条件场景，光线条件场景如逆光、弱光、阴阳脸等中至少之一。车窗状态包括但不限于全部关闭、前门车窗关闭、后门车窗关闭、全部开启等中至少之一。空调状态包括但不限于开启空调、关闭空调、空调风量为不同档位等中至少之一。车内音频设备状态可以包括车内音乐设备开启及开启音量、车内音乐设备关闭、车内导航设备开启及开启音量、车内导航设备关闭等中至少之一。网络状态包括但不限于网络开启及网络信号强度、网络关闭如4g 网络关闭等中至少之一。人员特征信息包括车内测试人员的配饰穿戴信息、性别信息、语言信息中至少之一，例如人员特征信息包括但不限于配饰穿戴如口罩、帽子等，性别，语言如普通话、方言、外语等，动作信息如接打电话、与乘员交谈等。
64.其中车辆所处场景信息包括静态工况或动态工况，也即车辆是否处于移动状态，换句话说，车辆所述场景可以理解为车辆的车速，车速为零，则可以认为车辆所处场景信息为静态工况，否则，车速大于零，则可以认为车辆所处场景信息为动态工况。
65.针对于静态工况，还可以要求出车速等于0外，车辆外部背景噪音的分贝小于预设分贝阈值，如被测车辆停靠在背景噪音≤60db的环境下，此外，还可以要求车辆的网络信号强度大于一定的网络信号强度，如车辆网络信号强度＞-90dbm等。
66.预设测试语音方案为本领域技术人员通过所知晓的方式所得到的用于进行车载多模语音性能测试语音内容，以通过该预设测试语音方案对车载多模语音系统进行形成测试。例如，预设测试语音方案可以为多个控制车载多模语音系统的语音控制词语，车内测试人员通过朗读语音控制词语以对各测试场景下车辆的车载多模语音系统的性能进行测试。
67.上述信息可以通过车辆的各种传感器来采集，也可以通过本领域技术人员所知晓的方式进行采集。
68.步骤s202，根据所述车辆所处场景信息确定测试调整信息的调整方案。
69.其中，客户端或服务器上存储有多个预设方案，各预设方案分别对应于不同的车辆所处场景信息，当知晓车辆所处场景信息后，可以从上述预设方案中选择一个或多个作为调整方案。
70.调整方案中包括有对测试调整信息中多个子信息进行调整的方式、幅度等，以便根据调整方案调整测试调整信息对应的设备的设备状态。
71.在一实施例中，车辆所处场景信息包括静态工况或动态工况，根据车辆所处场景信息确定测试调整信息的调整方案包括：
72.若车辆所处场景信息包括静态工况，调整方案包括调整空调状态、网络状态、光线信息、人员特征信息、车窗状态中至少之一；
73.若车辆所处场景信息包括动态工况，调整方案包括调整空调状态、车速、车窗状态、车内音频设备状态、光线信息、人员特征信息、车窗状态中至少之一。
74.当车辆所处场景信息包括动态工况，调整方案还包括调整道路种类，如由城市普通道路调整为城市快速路、山间道路、高速道路等中一种或多种。
75.在一实施例中，若车辆所处场景信息包括静态工况，方法还包括，
76.获取车辆所处环境的背景噪音分贝值；
77.若背景噪音分贝值小于预设分贝值，执行免唤醒语音误触发测试，免唤醒语音误触发测试包括以下至少之一：
78.在车辆内部播放音乐音频和导航音频中至少之一，记录车载语音系统的误触发次数；
79.在车辆的主驾驶位置上接打电话，记录车载语音系统的误触发次数；
80.位于非主驾驶位置(副驾驶位、车辆后排座等)的干扰人员通过预设测试语音方案对各测试场景下车辆的车载多模语音系统的性能进行测试，记录车载语音系统的误触发次数；
81.佩戴口罩的车内测试人员通过预设测试语音方案对各测试场景下车辆的车载多模语音系统的性能进行测试，记录车载语音系统的误触发次数；
82.车内测试人员与干扰人员进行交谈，记录车载语音系统的误触发次数。
83.其中误触发次数可以由人工记录并上报，也可以通过车辆的测试结果核对装置对测试结果进行分析核对，记录误触发的次数。
84.其中，误触发的次数可以通过预设的测试结果检测装置进行检测，并记录其中测试结果与正确结果不同的次数，作为误触发的次数。误触发的次数也可以通过人工等方式记录并上传。
85.在一实施例中，若车辆所处场景信息包括静态工况，该方法还包括，
86.获取车辆所处环境的背景噪音分贝值；
87.若背景噪音分贝值小于预设分贝值，执行语音响应时间测试，语音响应时间测试包括以下至少之一：
88.车内测试人员发出导航启动语音指令，根据导航启动语音指令的导航指令发出时间，以及车辆的导航设备调整到预设导航页面的页面调整时间确定导航响应时长；
89.车内测试人员发出音乐切换语音指令，根据音乐切换语音指令的切换指令发出时间，以及车辆的音乐播放设备完成音乐切换的切换完成时间确定切换响应时长；
90.车内测试人员发出拨号语音指令，根据拨号语音指令的拨号指令发出时间，以及车辆的拨号设备调整为联系人选择界面或电话拨出界面的拨号完成时间确定拨号响应时长。
91.在一实施例中，执行语音响应时间测试之前，该方法还包括以下至少之一：
92.调整车辆的发动机处于怠速状态；
93.调整车内音频设备状态为关闭；
94.调整空调状态为关闭。
95.步骤s203，基于调整方案调整测试调整信息，得到多个测试场景，车内测试人员通过预设测试语音方案对各测试场景下车辆的车载多模语音系统的性能进行测试，得到测试结果。
96.需要说明的是，对于车辆的初始状态，也可以作为一个测试场景，与基于调整方案调整测试调整信息后得到的测试场景一并被车内测试人员通过预设测试语音方案对车载多模语音系统的性能进行测试。
97.当车辆所处场景信息为静态工况时，调整方案可以为：将空调状态调整空调风量为三档风、次高档风，将网络状态调整为4g网络关闭，将光线信息调整为阴阳脸、逆光、弱光(地下车库)等，人员特征信息可以由男性调整为女性，或者由女性调整为男性等。
98.当车辆所处场景信息为动态工况时，调整方案可以为：将车速逐步提升，调整车辆的行驶道路种类如城市道路、城市快速路、高速路等。将车内音频设备状态调整为开启，并调整音量为中档，车内导航设备调整为开启，音量中档等，将空调状态调整空调风量为三档风、次高档风，将网络状态调整为4g网络关闭，将光线信息调整为阴阳脸、逆光、弱光(地下车库)等，人员特征信息可以由男性调整为女性，或者由女性调整为男性等。将车窗状态调整为前排车窗全开、后排车窗全关，或者前后排车窗全关等。
99.在一实施例中，基于预设测试语音方案对各测试场景下车辆的车载多模语音性能进行测试之前，该方法还包括：
100.获取车辆的车机工作状态、摄像头(dms摄像头)工作状态、麦克风连接状态、车内测试人员的车内位置信息；
101.若车机工作正常，麦克风连接正常，摄像头工作正常，以及车内测试人员位于主驾驶位置，基于预设测试语音方案对各测试场景下车辆的车载多模语音性能进行测试；
102.若车机工作异常，麦克风连接异常，摄像头工作异常，以及车内测试人员位于非主驾驶位置中存在至少之一，提示车辆尚未处于车载多模语音性能测试状态，还可以提示异常原因，如车机工作异常，麦克风连接异常，摄像头工作异常，以及车内测试人员位于非主驾驶位置等。
103.上述实施例提供的车载多模语音性能测试方法，通过获取车辆的车辆所处场景信息、预设测试语音方案和测试调整信息，根据所述车辆所处场景信息确定所述测试调整信息的调整方案，基于所述调整方案调整所述测试调整信息，得到多个测试场景，车内测试人员通过预设测试语音方案对各所述测试场景下所述车辆的车载多模语音系统的性能进行测试，得到测试结果，考虑了多种人员特征信息、多种测试调整信息，测试的交互场景覆盖更为全面，测试结果更为可靠。
104.请参阅图3，图3是本技术的另一示例性实施例示出的车载多模语音性能测试方法的流程图。该方法可以应用于图1所示的实施环境，并由该实施环境中的服务器 101和/或客户端102具体执行。应理解的是，该方法也可以适用于其它的示例性实施环境，并由其它实施环境中的设备具体执行，本实施例不对该方法所适用的实施环境进行限制。
105.如图3所示，在一示例性的实施例中，该车载多模语音性能测试方法至少包括步骤s301至步骤s305，详细介绍如下：
106.步骤s301，测试车辆准备，检查车辆状态。
107.测试车辆准备可以理解为确定当前需要进行测试的车辆。
108.其中，检查车辆状态的过程可以参见图4，图4提供了一示例性实施例示出的检查车辆状态方法的流程图，如图4所示，该方法包括：
109.步骤s401，被测车辆准入检查。
110.步骤s402，检查车机状态。
111.步骤s403，检查麦克风连接状态。
112.步骤s302，测试人员准备。
113.测试人员是模拟用户负责与车载语音进行交流，测试人员由不同的性别构成，同时需要负责记录测试结果和测试发生的现象。测试人员包括车内测试人员和干扰人员。
114.步骤s303，测试场景加载。
115.也即调整方案的加载。
116.步骤s304，记录车内与车外背景噪音。
117.车内与车外背景噪音可以分别为车内音频设备的音量、背景噪音分贝值。
118.步骤s305，测试人员按照语料逐条进行测试。
119.通过测试人员与测试场景设计等。通过测试人员和场景的不同组合，实现对车载多模语音性能的全面评估验证。所述测试人员场景至少包括性别、语言及口罩遮挡中的一种或者多种。所述测试场景至少包括光照大小、光照角度、居民区、商业区、静态、人人交谈、城市道路、山间道路及高速道路中的一种或者多种。
120.对于测试人员的设计包括以下一项或几项：
121.测试人员的配饰穿戴：口罩；
122.测试人员的性别：男性、女性；
123.测试人员的语言：普通话、各地方言；
124.测试人员的动作：接打电话、与乘员交谈。
125.对于实车的场景设计包括以下一项或几项：
126.实车所处状态：静态场景、动态场景；其中，静态环境需要考虑安静场所与嘈杂的商场周围，还需考虑车窗状态、空调状态和车内音乐音量等影响因素；动态环境需要考虑车速大小、车窗开闭、空调状态、音乐以及导航音量等影响因素；
127.光线条件场景：逆光、弱光、阴阳脸；
128.以下进行详细举例说明(对于不同测试场景实例，实施方式可能不一样，但原理一致)：
129.1.静态工况语音免唤醒识别率试验
130.a)试验前需确保被测车辆状态良好，车机处于正常工作状态，麦克风正常连接；
131.b)将被测车辆停靠在背景噪音≤60db的环境下，网络信号强度＞-90dbm，发动机处于怠速状态，测试人员需位于主驾位置上，处于正常光照条件下，调整至自己合适的坐姿；
132.c)空调风量设置为一档风，车辆背景音乐音量大小为中档；
133.d)测试语料为多模语音支持全时免唤醒的所有功能，测试人员正常发音，按照测试语料逐条进行识别率测试，每条测试语料重复三次，并将测试结果进行记录(功能执行成
功视为通过，若执行不成功则视为失败)；
134.e)将空调风量分别设置为三档风和次高档风，重复步骤c)；
135.f)将车载4g网络关闭，重复步骤b)-d)；
136.g)测试人员处于不同的光线条件下：阴阳脸、逆光、弱光(地下车库)，重复步骤b)-e)；
137.h)测试人员为两男两女，重复步骤b)-f)。
138.2.动态工况语音免唤醒识别率试验
139.a)试验前需确保被测车辆状态良好，车机处于正常工作状态，麦克风正常连接，测试人员位于主驾位置上，调整至自己合适的坐姿，负责语料识别率测试，另一名测试人员位于副驾位置上，负责协助观察路况及记录测试结果；
140.b)被测车辆在城市道路上行驶，平均车速40km/h,前排车窗全开，后排车窗全关，空调关闭，播放音乐，音乐媒体音量中档，打开导航，导航音量中档；
141.c)测试语料为多模语音支持全时免唤醒的所有功能，测试人员正常发音，由主驾测试人员按照测试语料逐条进行识别率测试，每条测试语料重复三次，并由副驾测试人员将测试结果进行记录(功能执行成功视为通过，若执行不成功则视为失败)；
142.d)被测车辆在城市道路上行驶，平均车速40km/h，前后排车窗全关，空调三档风，播放音乐，音乐媒体音量中档，打开导航，导航音量中档，重复步骤c)；
143.e)被测车辆在城市快速路上行驶，平均车速60km/h，前排车窗全开，后排车窗全关，空调关闭，播放音乐，音乐媒体音量中档，打开导航，导航音量中档，重复步骤c)；
144.f)被测车辆在城市快速路上行驶，平均车速60km/h，前后排车窗全关，空调三档风，播放音乐，音乐媒体音量中档，打开导航，导航音量中档，重复步骤c)；
145.g)被测车辆在高速路上行驶，平均车速90km/h，前后排车窗全关，空调三档风，播放音乐，音乐媒体音量中档，打开导航，导航音量中档，重复步骤c)。
146.3.免唤醒语音误触发率试验
147.a)将被测车辆停放在背景噪音≤60db的环境下，被测车辆车机处于正常工作状态，麦克风正常连接；
148.b)车内连续播放音乐文件和导航声音，记录语音系统误触发次数；
149.c)测试人员位于主驾位置上，调整至合适的坐姿，接打电话，记录语音系统误触发次数；
150.d)另一名测试人员位于副驾位置上，主驾保持沉默，由副驾测试人员按照测试语料逐条进行误触发测试，记录语音系统误触发次数；
151.e)主驾佩戴口罩，按照测试语料逐条进行误触发测试，记录语音系统误触发次数；
152.f)主驾、副驾与后排两位测试人员，模拟乘员相互正常交谈对话场景，记录语音系统误触发次数；
153.4.多模语音响应时间测试
154.a)将被测车辆停靠在背景噪音≤60db的环境下，网络信号强度＞-90dbm，发动机处于怠速状态，测试人员需位于主驾位置上，处于正常光照条件下，调整到自己合适的坐姿；
155.b)空调、音乐与导航处于关闭状态；
156.c)导航场景响应时间：测试人员说出“导航到xxx”，从测试人员停止说话开始计时，到对应地址选择界面停止计时；
157.d)音乐场景响应时间：测试人员说出“我要听xxx”，从测试人员停止说话开始计时，到歌曲完成切换停止计时；
158.e)电话场景响应时间：测试人员说出“打电话给xxx”，从测试人员停止说话开始计时，到显示出对应联系人选择界面或者电话拨出界面停止计时。
159.本实施例提供的方法包括测试人员与测试场景设计等。通过测试人员和场景的不同组合，实现对车载多模语音性能的全面评估验证。测试人员场景至少包括性别、语言及口罩遮挡中的一种或者多种。所述测试场景至少包括光照大小、光照角度、居民区、商业区、静态、人人交谈、城市道路、山间道路及高速道路中的一种或者多种。
160.图5是本技术的一示例性实施例示出的车载多模语音性能测试装置的框图。该车载多模语音性能测试装置可以应用于图1所示的实施环境，并具体配置在服务器和/或客户端中。该车载多模语音性能测试装置也可以适用于其它的示例性实施环境，并具体配置在其它设备中，本实施例不对该装置所适用的实施环境进行限制。
161.如图5所示，该示例性的车载多模语音性能测试装置500包括：
162.获取模块501，用于获取车辆的车辆所处场景信息、测试用语集和测试调整信息，测试调整信息包括光线信息、车窗状态、空调状态、车内音频设备状态、车速、网络状态、车内测试人员的人员特征信息中至少之一；
163.方案确定模块502，用于根据车辆所处场景信息确定测试调整信息的调整方案；
164.测试模块503，用于基于调整方案调整测试调整信息，得到多个测试场景，车内测试人员通过预设测试语音方案对各测试场景下车辆的车载多模语音系统的性能进行测试，得到测试结果。
165.需要说明的是，上述实施例所提供的车载多模语音性能测试与上述实施例图2 所提供的车载多模语音性能测试方法属于同一构思，其中各个模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述，此处不再赘述。上述实施例所提供的车载多模语音性能测试装置在实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能，本处也不对此进行限制。
166.本技术的实施例还提供了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述电子设备实现上述各个实施例中提供的车载多模语音性能测试方法。
167.图6示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。需要说明的是，图6示出的电子设备的计算机系统600仅是一个示例，不应对本技术实施例的功能和使用范围带来任何限制。
168.如图6所示，计算机系统600包括中央处理单元(central processing unit，cpu) 601，其可以根据存储在只读存储器(read-only memory，rom)602中的程序或者从储存部分608加载到随机访问存储器(random access memory，ram)603中的程序而执行各种适当的动作和处理，例如执行上述实施例中所述的方法。在ram 603 中，还存储有系统操作所需的各种程序和数据。cpu 901、rom602以及ram 603 通过总线604彼此相连。输入/输出(input/
output，i/o)接口605也连接至总线604。
169.以下部件连接至i/o接口605：包括键盘、鼠标等的输入部分606；包括诸如阴极射线管(cathode ray tube，crt)、液晶显示器(liquid crystal display，lcd) 等以及扬声器等的输出部分607；包括硬盘等的储存部分608；以及包括诸如lan (local area network，局域网)卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至 i/o接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入储存部分608。
170.特别地，根据本技术的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本技术的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(cpu) 601执行时，执行本技术的系统中限定的各种功能。
171.需要说明的是，本技术实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器 (rom)、可擦式可编程只读存储器(erasable programmable read only memory， eprom)、闪存、光纤、便携式紧凑磁盘只读存储器(compact disc read-onlymemory，cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。
172.附图中的流程图和框图，图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
173.描述于本技术实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况
下并不构成对该单元本身的限定。
174.本技术的另一方面还提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被计算机的处理器执行时，使计算机执行如前所述的车载多模语音性能测试方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的，也可以是单独存在，而未装配入该电子设备中。
175.本技术的另一方面还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各个实施例中提供的车载多模语音性能测试方法。
176.上述实施例仅示例性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，但凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。

技术特征：

1.一种车载多模语音性能测试方法，其特征在于，所述方法包括：获取车辆的车辆所处场景信息、预设测试语音方案和测试调整信息，所述测试调整信息包括光线信息、车窗状态、空调状态、车内音频设备状态、车速、网络状态、车内测试人员的人员特征信息中至少之一；根据所述车辆所处场景信息确定所述测试调整信息的调整方案；基于所述调整方案调整所述测试调整信息，得到多个测试场景，车内测试人员通过预设测试语音方案对各所述测试场景下所述车辆的车载多模语音系统的性能进行测试，得到测试结果。2.如权利要求1所述的车载多模语音性能测试方法，其特征在于，所述车辆所处场景信息包括静态工况或动态工况，根据所述车辆所处场景信息确定所述测试调整信息的调整方案包括：若所述车辆所处场景信息包括静态工况，所述调整方案包括调整所述空调状态、所述网络状态、所述光线信息、所述人员特征信息、所述车窗状态中至少之一；若所述车辆所处场景信息包括动态工况，所述调整方案包括调整所述空调状态、所述车速、所述车窗状态、所述车内音频设备状态、所述光线信息、所述人员特征信息、所述车窗状态中至少之一。3.如权利要求2所述的车载多模语音性能测试方法，其特征在于，若所述车辆所处场景信息包括静态工况，所述方法还包括，获取所述车辆所处环境的背景噪音分贝值；若所述背景噪音分贝值小于预设分贝值，执行免唤醒语音误触发测试，所述免唤醒语音误触发测试包括以下至少之一：在所述车辆内部播放音乐音频和导航音频中至少之一，记录所述车载语音系统的误触发次数；在所述车辆的主驾驶位置上接打电话，记录所述车载语音系统的误触发次数；位于非主驾驶位置的干扰人员通过预设测试语音方案对各所述测试场景下所述车辆的车载多模语音系统的性能进行测试，记录所述车载语音系统的误触发次数；佩戴口罩的所述车内测试人员通过预设测试语音方案对各所述测试场景下所述车辆的车载多模语音系统的性能进行测试，记录所述车载语音系统的误触发次数；所述车内测试人员与所述干扰人员进行交谈，记录所述车载语音系统的误触发次数。4.如权利要求2所述的车载多模语音性能测试方法，其特征在于，若所述车辆所处场景信息包括静态工况，所述方法还包括，获取所述车辆所处环境的背景噪音分贝值；若所述背景噪音分贝值小于预设分贝值，执行语音响应时间测试，所述语音响应时间测试包括以下至少之一：所述车内测试人员发出导航启动语音指令，根据所述导航启动语音指令的导航指令发出时间，以及所述车辆的导航设备调整到预设导航页面的页面调整时间确定导航响应时长；所述车内测试人员发出音乐切换语音指令，根据所述音乐切换语音指令的切换指令发出时间，以及所述车辆的音乐播放设备完成音乐切换的切换完成时间确定切换响应时长；
所述车内测试人员发出拨号语音指令，根据所述拨号语音指令的拨号指令发出时间，以及所述车辆的拨号设备调整为联系人选择界面或电话拨出界面的拨号完成时间确定拨号响应时长。5.如权利要求4所述的车载多模语音性能测试方法，其特征在于，执行语音响应时间测试之前，所述方法还包括以下至少之一：调整所述车辆的发动机处于怠速状态；调整所述车内音频设备状态为关闭；调整所述空调状态为关闭。6.如权利要求1-5任一项所述的车载多模语音性能测试方法，其特征在于，基于预设测试语音方案对各所述测试场景下所述车辆的车载多模语音性能进行测试之前，所述方法还包括：获取车辆的车机工作状态、摄像头工作状态、麦克风连接状态、所述车内测试人员的车内位置信息；若车机工作正常，麦克风连接正常，摄像头工作正常，以及车内测试人员位于主驾驶位置，基于预设测试语音方案对各所述测试场景下所述车辆的车载多模语音性能进行测试；若车机工作异常，麦克风连接异常，摄像头工作异常，以及车内测试人员位于非主驾驶位置中存在至少之一，提示车辆尚未处于车载多模语音性能测试状态。7.如权利要求1-5任一项所述的车载多模语音性能测试方法，其特征在于，所述人员特征信息包括所述车内测试人员的配饰穿戴信息、性别信息、语言信息中至少之一。8.一种车载多模语音性能测试装置，其特征在于，所述装置包括：获取模块，用于获取车辆的车辆所处场景信息、测试用语集和测试调整信息，所述测试调整信息包括光线信息、车窗状态、空调状态、车内音频设备状态、车速、网络状态、车内测试人员的人员特征信息中至少之一；方案确定模块，用于根据所述车辆所处场景信息确定所述测试调整信息的调整方案；测试模块，用于基于所述调整方案调整所述测试调整信息，得到多个测试场景，车内测试人员通过预设测试语音方案对各所述测试场景下所述车辆的车载多模语音系统的性能进行测试，得到测试结果。9.一种电子设备，其特征在于，所述电子设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述电子设备实现如权利要求1至7中任一项所述的车载多模语音性能测试方法。10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，当所述计算机程序被计算机的处理器执行时，使计算机执行权利要求1至7中任一项所述的车载多模语音性能测试方法。

技术总结

本申请提供一种车载多模语音性能测试方法、装置、设备及存储介质，该方法通过获取车辆的车辆所处场景信息、预设测试语音方案和测试调整信息，根据所述车辆所处场景信息确定所述测试调整信息的调整方案，基于所述调整方案调整所述测试调整信息，得到多个测试场景，车内测试人员通过预设测试语音方案对各所述测试场景下所述车辆的车载多模语音系统的性能进行测试，得到测试结果，考虑了多种人员特征信息、多种测试调整信息，测试的交互场景覆盖更为全面，测试结果更为可靠。测试结果更为可靠。测试结果更为可靠。