基于声纹识别设置车辆使用权限的系统、方法、介质及车载终端与流程

1.本发明涉及车载智能语音识别技术，具体涉及一种基于声纹识别设置车辆使用权限的系统、方法、介质及车载终端。

背景技术：

2.随着汽车技术的不断发展，智能化控制场景越来越丰富。语音控制作为目前常规的智能控制方式，存在一定的局限性。用户在车内或车外通过声音控制车辆时，若周围有其他人也在说话，会被车辆的语音识别系统一起采集、识别、执行，这并不是用户想要的体验。此外，通过车外语音识别系统控制车辆时，可能会存在一定的风险甚至是危险，这就更需要清晰准确的检测到控制指令是由已授权用户所下，如果识别到是周围其他人声的指令，就不能去执行，尤其是可能会存在一定的风险甚至是危险的动作。如通过语音控制泊车，因为下达语音泊车的指令后，车辆会前后移动，如果没有谨慎确认周围环境，可能会与周围的车辆发生剐蹭，甚至撞到行人，因此需要对语音指令的使用权限做出限定，不能是谁都可以下达这种有一定风险的指令。再比如，语音启动发动机、启动空调，这些指令都可以将发动机发动起来，如果有人在检查或维修发动机舱，这时语音识别系统检测到周围有人下发这些指令，它就会启动发动机，这就很有可能会酿成比较严重的事故。此外，语音控制后背门开闭、天窗开闭、车窗开闭等都可能存在类似的问题。

技术实现要素：

3.本发明的目的是提供一种基于声纹识别设置车辆使用权限的系统、方法、介质及车载终端，其能够有效判断语音指令是否由目标用户发出，从而提升车辆安全性。
4.为了实现上述目的，本发明采用的技术方案如下：一种基于声纹识别设置车辆使用权限的系统，其包括：声纹录入组件，用于获取目标用户的声纹数据并形成声纹密钥，该声纹密钥存储于声纹识别模块；声纹识别组件，用于提取采集的车外语音或车内语音的声纹特征并与预先存储的声纹密钥进行对比，以进行声纹配对；语音识别组件，用于对采集的车外语音或车内语音进行语义识别，得到动作执行指令，并基于声纹识别模块的输出结果判断是否执行动作；执行机构，用于执行所述语音识别模块的动作执行指令包含的执行动作。
5.进一步，所述声纹录入模块包括：指导信息生成模块，被配置为根据朗读文本、以及用于引导用户采用预设声音属性说出所述朗读文本的流程文本，生成指导信息；朗读语音获取模块，被配置为在所述指导信息被输出给用户后，获取用户的朗读语音；
朗读语音解析模块，被配置为确定所述朗读语音的声音属性、以及识别所述朗读语音对应的文字内容；可用性确定模块，被配置为在所述朗读语音的声音属性为所述预设的声音属性、所述朗读语音对应的文字内容与所述朗读文本匹配的情况下，确定所述朗读语音可用；云端服务器，被配置为接收可用朗读语音，并对可用朗读语音的声纹特征进行分析和提取，形成声纹密钥。
6.进一步，所述声纹识别组件包括：车内语音采集模块，被配置为采集车内语音；车外语音采集模块，被配置为采集车外语音；声纹分析、配对模块，被配置为提取采集的车外语音或车内语音的声纹特征并与预先存储的声纹密钥进行对比，以进行声纹配对。
7.进一步，所述语音识别组件包括：车内语音采集模块，被配置为采集车内语音；车外语音采集模块，被配置为采集车外语音；语义识别模块，被配置为对采集的车外语音或车内语音进行语义识别，得到动作执行指令；声纹识别开关状态检测模块，被配置为检测声纹识别开关状态。
8.一种基于声纹识别设置车辆使用权限的方法，其包括如下步骤：s1，通过声纹录入组件获取目标用户的声纹数据并形成声纹密钥，将声纹密钥预先存储于声纹识别组件中；s2，采集车内语音音频或车外语音音频；s3，将车内或车外采集的语音音频分别传递给声纹识别组件和语音识别组件，声纹识别组件对获取的车内或车外语音音频进行声纹特征提取并与预先存储的声纹密钥进行对比，以进行声纹配对；所述语音识别组件对采集的车内或车外语音进行语义识别并判断所述车内或车外语音是否为控制命令语音信号，在声纹配对成功且车内或车外语音是否为控制命令语音信号时，得到动作执行指令，通过执行机构执行所述语音识别模块的动作执行指令包含的执行动作；进一步，s2中采集车外语音音频时，通过域控制器检测智能钥匙位置，若检测到智能钥匙且判定智能钥匙位于车外时，将车外采集的语音音频分别传递给声纹识别组件和语音识别组件，否则终止流程。
9.进一步，s3中所述语音识别组件对采集的车内或车外语音进行语义识别并判断所述车内或车外语音为控制命令语音信号后，判断该控制命令语音信号是否需要用户授权，若是，则结合声纹配对结果判断是否执行，若否，则将控制命令语音信号发送至执行机构。
10.一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明所述的基于声纹识别设置车辆使用权限的方法。
11.一种车载终端，包括：处理器及存储器；所述存储器用于存储计算机程序；所述处理器用于执行所述存储器存储的计算机程序，以使所述车载终端执行本发明所述的基于声纹识别设置车辆使用权限的方法。
12.本发明的有益效果：
1、本发明所述基于声纹识别设置车辆使用权限的系统，使用简单方便，用户不需要做额外的操作或佩戴额外的设备，就能实现对使用权限的甄别。用户只需要通过声纹录入组件将自己的声音录入到系统，系统会自动将音频文件上传到云端服务器，云端服务器会自动对音频进行声纹特征的提取并生成声纹密钥，然后将声纹密钥反馈回声纹录入子系统并传递存储于声纹识别组件中。用户只需要按照语音提示和屏幕的显示，完成录音这一步，剩下的整个过程，全部是自动进行，用户使用起来非常简单、流畅。
13.2、本发明所述基于声纹识别设置车辆使用权限的系统，工程师能够根据实际需要，设置具体需要判断用户权限的指令，车内或车外采集到的语音音频会同时发送给声纹识别组件和语音识别组件，声纹识别组件会对音频进行声纹识别，同时语音识别组件会对语音音频指令进行分析。当声纹识别组件计算出声纹匹配结果后，会反馈至语音识别组件。语音识别组件分析出语义指令后，会根据根据工程师的设计要求先判断该语义指令是否需要判断用户权限，如果不需要判断用户权限，则语音识别组件直接下发语义指令；如果需要判断用户权限，则需要结合声纹识别组件反馈的声纹匹配结果，当声纹匹配成功时下发语义指令，当声纹匹配失败时不下发语义指令。
14.3、本发明所述基于声纹识别设置车辆使用权限的系统的声纹识别功能的正确率高，采用声纹识别技术的核心目的就是要能够正确识别出，哪些声音指令是已授权用户下达的，只有已授权用户下达的指令才能去执行。声纹识别技术来能够用来辨别用户是否为已授权用户的前提条件就是声纹识别功能的正确率很高，当前已经达到90%以上；而且随着技术水平的提升，声纹识别功能的正确率也会逐渐得到提升。
附图说明
15.图1是本发明所述基于声纹识别设置车辆使用权限的系统示意图；图2是本发明声纹录入流程示意图；图3是本发明车外语音场景声纹识别流程示意图；图4是本发明车内语音场景声纹识别流程示意图。
具体实施方式
16.以下将参照附图和优选实施例来说明本发明的实施方式，本领域技术人员可由本说明书中所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。应当理解，优选实施例仅为了说明本发明，而不是为了限制本发明的保护范围。
17.需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。
18.参见图1，所示的基于声纹识别设置车辆使用权限的系统，其包括：声纹录入组件，用于获取目标用户的声纹数据并形成声纹密钥，该声纹密钥存储于声纹识别模块；声纹识别组件，用于提取采集的车外语音或车内语音的声纹特征并与预先存储的声纹密钥进行对
比，以进行声纹配对；语音识别组件，用于对采集的车外语音或车内语音进行语义识别，得到动作执行指令，并基于声纹识别模块的输出结果判断是否执行动作；执行机构，用于执行所述语音识别模块的动作执行指令包含的执行动作。所述声纹录入组件、声纹识别组件和语音识别组件均与车机连接。
19.所述声纹录入模块包括：指导信息生成模块，被配置为根据朗读文本、以及用于引导用户采用预设声音属性说出所述朗读文本的流程文本，生成指导信息；朗读语音获取模块，被配置为在所述指导信息被输出给用户后，获取用户的朗读语音；朗读语音解析模块，被配置为确定所述朗读语音的声音属性、以及识别所述朗读语音对应的文字内容；可用性确定模块，被配置为在所述朗读语音的声音属性为所述预设的声音属性、所述朗读语音对应的文字内容与所述朗读文本匹配的情况下，确定所述朗读语音可用；云端服务器，被配置为接收可用朗读语音，并对可用朗读语音的声纹特征进行分析和提取，形成声纹密钥。
20.所述指导信息生成模块包括声纹录入界面、车内扬声器和屏幕，所述声纹录入界面为车机屏幕或手机控车app，所述车内扬声器用于播放朗读文本即提示语的提示音，所述屏幕用于显示朗读文本即提示语的文字。
21.所述声纹识别组件包括：车内语音采集模块即车内麦克风，被配置为采集车内语音；车外语音采集模块即车外麦克风，被配置为采集车外语音；声纹分析、配对模块，被配置为提取采集的车外语音或车内语音的声纹特征并与预先存储的声纹密钥进行对比，以进行声纹配对。
22.所述语音识别组件包括：车内语音采集模块即声纹识别组件的车内麦克风，被配置为采集车内语音；车外语音采集模块即声纹识别组件的车外麦克风，被配置为采集车外语音；语义识别模块，被配置为对采集的车外语音或车内语音进行语义识别，得到动作执行指令；声纹识别开关状态检测模块，被配置为检测声纹识别开关状态。
23.一种基于声纹识别设置车辆使用权限的方法，其包括如下步骤：s1，通过声纹录入组件获取目标用户的声纹数据并形成声纹密钥，将声纹密钥预先存储于声纹识别组件中。具体地，参见图2，目标用户由车机的屏幕或通过手机控车app进入指导信息生成模块的声纹录入界面，声纹录入界面显示提前定制好的文案，即朗读文本。语音助手或屏幕会提示“请在安静环境下按照文案进行朗读”，然后声纹录入模块自动打开车内麦克风或手机麦克风，开始采集目标用户的朗读声音。
24.目标用户按照屏幕显示的“朗读文本”进行朗读，声纹录入模块通过朗读语音获取模块即麦克风获取用户的朗读语音。声纹录入模块对朗读语音音频的质量是否满足声纹提取要求进行分析，先通过朗读语音解析模块确定所述朗读语音的声音属性、以及识别所述朗读语音对应的文字内容，在所述朗读语音的声音属性为所述预设的声音属性、所述朗读语音对应的文字内容与所述朗读文本匹配的情况下，由可用性确定模块确定所述朗读语音是否可用，如果可用，将朗读语音音频文件保存在车机本地；如果不满足要求，声纹录入界面会显示另外一条朗读文本，然后提示用户继续按照朗读文本进行朗读。
25.声纹录入完成后，声纹录入模块将采集到的满足要求的朗读语音音频文件通过车机网络发送到云端服务器，由云端服务器对音频文件的声纹特征进行分析和提取，形成声纹密钥。然后再通过车机网络，发给声纹录入模块，再由声纹录入模块传给声纹识别模块进行存储。
26.s2，声纹识别的场景分为车外语音场景和车内语音场景，采集车内语音音频或车外语音音频；s3，当声纹识别的场景为车外语音场景时，即用户带着智能钥匙在车外使用语音功能时，域控制器先检测智能钥匙是否在设定范围内，若否则终止流程，若是则判断智能钥匙在车内还是车外。当检测到智能钥匙在车内时，终止流程，当检测到智能钥匙在车外时，车外语音系统开始工作。
27.将车外采集的语音音频分别传递给声纹识别组件和语音识别组件，声纹识别组件对获取的车外语音音频进行声纹特征提取并与预先存储的声纹密钥进行对比，以进行声纹配对，得到配对结果，即配对成功或配对失败。所述语音识别组件对采集的车外语音进行语义识别并判断所述车外语音是否为控制命令语音信号，在车外语音是否为控制命令语音信号时，判断该控制命令语音信号是否需要用户授权，若是，则执行下一步，若否，则将控制命令语音信号发送至执行机构。然后判断声纹识别开关状态，若处于关闭状态，则将控制命令语音信号发送至执行机构，不会去判断声纹识别的结果。若处于打开状态，则结合声纹配对结果判断是否执行。当声纹配对结果为配对失败时，则终止流程，不执行用户的语音指令。当声纹配对结果为配对成功时，则将控制命令语音信号发送至执行机构，执行用户的语音指令，即语音识别组件将车外采集的语音音频转化成的代码指令发动给车机的mcu，车机的mcu把指令发送至执行方案计算控制器，执行方案计算控制器结合传感器反馈的信息及自身控制逻辑计算出执行方案，然后控制执行机构执行所述语音识别模块的动作执行指令包含的执行动作。
28.当声纹识别的场景为车内语音场景时，只有当车机处于开机状态时，声纹识别和语音识别功能才会启用。车内语音使用时不会去检测智能钥匙，也不会去判断智能钥匙的位置。当有人在车内说话时，系统会将车内麦克风采集的音频分别发送给声纹识别组件和语音识别子组件，接下来的流程和车外语音场景相同。
29.一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明所述的基于声纹识别设置车辆使用权限的方法。
30.一种车载终端，包括：处理器及存储器；所述存储器用于存储计算机程序；所述处理器用于执行所述存储器存储的计算机程序，以使所述车载终端执行本发明所述的基于声纹识别设置车辆使用权限的方法。
31.本发明所述基于声纹识别设置车辆使用权限的系统，使用简单方便，用户不需要做额外的操作或佩戴额外的设备，就能实现对使用权限的甄别。用户只需要通过声纹录入组件将自己的声音录入到系统，系统会自动将音频文件上传到云端服务器，云端服务器会自动对音频进行声纹特征的提取并生成声纹密钥，然后将声纹密钥反馈回声纹录入子系统并传递存储于声纹识别组件中。用户只需要按照语音提示和屏幕的显示，完成录音这一步，剩下的整个过程，全部是自动进行，用户使用起来非常简单、流畅。
32.本发明所述基于声纹识别设置车辆使用权限的系统，工程师能够根据实际需要，设置具体需要判断用户权限的指令，车内或车外采集到的语音音频会同时发送给声纹识别组件和语音识别组件，声纹识别组件会对音频进行声纹识别，同时语音识别组件会对语音音频指令进行分析。当声纹识别组件计算出声纹匹配结果后，会反馈至语音识别组件。语音识别组件分析出语义指令后，会根据根据工程师的设计要求先判断该语义指令是否需要判
断用户权限，如果不需要判断用户权限，则语音识别组件直接下发语义指令；如果需要判断用户权限，则需要结合声纹识别组件反馈的声纹匹配结果，当声纹匹配成功时下发语义指令，当声纹匹配失败时不下发语义指令。该技术路线的应用有实际意义，例如当用户带着智能钥匙在车外时，如果车外麦克风采集到“我要泊车”的语音指令后，就需要进行声纹识别，检测该声音指令是否由已授权的用户下达的。因为执行泊车指令，车会移动，存在一定的安全风险。再例如，当用户在车内说“我要听歌”，车内麦克风采集到语音指令后，语音识别子系统分析出该语音指令后，就可以直接下发该指令，就不需要进行声纹识别哦是否由已授权的用户下达的。这是因为播放音乐不存在安全风险。工程师可以根据实际需要，来决定哪些指令需要判断用户权限，哪些指令不需要判断用户权限。
33.本发明所述基于声纹识别设置车辆使用权限的系统的声纹识别功能的正确率高，采用声纹识别技术的核心目的就是要能够正确识别出，哪些声音指令是已授权用户下达的，只有已授权用户下达的指令才能去执行。声纹识别技术来能够用来辨别用户是否为已授权用户的前提条件就是声纹识别功能的正确率很高，当前已经达到90%以上；而且随着技术水平的提升，声纹识别功能的正确率也会逐渐得到提升。
34.以上实施例仅是为充分说明本发明而所举的较佳的实施例，本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换，均在本发明的保护范围之内。

技术特征：

1.一种基于声纹识别设置车辆使用权限的系统，其特征在于，包括：声纹录入组件，用于获取目标用户的声纹数据并形成声纹密钥，该声纹密钥存储于声纹识别模块；声纹识别组件，用于提取采集的车外语音或车内语音的声纹特征并与预先存储的声纹密钥进行对比，以进行声纹配对；语音识别组件，用于对采集的车外语音或车内语音进行语义识别，得到动作执行指令，并基于声纹识别模块的输出结果判断是否执行动作；执行机构，用于执行所述语音识别模块的动作执行指令包含的执行动作。2.根据权利要求1所述的基于声纹识别设置车辆使用权限的系统，其特征在于，所述声纹录入模块包括：指导信息生成模块，被配置为根据朗读文本、以及用于引导用户采用预设声音属性说出所述朗读文本的流程文本，生成指导信息；朗读语音获取模块，被配置为在所述指导信息被输出给用户后，获取用户的朗读语音；朗读语音解析模块，被配置为确定所述朗读语音的声音属性、以及识别所述朗读语音对应的文字内容；可用性确定模块，被配置为在所述朗读语音的声音属性为所述预设的声音属性、所述朗读语音对应的文字内容与所述朗读文本匹配的情况下，确定所述朗读语音可用；云端服务器，被配置为接收可用朗读语音，并对可用朗读语音的声纹特征进行分析和提取，形成声纹密钥。3.根据权利要求1或2所述的基于声纹识别设置车辆使用权限的系统，其特征在于，所述声纹识别组件包括：车内语音采集模块，被配置为采集车内语音；车外语音采集模块，被配置为采集车外语音；声纹分析、配对模块，被配置为提取采集的车外语音或车内语音的声纹特征并与预先存储的声纹密钥进行对比，以进行声纹配对。4.根据权利要求1或2所述的基于声纹识别设置车辆使用权限的系统，其特征在于，所述语音识别组件包括：车内语音采集模块，被配置为采集车内语音；车外语音采集模块，被配置为采集车外语音；语义识别模块，被配置为对采集的车外语音或车内语音进行语义识别，得到动作执行指令；声纹识别开关状态检测模块，被配置为检测声纹识别开关状态。5.一种基于声纹识别设置车辆使用权限的方法，其特征在于，包括如下步骤：s1，通过声纹录入组件获取目标用户的声纹数据并形成声纹密钥，将声纹密钥预先存储于声纹识别组件中；s2，采集车内语音音频或车外语音音频；s3，将车内或车外采集的语音音频分别传递给声纹识别组件和语音识别组件，声纹识别组件对获取的车内或车外语音音频进行声纹特征提取并与预先存储的声纹密钥进行对比，以进行声纹配对；所述语音识别组件对采集的车内或车外语音进行语义识别并判断所
述车内或车外语音是否为控制命令语音信号，在声纹配对成功且车内或车外语音是否为控制命令语音信号时，得到动作执行指令，通过执行机构执行所述语音识别模块的动作执行指令包含的执行动作。6.根据权利要求5所述的基于声纹识别设置车辆使用权限的方法，其特征在于：s2中采集车外语音音频时，通过域控制器检测智能钥匙位置，若检测到智能钥匙且判定智能钥匙位于车外时，将车外采集的语音音频分别传递给声纹识别组件和语音识别组件，否则终止流程。7.根据权利要求5所述的基于声纹识别设置车辆使用权限的方法，其特征在于：s3中所述语音识别组件对采集的车内或车外语音进行语义识别并判断所述车内或车外语音为控制命令语音信号后，判断该控制命令语音信号是否需要用户授权，若是，则结合声纹配对结果判断是否执行，若否，则将控制命令语音信号发送至执行机构。8.一种存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求5~7任一项所述的基于声纹识别设置车辆使用权限的方法。9.一种车载终端，其特征在于，包括：处理器及存储器；所述存储器用于存储计算机程序；所述处理器用于执行所述存储器存储的计算机程序，以使所述车载终端执行权利要求5~7任一项所述的基于声纹识别设置车辆使用权限的方法。

技术总结

本发明公开了一种基于声纹识别设置车辆使用权限的系统、方法、介质及车载终端，其包括：声纹录入组件，用于获取目标用户的声纹数据并形成声纹密钥，该声纹密钥存储于声纹识别模块；声纹识别组件，用于提取采集的车外语音或车内语音的声纹特征并与预先存储的声纹密钥进行对比，以进行声纹配对；语音识别组件，用于对采集的车外语音或车内语音进行语义识别，得到动作执行指令，并基于声纹识别模块的输出结果判断是否执行动作；执行机构，用于执行所述语音识别模块的动作执行指令包含的执行动作。其能够有效判断语音指令是否由目标用户发出，从而提升车辆安全性。从而提升车辆安全性。从而提升车辆安全性。