家电设备语音交互方法、装置、家电设备及存储介质与流程

1.本发明涉及家电技术领域，尤其涉及一种家电设备语音交互方法、装置、家电设备及存储介质。

背景技术：

2.在智能家电给人们带来便捷生活的同时，人们对智能家电的控制习惯逐渐发生改变，现在一般是采用语音交互的方式与智能家电进行交互。目前，智能家电进行语音交互所需的语音识别模型部署在云端服务器，在智能家电离线断网的情况下，无法正常使用智能家电的语音交互技术，因而，智能家电不能在离线断网的情况下进行语音交互，降低了智能家电的交互体验。

技术实现要素：

3.本发明提供一种家电设备语音交互方法、装置、家电设备及存储介质，用以解决现有技术中智能家电不能在离线断网的情况下进行语音交互的缺陷，提升了智能家电的语音交互体验。
4.本发明提供一种家电设备语音交互方法，包括：
5.获取待识别的语音信息，将所述待识别的语音信息输入至家电设备中的特征提取模型，以提取语音特征，以及将所述待识别的语音信息输入至所述家电设备的意图识别模型，以获取用户意图；
6.将所述语音特征以及所述用户意图与预设的特征模板进行匹配，确定命令词，以基于所述命令词控制所述家电设备。
7.根据本发明提供的家电设备语音交互方法，所述获取待识别的语音信息，包括：
8.获取输入的初始语音信息，对所述初始语音信息进行端点检测，以滤除所述初始语音信息的噪声，得到所述待识别的语音信息。
9.根据本发明提供的家电设备语音交互方法，所述对所述初始语音信息进行端点检测，以滤除所述初始语音信息的噪声，得到所述待识别的语音信息，包括：
10.将所述初始语音信息输入至所述家电设备中预设的声学模型，以对所述初始语音信息进行解析，得到所述全局信息，并对所述全局信息滤除噪声，得到所述待识别的语音信息。
11.根据本发明提供的家电设备语音交互方法，在将所述初始语音信息输入至所述家电设备中预设的声学模型之前，还包括：
12.接收云端服务器发送的声学模型。
13.根据本发明提供的家电设备语音交互方法，在将所述待识别的语音信息输入至家电设备中的特征提取模型，以及将所述待识别的语音信息输入至所述家电设备的意图识别模型之前，还包括：
14.接收云端服务器发送的特征提取模型以及意图识别模型。
15.根据本发明提供的家电设备语音交互方法，所述特征提取模型以及意图识别模型，均基于文法网络训练得到。
16.本发明还提供一种家电设备语音交互装置，包括：
17.识别模块，用于获取待识别的语音信息，将所述待识别的语音信息输入至家电设备中的特征提取模型，以提取语音特征，以及将所述待识别的语音信息输入至所述家电设备的意图识别模型，以获取用户意图；
18.命令确定模块，用于将所述语音特征以及所述用户意图与预设的特征模板进行匹配，确定命令词，以基于所述命令词控制所述家电设备。
19.本发明还提供一种家电设备，包括上述的家电设备语音交互装置。
20.本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述家电设备语音交互方法。
21.本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述家电设备语音交互方法。
22.本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述家电设备语音交互方法。
23.本发明提供的家电设备语音交互方法、装置、家电设备及存储介质，通过将待识别的语音信息输入至家电设备中的特征提取模型，以提取语音特征，以及将待识别的语音信息输入至家电设备的意图识别模型，以获取用户意图，在家电设备本地对语音进行识别，得到命令词，而不需要将待识别的语音信息的通过网络上传至云端服务器进行分析，因此，本发明提供的家电设备语音交互方法，可以解决现有技术中智能家电不能在离线断网的情况下进行语音交互的缺陷，提升了智能家电的语音交互体验。
附图说明
24.为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
25.图1是本发明提供的家电设备语音交互方法的流程示意图；
26.图2是本发明提供的家电设备语音交互装置的结构示意图；
27.图3是本发明提供的电子设备的结构示意图。
具体实施方式
28.为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
29.下面结合图1-图3描述本发明的家电设备语音交互方法、装置、家电设备及存储介质。
30.如图1所示，本发明提供一种家电设备语音交互方法，包括：
31.步骤110、获取待识别的语音信息，将所述待识别的语音信息输入至家电设备中的特征提取模型，以提取语音特征，以及将所述待识别的语音信息输入至所述家电设备的意图识别模型，以获取用户意图。
32.可以理解的是，本实施例中的家电设备可以是智能空调，特征提取模型以及意图识别模型在训练完成之后，均设置于家电设备中。
33.提取语音特征以及用户意图的过程，包括两大部分：模型训练和语音识别，模型训练的过程设置在云端服务器。
34.模型训练通常是对预先收集好的海量语音、语言数据库进行信号处理和知识挖掘，获取语音识别所需要的模型；而识别过程通常是对用户实时的语音进行自动识别。
35.进一步，家电设备上设置有话筒，话筒将接收的语音信息转换成电信号后，输送至家电设备内的处理器进行处理，电信号首先经过预处理，例如降噪处理，再根据上述的模型，对输入的电信号进行分析，并抽取语音特征和用户意图。
36.步骤120、将所述语音特征以及所述用户意图与预设的特征模板进行匹配，确定命令词，以基于所述命令词控制所述家电设备。
37.可以理解的是，在语音识别过程中，在提取语音特征和用户意图之后，将预设的特征模板与输入的语音特征和用户意图进行比较，根据设定的搜索和匹配策略，出与语音特征和用户意图匹配的特征模板。然后根据特征模板的定义，通过查表就可以确定识别结果，即确定语音中的命令词。
38.在一些实施例中，所述获取待识别的语音信息，包括：
39.获取输入的初始语音信息，对所述初始语音信息进行端点检测，以滤除所述初始语音信息的噪声，得到所述待识别的语音信息。
40.可以理解的是，语音识别过程通常又可以分为前端和后端两大模块：前端模块主要的作用是进行端点检测，以去除初始语音信息中多余的静音和非说话声、降噪、特征提取，得到待识别的语音信息；后端模块的作用是利用训练好模型对语音的特征向量进行统计模式识别，即解码，得到其包含的文字信息。
41.在一些实施例中，所述对所述初始语音信息进行端点检测，以滤除所述初始语音信息的噪声，得到所述待识别的语音信息，包括：
42.将所述初始语音信息输入至所述家电设备中预设的声学模型，以对所述初始语音信息进行解析，得到所述全局信息，并对所述全局信息滤除噪声，得到所述待识别的语音信息。
43.可以理解的是，声学模型，可以是基于长短期记忆网络(lstm，long short-term memory)训练得到的模型，该模型可以解决长序列训练过程中的梯度消失和梯度爆炸问题。
44.在一些实施例中，在将所述初始语音信息输入至所述家电设备中预设的声学模型之前，还包括：
45.接收云端服务器发送的声学模型。
46.可以理解的是，声学模型是在云端服务器训练完成之后，再下发至家电设备。声学模型是一种神经网络模型，在训练时，需要占用大量的内存空间，因此，在云端服务器训练完成之后，再下发至家电设备，可以降低家电设备的内存占用，降低家电设备的费用。
47.在一些实施例中，在将所述待识别的语音信息输入至家电设备中的特征提取模型，以及将所述待识别的语音信息输入至所述家电设备的意图识别模型之前，还包括：
48.接收云端服务器发送的特征提取模型以及意图识别模型。
49.可以理解的是，特征提取模型和意图识别模型是在云端服务器训练完成之后，再下发至家电设备。特征提取模型和意图识别模型是神经网络模型，在训练时，需要占用大量的内存空间，因此，在云端服务器训练完成之后，再下发至家电设备，可以降低家电设备的内存占用，降低家电设备的费用。
50.在一些实施例中，所述特征提取模型以及意图识别模型，均基于文法网络训练得到。
51.可以理解的是，家电设备中存储的离线语料在50条左右，基于多个文法网络分节输入语音，文法网络中包含具有设计成表示噪音或者外加语音的填充物模型的网络。特征提取模型和意图识别模型，识别处理得出多个候选语料表，每个候选语料表包含生成的多个最佳候选字，然后将候选语料表分开与有效语料集对准，以生成两个有效语料。最后，将这两个有效语料组合进动态文法中，并可用这一动态文法识别出最佳候选语料。
52.综上所述，本发明提供的家电设备语音交互方法，包括：获取待识别的语音信息，将所述待识别的语音信息输入至家电设备中的特征提取模型，以提取语音特征，以及将所述待识别的语音信息输入至所述家电设备的意图识别模型，以获取用户意图；将所述语音特征以及所述用户意图与预设的特征模板进行匹配，确定命令词，以基于所述命令词控制所述家电设备。
53.在本发明提供的家电设备语音交互方法中，通过将待识别的语音信息输入至家电设备中的特征提取模型，以提取语音特征，以及将待识别的语音信息输入至家电设备的意图识别模型，以获取用户意图，在家电设备本地对语音进行识别，得到命令词，而不需要将待识别的语音信息的通过网络上传至云端服务器进行分析，因此，本发明提供的家电设备语音交互方法，可以解决现有技术中智能家电不能在离线断网的情况下进行语音交互的缺陷，提升了智能家电的语音交互体验。
54.下面对本发明提供的家电设备语音交互装置进行描述，下文描述的家电设备语音交互装置与上文描述的家电设备语音交互方法可相互对应参照。
55.如图2所示，本发明提供的家电设备语音交互装置200，包括：识别模块210和命令确定模块220。
56.识别模块210用于获取待识别的语音信息，将所述待识别的语音信息输入至家电设备中的特征提取模型，以提取语音特征，以及将所述待识别的语音信息输入至所述家电设备的意图识别模型，以获取用户意图。
57.可以理解的是，本实施例中的家电设备可以是智能空调，特征提取模型以及意图识别模型在训练完成之后，均设置于家电设备中。
58.提取语音特征以及用户意图的过程，包括两大部分：模型训练和语音识别，模型训练的过程设置在云端服务器。
59.模型训练通常是对预先收集好的海量语音、语言数据库进行信号处理和知识挖掘，获取语音识别所需要的模型；而识别过程通常是对用户实时的语音进行自动识别。
60.进一步，家电设备上设置有话筒，话筒将接收的语音信息转换成电信号后，输送至
家电设备内的处理器进行处理，电信号首先经过预处理，例如降噪处理，再根据上述的模型，对输入的电信号进行分析，并抽取语音特征和用户意图。
61.命令确定模块220用于将所述语音特征以及所述用户意图与预设的特征模板进行匹配，确定命令词，以基于所述命令词控制所述家电设备。
62.可以理解的是，在语音识别过程中，在提取语音特征和用户意图之后，将预设的特征模板与输入的语音特征和用户意图进行比较，根据设定的搜索和匹配策略，出与语音特征和用户意图匹配的特征模板。然后根据特征模板的定义，通过查表就可以确定识别结果，即确定语音中的命令词。
63.在一些实施例中，识别模块210，包括：获取单元。
64.获取单元用于获取输入的初始语音信息，对所述初始语音信息进行端点检测，以滤除所述初始语音信息的噪声，得到所述待识别的语音信息。
65.可以理解的是，语音识别过程通常又可以分为前端和后端两大模块：前端模块主要的作用是进行端点检测，以去除初始语音信息中多余的静音和非说话声、降噪、特征提取，得到待识别的语音信息；后端模块的作用是利用训练好模型对语音的特征向量进行统计模式识别，即解码，得到其包含的文字信息。
66.在一些实施例中，获取单元进一步用于将所述初始语音信息输入至所述家电设备中预设的声学模型，以对所述初始语音信息进行解析，得到所述全局信息，并对所述全局信息滤除噪声，得到所述待识别的语音信息。
67.可以理解的是，声学模型，可以是基于长短期记忆网络训练得到的模型，该模型可以解决长序列训练过程中的梯度消失和梯度爆炸问题。
68.在一些实施例中，家电设备语音交互装置200，还包括：第一接收模块。
69.第一接收模块用于在将所述初始语音信息输入至所述家电设备中预设的声学模型之前，接收云端服务器发送的声学模型。
70.可以理解的是，声学模型是在云端服务器训练完成之后，再下发至家电设备。声学模型是一种神经网络模型，在训练时，需要占用大量的内存空间，因此，在云端服务器训练完成之后，再下发至家电设备，可以降低家电设备的内存占用，降低家电设备的费用。
71.在一些实施例中，家电设备语音交互装置200，还包括：第二接收模块。
72.第二接收模块用于在将所述待识别的语音信息输入至家电设备中的特征提取模型，以及将所述待识别的语音信息输入至所述家电设备的意图识别模型之前，接收云端服务器发送的特征提取模型以及意图识别模型。
73.可以理解的是，特征提取模型和意图识别模型是在云端服务器训练完成之后，再下发至家电设备。特征提取模型和意图识别模型是神经网络模型，在训练时，需要占用大量的内存空间，因此，在云端服务器训练完成之后，再下发至家电设备，可以降低家电设备的内存占用，降低家电设备的费用。
74.在一些实施例中，所述特征提取模型以及意图识别模型，均基于文法网络训练得到。
75.可以理解的是，家电设备中存储的离线语料在50条左右，基于多个文法网络分节输入语音，文法网络中包含具有设计成表示噪音或者外加语音的填充物模型的网络。特征提取模型和意图识别模型，识别处理得出多个候选语料表，每个候选语料表包含生成的多
个最佳候选字，然后将候选语料表分开与有效语料集对准，以生成两个有效语料。最后，将这两个有效语料组合进动态文法中，并可用这一动态文法识别出最佳候选语料。
76.本发明还提供一种家电设备，包括上述的家电设备语音交互装置，还家电设备可以是空调。
77.下面对本发明提供的电子设备、计算机程序产品及存储介质进行描述，下文描述的电子设备、计算机程序产品及存储介质与上文描述的家电设备语音交互方法可相互对应参照。
78.图3示例了一种电子设备的实体结构示意图，如图3所示，该电子设备可以包括：处理器(processor)310、通信接口(communications interface)320、存储器(memory)330和通信总线340，其中，处理器310，通信接口320，存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令，以执行家电设备语音交互方法，该方法包括：
79.获取待识别的语音信息，将所述待识别的语音信息输入至家电设备中的特征提取模型，以提取语音特征，以及将所述待识别的语音信息输入至所述家电设备的意图识别模型，以获取用户意图；
80.将所述语音特征以及所述用户意图与预设的特征模板进行匹配，确定命令词，以基于所述命令词控制所述家电设备。
81.此外，上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
82.另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的家电设备语音交互方法，该方法包括
83.获取待识别的语音信息，将所述待识别的语音信息输入至家电设备中的特征提取模型，以提取语音特征，以及将所述待识别的语音信息输入至所述家电设备的意图识别模型，以获取用户意图；
84.将所述语音特征以及所述用户意图与预设的特征模板进行匹配，确定命令词，以基于所述命令词控制所述家电设备。
85.又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的家电设备语音交互方法，该方法包括：
86.获取待识别的语音信息，将所述待识别的语音信息输入至家电设备中的特征提取模型，以提取语音特征，以及将所述待识别的语音信息输入至所述家电设备的意图识别模型，以获取用户意图；
87.将所述语音特征以及所述用户意图与预设的特征模板进行匹配，确定命令词，以基于所述命令词控制所述家电设备。
88.以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。
89.通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
90.最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术特征：

1.一种家电设备语音交互方法，其特征在于，包括：获取待识别的语音信息，将所述待识别的语音信息输入至家电设备中的特征提取模型，以提取语音特征，以及将所述待识别的语音信息输入至所述家电设备的意图识别模型，以获取用户意图；将所述语音特征以及所述用户意图与预设的特征模板进行匹配，确定命令词，以基于所述命令词控制所述家电设备。2.根据权利要求1所述的家电设备语音交互方法，其特征在于，所述获取待识别的语音信息，包括：获取输入的初始语音信息，对所述初始语音信息进行端点检测，以滤除所述初始语音信息的噪声，得到所述待识别的语音信息。3.根据权利要求2所述的家电设备语音交互方法，其特征在于，所述对所述初始语音信息进行端点检测，以滤除所述初始语音信息的噪声，得到所述待识别的语音信息，包括：将所述初始语音信息输入至所述家电设备中预设的声学模型，以对所述初始语音信息进行解析，得到所述全局信息，并对所述全局信息滤除噪声，得到所述待识别的语音信息。4.根据权利要求3所述的家电设备语音交互方法，其特征在于，在将所述初始语音信息输入至所述家电设备中预设的声学模型之前，还包括：接收云端服务器发送的声学模型。5.根据权利要求1所述的家电设备语音交互方法，其特征在于，在将所述待识别的语音信息输入至家电设备中的特征提取模型，以及将所述待识别的语音信息输入至所述家电设备的意图识别模型之前，还包括：接收云端服务器发送的特征提取模型以及意图识别模型。6.根据权利要求1-5任一项所述的家电设备语音交互方法，其特征在于，所述特征提取模型以及意图识别模型，均基于文法网络训练得到。7.一种家电设备语音交互装置，其特征在于，包括：识别模块，用于获取待识别的语音信息，将所述待识别的语音信息输入至家电设备中的特征提取模型，以提取语音特征，以及将所述待识别的语音信息输入至所述家电设备的意图识别模型，以获取用户意图；命令确定模块，用于将所述语音特征以及所述用户意图与预设的特征模板进行匹配，确定命令词，以基于所述命令词控制所述家电设备。8.一种家电设备，其特征在于，包括权利要求7所述的家电设备语音交互装置。9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述家电设备语音交互方法。10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述家电设备语音交互方法。

技术总结

本发明提供一种家电设备语音交互方法、装置、家电设备及存储介质，家电设备语音交互方法，包括：获取待识别的语音信息，将所述待识别的语音信息输入至家电设备中的特征提取模型，以提取语音特征，以及将所述待识别的语音信息输入至所述家电设备的意图识别模型，以获取用户意图；将所述语音特征以及所述用户意图与预设的特征模板进行匹配，确定命令词，以基于所述命令词控制所述家电设备。本发明通过将待识别的语音信息输入至家电设备中的特征提取模型，以提取语音特征，而不需要将待识别的语音信息的通过网络上传至云端服务器进行分析，因此，本发明可以解决智能家电不能在离线断网的情况下进行语音交互的缺陷。情况下进行语音交互的缺陷。情况下进行语音交互的缺陷。