用于语音控制的方法、存储介质和语音控制器与流程

1.本技术涉及数据存储和离线语音技术领域，例如涉及一种用于语音控制的方法、存储介质和语音控制器。

背景技术：

2.目前，对于语音控制器而言，通常安装与智能家居或全屋智能控制领域，会有在线和离线两种状态。当网络信号不好或无网络时，会切换成离线状态。但离线状态下，通过存储在本地存储单元的命令词是有限的，如果用户说的命令词本地存储单元中没有，或者是有所偏差，控制器就无法识别出用户的命令。导致离线状态下的识别率低，用户体验较差。
3.相关技术中，针对上述问题，提出了一种语音控制的方法。方法包括：获取用户对被控设备的操作信息；根据操作信息，更新语音控制的指令集；将语音控制的指令集发送给离线智能语音控制器，以使离线智能语音控制器在离线状态下根据语音控制的指令集控制被控设备。
4.但相关技术的问题在于，通过语音使用频次来对离线语音指令集进行动态更新，从而解决存储空间不足的问题，并没有解决离线状态下识别率低、用户体验较差的问题。

技术实现要素：

5.为了对披露的实施例的一些方面有基本的理解，下面给出了简单的概括。所述概括不是泛泛评述，也不是要确定关键/重要组成元素或描绘这些实施例的保护范围，而是作为后面的详细说明的序言。
6.本公开实施例提供了一种用于语音控制的方法、存储介质和语音控制器，能够提高离线状态下的语音识别率，提高了用户体验。
7.在一些实施例中，所述用于语音控制的方法，包括：根据用户语音，获取命令词；
8.在指令库中查命令词对应的操作指令；其中，所述指令库包括预存在第一存储区的初始命令词及各所述初始命令词对应的操作指令；
9.在未查到命令词对应的操作指令的情况下，通过网络设备获得命令词对应的操作指令；
10.将命令词及命令词对应的操作指令关联存储于所述指令库的第二存储区。
11.在上述技术方案中，所述将命令词及命令词对应的操作指令关联存储于所述指令库的第二存储区，包括：
12.建立命令词及对应的操作指令之间的关联关系；
13.将已建立关联关系的命令词与该命令词对应的操作指令，存储于所述指令库的第二存储区。
14.在上述技术方案中，所述根据用户语音，获取命令词，包括：
15.获取用户语音；
16.对所述用户语音进行解析，获得所述用户语音中的命令词。
17.在上述技术方案中，所述通过网络设备获得命令词对应的操作指令，包括：
18.将命令词上传至网络设备；
19.接收来自网络设备反馈的命令词对应的操作指令。
20.在上述任一技术方案中，用于语音控制的方法还包括：
21.记录所述指令库中命令词被执行的频次和各命令词的存入时间；
22.根据命令词被执行的频次，向所述第一存储区或所述第二存储区添加新命令词及对应操作指令。
23.在上述技术方案中，向所述第一存储区添加新命令词及对应操作指令，包括：
24.在所述第一存储区需要添加新命令词及对应操作指令的情况下，向用户展示所述第一存储区中各命令词的执行频次；
25.响应于用户指令，对所述第一存储区添加或删除命令词。
26.在上述技术方案中，向所述第二存储区添加新命令词及对应操作指令，包括：
27.在所述第二存储区命令词存储数量已达上限且需要新增的情况下，删除所述第二存储区中被执行频次最低的命令词及对应操作指令。
28.在上述技术方案中，在被执行频次最低的命令词存在多个的情况下，删除被执行频次最低的命令词中存入时间最早的命令词及对应操作指令。
29.在一些实施例中，语音控制器包括：处理单元和存储单元。
30.所述存储单元包括第一存储区和第二存储区；其中，所述第一存储区用于存储预存的初始命令词及各所述初始命令词对应的操作指令；所述第二存储区用于存储扩展的命令词及命令词对应的操作指令；
31.处理单元，被配置为执行如上述任一项技术方案所述的用于语音控制的方法。
32.本公开实施例提供的用于语音控制的方法、存储介质和语音控制器，可以实现以下技术效果：
33.本公开实施例涉及数据存储和离线语音技术领域，提供了一种用于语音控制的方法。通过将学习到的命令词和对应的操作指令建立关联关系并保存在第二存储区，而这些学习到的命令词大多都是用户常用或习惯性说的命令词，从而使得即便在离线状态下用户说出这些命令词也可以控制对应的设备。进而相较于只有一个存储单元而没有学习扩展功能的语音控制器，大大提高了离线状态下的语音识别率，且提高了用户体验。
34.以上的总体描述和下文中的描述仅是示例性和解释性的，不用于限制本技术。
附图说明
35.一个或多个实施例通过与之对应的附图进行示例性说明，这些示例性说明和附图并不构成对实施例的限定，附图中具有相同参考数字标号的元件示为类似的元件，附图不构成比例限制，并且其中：
36.图1是本公开实施例提供的一种用于语音控制的方法的示意图；
37.图2是本公开实施例提供的另一种用于语音控制的方法的示意图；
38.图3是本公开实施例提供的另一种用于语音控制的方法的示意图；
39.图4是本公开实施例提供的另一种用于语音控制的方法的示意图；
40.图5是本公开实施例提供的另一种用于语音控制的方法的示意图；
41.图6是本公开实施例提供的一种语音控制器的结构示意图。
具体实施方式
42.为了能够更加详尽地了解本公开实施例的特点与技术内容，下面结合附图对本公开实施例的实现进行详细阐述，所附附图仅供参考说明之用，并非用来限定本公开实施例。在以下的技术描述中，为方便解释起见，通过多个细节以提供对所披露实施例的充分理解。然而，在没有这些细节的情况下，一个或多个实施例仍然可以实施。在其它情况下，为简化附图，熟知的结构和装置可以简化展示。
43.本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开实施例的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含。
44.除非另有说明，术语“多个”表示两个或两个以上。
45.本公开实施例中，字符“/”表示前后对象是一种“或”的关系。例如，a/b表示：a或b。
46.术语“和/或”是一种描述对象的关联关系，表示可以存在三种关系。例如，a和/或b，表示：a或b，或，a和b这三种关系。
47.术语“对应”可以指的是一种关联关系或绑定关系，a与b相对应指的是a与b之间是一种关联关系或绑定关系。
48.目前而言，对于语音控制器的存储单元，由于其存储容量有限，只能存储有限的语音指令。尤其是在离线状态下，无法通过网络去寻求帮助，一旦用户说出的命令词在本地存储单元中没有，那就无法进行下一步操作，导致离线识别率很低，用户体验差。
49.基于此，本技术实施例提供了一种语音控制器，如图6所示。语音控制器包括处理单元(processor)600和存储单元(memory)601。其中，存储单元601包括第一存储区和第二存储区。第一存储区用于存储预存的初始命令词及各初始命令词对应的操作指令；第二存储区用于存储扩展的命令词及命令词对应的操作指令。可选地，该语音控制器还可以包括通信接口(communication interface)602和总线603。其中，处理单元600、存储单元601、通信接口602可以通过总线603完成相互间的通信。通信接口602可以用于信息传输。处理单元600可以调用存储单元601中的逻辑指令，以执行用于语音控制的方法。
50.下面结合图1对本技术实施例提供一种用于语音控制的方法进行说明。用于语音控制的方法包括：
51.s101，处理单元根据用户语音，获取命令词。
52.s102，处理单元在指令库中查命令词对应的操作指令。
53.其中，指令库包括预存在第一存储区的初始命令词及各初始命令词对应的操作指令。
54.s103，在未查到命令词对应的操作指令的情况下，处理单元通过网络设备获得命令词对应的操作指令。
55.s104，处理单元将命令词及命令词对应的操作指令关联存储于指令库的第二存储区。
56.在本技术实施例中，提供了一种于语音控制的方法。首先语音控制器的处理单元
根据用户的语音，获取用户语音中的命令词。进而在存储单元的指令库，也即是第一存储区和第二存储区中查是否有对应的命令词和操作指令。如果没有查到命令词，则处理单元将该命令词上传至网络，寻对应的操作指令。最后获得操作指令后，将该命令词和操作指令建立关联关系并存储在第二存储区中。其中，第一存储区是用于存储初始命令词及各初始命令词对应的操作指令。也就是说，可以在出厂前，向第一存储区中写入固定的常用命令词，甚至是多种表达方式。本技术通过将学习到的命令词和对应的操作指令建立关联关系并保存在第二存储区，而这些学习到的命令词大多都是用户常用或习惯性说的命令词，从而使得即便在离线状态下用户说出这些命令词也可以控制对应的设备。进而相较于只有一个存储单元而没有学习扩展功能的语音控制器，大大提高了离线状态下的语音识别率，且提高了用户体验。
57.在该实施例中，将命令词及命令词对应的操作指令关联存储于指令库的第二存储区，包括：处理单元建立命令词及对应的操作指令之间的关联关系，并将已建立关联关系的命令词与该命令词对应的操作指令，存储于指令库的第二存储区。通过将学习到的命令词和对应的操作指令建立关联关系并保存在第二存储区，而这些学习到的命令词大多都是用户常用或习惯性说的命令词，从而使得即便在离线状态下用户说出这些命令词也可以控制对应的设备。从而增加了离线状态下的识别率。
58.在该实施例中，根据用户语音获取命令词包括处理单元先获取用户语音。进而对用户语音进行解析，获得用户语音中的命令词。对用户语音进行解析，可以识别用户表达的多种形式。例如中文、英文、日语等。语音不同，但对应的操作指令是一致的。因此对应地，可以对于一个命令词存储不同的表达形式。从而进一步提高语音识别的准确性。
59.在该实施例中，通过网络设备获得命令词对应的操作指令，包括：处理单元将命令词上传至网络设备，接收来自网络设备反馈的命令词对应的操作指令。在没有查到命令词时，通过在网络上搜索的方式获得命令词的操作指令。
60.结合上述方案，如图2所示，提供了另一种用于语音控制的方法。包括：
61.s201，处理单元获取用户语音。
62.s202，处理单元对用户语音进行解析，获得用户语音中的命令词。
63.s203，处理单元在指令库中查命令词对应的操作指令。
64.s204，在未查到命令词对应的操作指令的情况下，处理单元将命令词上传至网络设备，并接收来自网络设备反馈的命令词对应的操作指令。
65.s205，处理单元建立命令词及对应的操作指令之间的关联关系。
66.s206，处理单元将已建立关联关系的命令词与该命令词对应的操作指令，存储于指令库的第二存储区。
67.在本实施例中，对上述实施例的细节步骤进行了细化。首先处理单元获得用户的语音并进行解析，得到命令词。进而在指令库，也即是第一存储区和第二存储区内搜索命令词对应的操作指令。在没有搜索到对应指令的情况下，通过网络来获取该命令词的操作指令。最后将该命令词和对应的操作指令建立关联关系，存于第二存储区中。由此可见，在在线状态下，通过网络搜索没有记录的命令词和操作指令，进而存储于第二存储区。实际上就是一个学习的过程，并将其记录在第二存储区中。下次再接收到同样的命令词，无论是在在线还是离线状态，都可以识别出对应的操作指令，从而提高离线状态的识别率。
68.结合图3所示，对本技术的语音控制器在在线状态和离线状态的控制逻辑进行介绍。本公开实施例提供的另一种用于语音控制的方法，包括：
69.s301，处理单元获取用户语音并解析，得到用户语音中的命令词。
70.s302，处理单元在指令库中查命令词对应的操作指令。
71.s303，处理单元判断指令库中是否有命令词对应的操作指令。若是，进入s304；若否，进入s305。
72.s304，处理单元执行对应的操作指令。
73.s305，处理单元判断语音控制器是否处于在线状态。若是，进入s306；若否则结束。
74.s306，处理单元将命令词上传至网络设备，并接收来自网络设备反馈的命令词对应的操作指令。
75.s307，处理单元将命令词及命令词对应的操作指令关联存储于指令库的第二存储区。
76.在该实施例中，结合本技术语音控制器的在线或离线状态，对方案进行了介绍。首先还是需要先获取命令词并在指令库中查对应的操作指令。若在指令库中已经存有对应的操作指令，则如步骤s304，按操作指令进行控制执行即可。需要注意的是，无论是在在线状态还是离线状态，都可以在指令库中进行查和执行操作指令。如果在指令库中没有到命令词对应的操作指令，则进入s305，也即判断当前是否可以连接到网络。通过在将命令词上传给网络并获得对应的操作指令，进而控制其运行。同时需要将该命令词和对应的操作指令建立关联关系，记录在到第二存储区中。也即是对第二存储区进行学习和扩展词库的过程。此外，如果语音控制器处于离线状态，则不能进行网络搜索。但通过在在线状态下，对第二存储区命令词的丰富，使得第二存储区中存储有很多用户经常使用的命令词，从而使得即便在离线状态下，也可以通过第二存储区的命令词完成用户的命令。使得离线状态下还没有搜索到命令词的情况很少，进而提高了离线状态下的识别率。
77.结合图4所示，在上述实施例中，用于语音控制的方法还包括：
78.s401，处理单元记录指令库中命令词被执行的频次和各命令词的存入时间。
79.s402，处理单元根据命令词被执行的频次，向第一存储区或第二存储区添加新命令词及对应操作指令。
80.本方案考虑到存储单元的存储空间有限，因此在有新命令词需要添加的时候，可以根据命令词的执行频次，也即某命令词是否常用进而对命令词进行删除。从而提高存储空间的利用率。
81.具体地，在第一存储区需要添加新命令词及对应操作指令的情况下，向用户展示第一存储区中各命令词的执行频次。响应于用户指令，对第一存储区添加或删除命令词。第一存储区包含出厂时固定写入的初始命令词，这些命令词大多是一些固定或基本功能。因此当用户相对第一存储区进行新增时，只需要向用户展示有哪些命令词以及使用频次即可，根据用户的需求对命令词进行新增或删除。
82.在第二存储区命令词存储数量已达上限且需要新增的情况下，结合图5所示。包括：
83.s501，处理单元判断第二存储区命令词存储数量是否已达上限且需要新增。若否，则结束；若是，进入s502。
84.s502，处理单元判断被执行频次最低的命令词是否存在多个。若否，进入s503；若是，进入s504。
85.s503，处理单元删除第二存储区中被执行频次最低的命令词及对应操作指令。
86.s504，删除被执行频次最低的命令词中存入时间最早的命令词及对应操作指令。
87.在该实施例中，由于第二存储区是用于学习和扩展用户常用的命令词。因此第二存储区有可能会面临存储数量达到上限的问题。在这种情况下，优先删除被执行频次最低，也即用户最不常用的命令词。当被执行频次最低的命令词存在多个时，优先删除存入时间最早的命令词。从而保证再尽可能少的删除已存入命令词的同时，还可以使得存储单元不会出现存满无法再进行扩展的情况。
88.此外，上述的存储单元601中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。
89.存储单元601作为一种存储介质，可用于存储软件程序、计算机可执行程序，如本公开实施例中的方法对应的程序指令/模块。处理单元600通过运行存储在存储单元601中的程序指令/模块，从而执行功能应用以及数据处理，即实现上述实施例中用于语音控制的方法。
90.存储单元601可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端设备的使用所创建的数据等。此外，存储单元601可以包括高速随机存取存储单元，还可以包括非易失性存储单元。
91.以上描述和附图充分地示出了本公开的实施例，以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求，否则单独的部件和功能是可选的，并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。而且，本技术中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的，除非上下文清楚地表明，否则单数形式的“一个”(a)、“一个”(an)和“所述”(the)旨在同样包括复数形式。类似地，如在本技术中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外，当用于本技术中时，术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素，和/或组件的存在，但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下，由语句“包括一个
…”
限定的要素，并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中，每个实施例重点说明的可以是与其他实施例的不同之处，各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言，如果其与实施例公开的方法部分相对应，那么相关之处可以参见方法部分的描述。
92.本领域技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，可以取决于技术方案的特定应用和设计约束条件。所述技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能，但是这种实现不应认为超出本公开实施例的范围。所述技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘
述。
93.附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中，不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生，有时不同的操作或步骤之间不存在特定的顺序。例如，两个连续的操作或步骤实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

技术特征：

1.一种用于语音控制的方法，其特征在于，包括：根据用户语音，获取命令词；在指令库中查命令词对应的操作指令；其中，所述指令库包括预存在第一存储区的初始命令词及各所述初始命令词对应的操作指令；在未查到命令词对应的操作指令的情况下，通过网络设备获得命令词对应的操作指令；将命令词及命令词对应的操作指令关联存储于所述指令库的第二存储区。2.根据权利要求1所述的方法，其特征在于，所述将命令词及命令词对应的操作指令关联存储于所述指令库的第二存储区，包括：建立命令词及对应的操作指令之间的关联关系；将已建立关联关系的命令词与该命令词对应的操作指令，存储于所述指令库的第二存储区。3.根据权利要求1所述的方法，其特征在于，所述根据用户语音，获取命令词，包括：获取用户语音；对所述用户语音进行解析，获得所述用户语音中的命令词。4.根据权利要求1所述的方法，其特征在于，所述通过网络设备获得命令词对应的操作指令，包括：将命令词上传至网络设备；接收来自网络设备反馈的命令词对应的操作指令。5.根据权利要求1至4中任一项所述的方法，其特征在于，所述方法还包括：记录所述指令库中命令词被执行的频次和各命令词的存入时间；根据命令词被执行的频次，向所述第一存储区或所述第二存储区添加新命令词及对应操作指令。6.根据权利要求5所述的方法，其特征在于，向所述第一存储区添加新命令词及对应操作指令，包括：在所述第一存储区需要添加新命令词及对应操作指令的情况下，向用户展示所述第一存储区中各命令词的执行频次；响应于用户指令，对所述第一存储区添加或删除命令词。7.根据权利要求5所述的方法，其特征在于，向所述第二存储区添加新命令词及对应操作指令，包括：在所述第二存储区命令词存储数量已达上限且需要新增的情况下，删除所述第二存储区中被执行频次最低的命令词及对应操作指令。8.根据权利要求7所述的方法，其特征在于，在被执行频次最低的命令词存在多个的情况下，删除被执行频次最低的命令词中存入时间最早的命令词及对应操作指令。9.一种语音控制器，包括处理单元和存储单元，其特征在于，所述存储单元包括第一存储区和第二存储区；其中，所述第一存储区用于存储预存的初始命令词及各所述初始命令词对应的操作指令；所述第二存储区用于存储扩展的命令词及命令词对应的操作指令；
处理单元，被配置为执行如权利要求1至8任一项所述的用于语音控制的方法。10.一种存储介质，存储有程序指令，其特征在于，所述程序指令在运行时，执行如权利要求1至8任一项所述的用于语音控制的方法。

技术总结

本申请涉及数据存储和离线语音技术领域。公开了一种用于语音控制的方法、存储介质和语音控制器。方法包括：根据用户语音，获取命令词；在指令库中查命令词对应的操作指令；其中，指令库包括预存在第一存储区的初始命令词及各初始命令词对应的操作指令；在未查到命令词对应的操作指令的情况下，通过网络设备获得命令词对应的操作指令；将命令词及对应的操作指令关联存储于指令库的第二存储区。通过将学习到的命令词和对应的操作指令建立关联关系并保存在第二存储区，而学习到的命令词大多都是用户常用或习惯性说的命令词，从而使得即便在离线状态下用户说出这些命令词也可以控制对应的设备。进而提高离线状态下的语音识别率，提高了用户体验。提高了用户体验。提高了用户体验。