语音信号处理方法、装置和计算机设备与流程



1.本发明属于语音信号处理领域,更具体地涉及一种语音信号处理方法、装置和计算机设备。


背景技术:



2.随着互联网的快速发展,语音识别模型可以用于识别语音信号,以将其转化为对应的文本数据。例如,通过语音识别模型可以将新闻、教育、广告宣传等业务场景的语音信号转化为与其对应的文本数据。目前的语音模型识别能力有限,只能识别语音信号中的文字内容,而无法识别出语音信号中的关系式,这样导致采用语音识别模型识别包含关系式的语音信号时得到的文本数据准确率较低。
3.因此,有必要提供一种语音信号处理方法,以解决上述问题。


技术实现要素:



4.(一)要解决的技术问题
5.本发明旨在解决相关技术中语音识别模型无法识别语音信号中关系式的技术问题。
6.(二)技术方案
7.为解决上述技术问题,本发明的一方面提出一种语音信号处理方法,包括:获取待识别的语音信号;对所述语音信号处理,获取待识别的文本数据;根据预设匹配规则,对所述文本数据处理,获取目标关系对象和目标关系符号,所述预设匹配规则是基于多种类型关系式中的关系符号和关系对象确定的;根据所述目标关系对象和所述目标关系符号,确定所述语音信号中包含的目标关系式。
8.根据本发明的优选实施方式,对所述语音信号处理,获取待识别的文本数据包括:通过端到端的深度学习模型,对所述语音信号进行识别,获取所述待识别的文本数据。
9.根据本发明的优选实施方式,根据所述预设匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号包括:根据所述多种类型关系式中的关系符号和关系对象,分别确定字典树的匹配规则;通过所述字典树的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号。
10.根据本发明的优选实施方式,根据所述预设匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号包括:根据所述多种类型关系式中的关系符号和关系对象,分别确定自动机的匹配规则;通过所述自动机的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号。
11.根据本发明的优选实施方式,根据所述预设匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号包括:根据所述多种类型关系式中的关系符号和关系对象,分别确定正则表达式的匹配规则;通过所述正则表达式的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符。
12.根据本发明的优选实施方式,通过所述字典树的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号包括:基于所述文本数据中的字符串,遍历字典树中的每个节点,匹配所述目标关系对象和所述目标关系符号。
13.根据本发明的优选实施方式,通过所述自动机的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号包括:基于所述文本数据中的字符串和自动机中fail指针,遍历所述自动机中树的每个节点,匹配所述目标关系对象和所述目标关系符号。
14.根据本发明的优选实施方式,通过所述正则表达式的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号包括:基于所述文本数据中的字符串,遍历正则表达式中的预设对象和预设符号,匹配所述目标关系对象和所述目标关系符号。
15.根据本发明的优选实施方式,根据所述目标关系对象和所述目标关系符号,确定所述语音信号中包含的目标关系式包括:基于转换规则,对所述目标关系对象和所述目标关系符号进行转换处理,得到latex格式的目标关系式。
16.本发明第二方面提出了一种语音信号处理装置法,包括:语音信号获取模块,用于获取待识别的语音信号;文本数据获取模块,用于对所述语音信号处理,获取待识别的文本数据;匹配模块,用于根据预设匹配规则,对所述文本数据处理,获取目标关系对象和目标关系符号,所述预设匹配规则是基于多种类型关系式中的关系符号和关系对象确定的;确定模块,用于根据所述目标关系对象和所述目标关系符号,确定所述语音信号中包含的目标关系式。
17.本发明第三方面提出一种计算机设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行上述任一项所述的一种语音信号处理方法。
18.本发明第四方面提出一种计算机程序产品,存储有计算机可执行程序,所述计算机可执行程序被执行时,实现上述任一项所述的一种语音信号处理方法。
19.(三)有益效果
20.与现有技术相比,本发明获取待识别的语音信号,对语音信号处理,获取待识别的文本数据,根据预设匹配规则,对文本数据处理,获取目标关系对象和目标关系符号,所述预设匹配规则是基于多种类型关系式中的关系符号和关系对象确定的,根据目标关系对象和目标关系符号,确定语音信号中包含的目标关系式,以此方式可以识别出语音信号中的关系式,有效地避免相关技术中语音识别模型无法识别语音信号中的关系式的技术缺陷。
附图说明
21.图1示出了可以应用本发明实施例的技术方案的示例性系统架构的示意图;
22.图2是本发明的实施例的语音信号处理方法的一示例的流程图;
23.图3是本发明的实施例的语音信号处理方法的另一示例的流程图;
24.图4是本发明的实施例的语音信号处理方法的另一示例的流程图;
25.图5是本发明的实施例的语音信号处理方法的另一示例的流程图;
26.图6是本发明的实施例的语音信号处理装置的一示例的示意图;
27.图7是本发明的一个实施例的计算机设备的结构示意图;
28.图8是本发明的一个实施例的计算机程序产品的示意图。
具体实施方式
29.在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
30.附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
31.附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理单元装置和/或微控制器装置中实现这些功能实体。
32.各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。
33.为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
34.图1示出了可以应用本发明实施例的技术方案的示例性系统架构的示意图。
35.如图1所示,系统架构100可以包括用户终端101、102、103中的一种或多种,网络104和服务器105。网络104用以在用户终端101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
36.应该理解,图1中的用户终端、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的用户终端、网络和服务器。比如服务器105可以是多个服务器组成的服务器集等。
37.用户可以使用用户终端101、102、103通过网络104与服务器105交互,以接收或发送消息等。用户终端101、102、103可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等等。
38.服务器105可以是提供各种服务的服务器。例如服务器105可以实时获取用户终端103(也可以是用户终端101或102)的待识别的语音信号,对语音信号处理,获取待识别的文本数据,根据预设匹配规则,对文本数据处理,获取目标关系对象和目标关系符号,所述预设匹配规则是基于多种类型关系式中的关系符号和关系对象确定的,根据目标关系对象和目标关系符号,确定语音信号中包含的目标关系式,以此方式可以识别出语音信号中的关系式,有效地避免相关技术中语音识别模型无法识别语音信号中的关系式的技术缺陷。
39.在一些实施例中,本发明实施例所提供的语音信号处理方法一般由服务器105执
行,相应地,语音信号处理装置一般设置于服务器105中。在另一些实施例中,某些终端可以具有与服务器相似的功能从而执行本方法。因此,本发明实施例所提供的语音信号处理方法不限定在服务器端执行。
40.图2是本发明的实施例的语音信号处理方法的一示例的流程图。
41.如图2所示,语音信号处理方法包括步骤s210~步骤s240。
42.在步骤s210中,获取待识别的语音信。
43.在步骤s220中,对所述语音信号处理,获取待识别的文本数据。
44.在步骤s230中,根据预设匹配规则,对所述文本数据处理,获取目标关系对象和目标关系符号,所述预设匹配规则是基于多种类型关系式中的关系符号和关系对象确定的。
45.在步骤s240中,根据所述目标关系对象和所述目标关系符号,确定所述语音信号中包含的目标关系式。
46.该方法可以获取待识别的语音信号,对语音信号处理,获取待识别的文本数据,根据预设匹配规则,对文本数据处理,获取目标关系对象和目标关系符号,所述预设匹配规则是基于多种类型关系式中的关系符号和关系对象确定的,根据目标关系对象和目标关系符号,确定语音信号中包含的目标关系式,以此方式可以识别出语音信号中的关系式,有效地避免相关技术中语音识别模型无法识别语音信号中的关系式的技术缺陷。
47.在本发明的一些实施例中,上述待识别的语音信号可以是各种业务场景的语音信号。例如,该待识别的语音信号可以为新闻、教育、广告宣传等语音信号。在本实施例中,新闻、教育、广告宣传等语音信号中含有关系式。该关系式可以是数学关系式、化学关系式、物理关系式等等,但不限于此。
48.在本发明的一些实施例中,上述待识别的语音信号可以是线下录制的音频,也可以是线上实时录制的音频。例如,老师线下讲课采用录制装置录制的音频,老师线上直播时实时录制的音频等等,但不限于此。
49.在本发明的一些实施例中,对上述语音信号处理,获取待识别的文本数据包括:通过端到端的深度学习模型,对语音信号进行识别,获取上述待识别的文本数据。
50.在本发明的一些实施例中,上述端到端的深度学习模型可以包括编码器(encoder)和解码器(decoder)。将待识别的语音信号输入到端到端的深度学习模型,编码器对该待识别的语音信号进行编码得到特征向量序列,解码器对该特征向量序列进行解码,得到与该语音信号对应的文本数据,即上述待识别的文本数据。
51.在本发明的一些实施例中,基于历史语音信号和预设文本标签训练端到端的深度学习模型。例如,将历史语音信号输入端到端的深度学习模型,经过编码器和解码器处理,得到文本数据,基于该文本数据与预设文本标签比较,待两者的差别在一定范围内停止训练。待模型训练结束后,将待识别的语音信号输入到训练好的端到端的深度学习模型,这样可以快速准确的获取到与其对应的待识别的文本数据。在本实施例中,该待识别的文本数据可以是包含待识别的关系式的字符串。
52.在本发明的一些实施例中,上述预设匹配规则可以包括但不限于字典树的匹配规则、自动机的匹配规则、以及正则表达式的匹配规则。在本实施例中,上述字典树的匹配规则、自动机的匹配规则、以及正则表达式的匹配规则分别可以根据关系式进行设置。例如,字典树的匹配规则可以先根据各种业务场景的关系式设置字典树中每个节点,具体地可以
将数学关系式、化学关系式、以及物理关系式中的关系对象和关系符号设置在字典树的节点上。然后根据字典树中节点的分布和字典树的查询逻辑设置字典树的匹配规则。
53.再例如,自动机的匹配规则可以先设置字典树和fail指针,具体地可以将数学关系式、化学关系式、以及物理关系式中的关系对象和关系符号设置在字典树的节点上。并根据字典树中节点分布的内容设置fail指针的跳转规则。然后根据字典树中节点分布、字典树的查询逻辑和fail指针的跳转规则设置自动机的匹配规则。
54.再例如,正则表达式的匹配规则可以先数学关系式、化学关系式、以及物理关系式中的关系对象和关系符号设置正则表达式,然后根据正则表达式的查询逻辑设置正则表达式的匹配规则。例如,小数正则表达式为“[一二三四五六七八九十百千万亿]+点[零一二三四五六七八九]+”;分数的正则表达式为“[一二三四五六七八九十百千万亿零]分之[一二三四五六七八九十百千万亿零]+”;除法的正则表达式为“[一二三四五六七八九十百千万亿零]\s*除[以]*[一二三四五六七八九十百千万亿零]”。其中,一二三四五六七八九十百千万亿零为关系对象,小数点、分之、除以为关系符号。
[0055]
在本发明的一些实施例中,多种类型关系式可以包括但不限于数学关系式、物理关系式、以及化学关系式。在本实施例中,可以根据多种类型的关系式设置不同的字典树和正则表达式。
[0056]
在本发明的一些实施例中,通过上述字典树的匹配规则、自动机的匹配规则、以及正则表达式的匹配规则识别上述待识别的文本数据,以识别及获取该文本数据的关系式的关系对象和关系符号。
[0057]
在本发明的一些实施例中,根据所述目标关系对象和所述目标关系符号,确定所述语音信号中包含的目标关系式包括:基于转换规则,对所述目标关系对象和所述目标关系符号进行转换处理,得到latex格式的目标关系式。例如,通过上述预设匹配规则,从待识别的文本数据中获取到目标关系对象和关系符号之后,通过latex工具的转换规则可以将目标关系对象和关系符号转换成常规关系式。例如,目标关系对象为y、a、b、x,目标关系符号为+和=。在这种情况下,通过latex工具可以将其转换为常规关系式y=a+bx。再例如,目标关系对象为r,u,i,目标关系符号为/和=,在这种情况下,通过latex工具可以将其转换为常规关系式i=u/r。再例如,目标关系对象为2、h、c、l、c、a、c、o、3、h、2、o、c、a、c、l、2、c、o、2,目标关系符号为+、=、+、+。在这种情况下,通过latex工具可以将其转换为常规关系式2hcl+caco3=h2o+cacl2+co2。
[0058]
通过上述方法,可以识别出待识别的语音信号中的目标关系式,有效地避免相关技术中无法识别语音信号中关系式的技术缺陷。例如,通过端到端深度学习模型对语音信号进行识别,将其转化为待识别的文本数据,该文本数据中包含上述预设匹配规则可识别的关系式,这样基于上述多种类型可以识别该文本数据,以获取目标关系对象和目标关系符号。以使得采用latex工具可以根据目标关系对象和目标关系符号,以及目标关系象和目标关系符号分别在文本数据的位置顺序,将其转化为常规关系式,例如,数学公式,物理公式,化学方程式等等,但不限于此。
[0059]
图3是本发明的实施例的语音信号处理方法的另一示例的流程图。
[0060]
如图3所示,上述步骤s230具体可以包括步骤s310~步骤s320。
[0061]
在步骤s310中,根据所述多种类型关系式中的关系符号和关系对象,分别确定字
典树的匹配规则。
[0062]
在步骤s320中,通过所述字典树的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号。
[0063]
该方法可以根据多种类型关系式中的关系符号和关系对象,分别确定字典树的匹配规则,这样便于后续根据不同类型的字典树的匹配规则来识别对应类型的关系式对象和关系符号。通过字典树的匹配规则,对文本数据处理,获取目标关系对象和所述目标关系符号,以此方式可以快速准确的获取到不同类型关系式中的关系对象和关系符号。
[0064]
在本发明的一些实施例中,字典树的匹配规则可以先根据各种业务场景的关系式设置字典树中每个节点,具体地可以将数学关系式、化学关系式、以及物理关系式中的关系对象和关系符号设置在字典树的节点上。然后根据字典树中节点的分布和字典树的查询逻辑设置字典树的匹配规则。
[0065]
在本发明的一些实施例中,通过字典树的匹配规则,对文本数据处理,获取目标关系对象和目标关系符号包括:基于文本数据中的字符串,遍历字典树中的每个节点,匹配目标关系对象和目标关系符号。例如,根据字典树中节点的分布和字典树的查询逻辑,基于文本数据中字符串的各字符,从字典树中查询与其匹配的关系对象和关系符号。
[0066]
图4是本发明的实施例的语音信号处理方法的另一示例的流程图。
[0067]
如图4所示,上述步骤s230具体可以包括步骤s410~步骤s420。
[0068]
在步骤s410中,根据所述多种类型关系式中的关系符号和关系对象,分别确定自动机的匹配规则。
[0069]
在步骤s420中,通过所述自动机的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号。
[0070]
该方法可以根据多种类型关系式中的关系符号和关系对象,分别确定自动机的匹配规则,这样便于后续根据不同类型的自动机的匹配规则来识别对应类型的关系式对象和关系符号。通过自动机的匹配规则,对文本数据处理,获取目标关系对象和所述目标关系符号,以此方式可以快速准确的获取到不同类型关系式中的关系对象和关系符号。
[0071]
在本发明的一些实施例中,上述自动机的匹配规则可以先设置字典树和fail指针,具体地可以将数学关系式、化学关系式、以及物理关系式中的关系对象和关系符号设置在字典树的节点上。并根据字典树中节点分布的内容设置fail指针的跳转规则。然后根据字典树中节点分布、字典树的查询逻辑和fail指针的跳转规则设置自动机的匹配规则。
[0072]
在本发明的一些实施例中,通过所述自动机的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号包括:基于所述文本数据中的字符串和自动机中fail指针,遍历所述自动机中树的每个节点,匹配所述目标关系对象和所述目标关系符号。例如,根据根据字典树中节点分布和fail指针的跳转规则,基于文本数据中字符串的各字符,从自动机的字典树中匹配与其相对应的关系对象和关系符号。
[0073]
图5是本发明的实施例的语音信号处理方法的另一示例的流程图。
[0074]
如图5所示,上述步骤s230具体可以包括步骤s510~步骤s520。
[0075]
在步骤s510中,根据所述多种类型关系式中的关系符号和关系对象,分别确定正则表达式的匹配规则。
[0076]
在步骤s520中,通过所述正则表达式的匹配规则,对所述文本数据处理,获取所述
目标关系对象和所述目标关系符。
[0077]
该方法可以根据多种类型关系式中的关系符号和关系对象,分别确定正则表达式的匹配规则,这样便于后续根据不同类型的正则表达式的匹配规则来识别对应类型的关系式对象和关系符号。通过正则表达式的匹配规则对文本数据处理,获取目标关系对象和所述目标关系符号,以此方式可以快速准确的获取到不同类型关系式中的关系对象和关系符号。
[0078]
在本发明的一些实施例中,上述正则表达式的匹配规则可以先数学关系式、化学关系式、以及物理关系式中的关系对象和关系符号设置正则表达式,然后根据正则表达式的查询逻辑设置正则表达式的匹配规则。例如,小数正则表达式为“[一二三四五六七八九十百千万亿]+点[零一二三四五六七八九]+”;分数的正则表达式为“[一二三四五六七八九十百千万亿零]分之[一二三四五六七八九十百千万亿零]+”;除法的正则表达式为“[一二三四五六七八九十百千万亿零]\s*除[以]*[一二三四五六七八九十百千万亿零]”。其中,一二三四五六七八九十百千万亿零为关系对象,小数点、分之、除以为关系符号。
[0079]
在本发明的一些实施例中,通过所述正则表达式的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号包括:基于所述文本数据中的字符串,遍历正则表达式中的预设对象和预设符号,匹配所述目标关系对象和所述目标关系符号。例如,根据正则表达式的查询逻辑,基于文本数据中字符串的各字符,从正则表达式中匹配与其相对应的关系对象和关系符号。
[0080]
本发明提供了多种匹配规则,例如,字典树的匹配规则、自动机的匹配规则、以及正则表达式的匹配规则,各匹配规则可以根据不同类型关系式设置不同的匹配规则,这样在获取文本数据的关系对象和关系符号时,可以根据文本数据中关系式的类型匹配规则的类型,这样使得本发明的匹配方法更加灵活,有针对性,提高用户体验。
[0081]
图6是本发明的实施例的语音信号处理装置的一示例的示意图。
[0082]
如图6所示,语音信号处理装置600包括语音信号获取模块610、文本数据获取模块620、匹配模块630和确定模块640。
[0083]
具体地,语音信号获取模块610,用于获取待识别的语音信号。
[0084]
文本数据获取模块620,用于对所述语音信号处理,获取待识别的文本数据。
[0085]
匹配模块630,用于根据预设匹配规则,对所述文本数据处理,获取目标关系对象和目标关系符号,所述预设匹配规则是基于多种类型关系式中的关系符号和关系对象确定的。
[0086]
确定模块640,用于根据所述目标关系对象和所述目标关系符号,确定所述语音信号中包含的目标关系式。
[0087]
该语音信号处理装置600可以获取待识别的语音信号,对语音信号处理,获取待识别的文本数据,根据预设匹配规则,对文本数据处理,获取目标关系对象和目标关系符号,所述预设匹配规则是基于多种类型关系式中的关系符号和关系对象确定的,根据目标关系对象和目标关系符号,确定语音信号中包含的目标关系式,以此方式可以识别出语音信号中的关系式,有效地避免相关技术中语音识别模型无法识别语音信号中的关系式的技术缺陷。
[0088]
根据本发明的实施例,该语音信号处理装置600可以用于实现图2实施例描述的语
音信号处理方法。
[0089]
根据本发明的优选实施方式,上述文本数据获取模块620被配置为:通过端到端的深度学习模型,对所述语音信号进行识别,获取所述待识别的文本数据。
[0090]
根据本发明的优选实施方式,上述匹配模块630被配置为:根据所述多种类型关系式中的关系符号和关系对象,分别确定字典树的匹配规则;通过所述字典树的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号。
[0091]
根据本发明的优选实施方式,上述匹配模块630还被配置为:根据所述多种类型关系式中的关系符号和关系对象,分别确定自动机的匹配规则;通过所述自动机的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号。
[0092]
根据本发明的优选实施方式,上述匹配模块630还被配置为:根据所述多种类型关系式中的关系符号和关系对象,分别确定正则表达式的匹配规则;通过所述正则表达式的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符。
[0093]
由于本发明的示例实施例的语音信号处理装置600的各个模块可以用于实现上述2~图5描述的语音信号处理方法的示例实施例的步骤,因此对于本发明装置实施例中未披露的细节,请参照本发明上述的语音信号处理方法的实施例。
[0094]
可以理解的是,语音信号处理装置600包括语音信号获取模块610、文本数据获取模块620、匹配模块630和确定模块640可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本发明的实施例,语音信号处理装置600包括语音信号获取模块610、文本数据获取模块620、匹配模块630和确定模块640中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以以对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式的适当组合来实现。或者,语音信号处理装置600包括语音信号获取模块610、文本数据获取模块620、匹配模块630和确定模块640中的至少一个可以至少被部分地实现为计算机程序模块,当该程序被计算机运行时,可以执行相应模块的功能。
[0095]
下面描述本发明的计算机设备实施例,该计算机设备可以视为对于上述本发明的方法和装置实施例的具体实体实施方式。对于本发明计算机设备实施例中描述的细节,应视为对于上述方法或装置实施例的补充;对于在本发明计算机设备实施例中未披露的细节,可以参照上述方法或装置实施例来实现。
[0096]
图7是本发明的一个实施例的计算机设备的结构示意图,该计算机设备包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行实施例中任一项所述的方法,包括但不限于图2的方法。
[0097]
如图7所示,计算机设备以通用计算设备的形式表现。其中处理器可以是一个,也可以是多个并且协同工作。本发明也不排除进行分布式处理,即处理器可以分散在不同的实体设备中。本发明的计算机设备并不限于单一实体,也可以是多个实体设备的总和。
[0098]
所述存储器存储有计算机可执行程序,通常是机器可读的代码。所述计算机可读程序可以被所述处理器执行,以使得计算机设备能够执行本发明的方法,或者方法中的至少部分步骤。
[0099]
所述存储器包括易失性存储器,例如随机存取存储单元(ram)和/或高速缓存存储单元,还可以是非易失性存储器,如只读存储单元(rom)。
[0100]
可选地,该实施例中,计算机设备还包括有i/o接口,其用于计算机设备与外部的设备进行数据交换。i/o接口可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
[0101]
应当理解,图7显示的计算机设备仅仅是本发明的一个示例,本发明的计算机设备中还可以包括上述示例中未示出的元件或组件。例如,有些计算机设备中还包括有显示屏等显示单元,有些计算机设备还包括人机交互元件,例如按扭、键盘等。只要该计算机设备能够执行存储器中的计算机可读程序以实现本发明方法或方法的至少部分步骤,均可认为是本发明所涵盖的计算机设备。
[0102]
图8是本发明的一个实施例的计算机程序产品的示意图。如图8所示,计算机程序产品中存储有计算机可执行程序,所述计算机可执行程序被执行时,实现本发明上述方法。所述计算机程序产品可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。所述计算机程序产品可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。所述计算机程序产品上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
[0103]
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0104]
通过以上对实施方式的描述,本领域的技术人员易于理解,本发明可以由能够执行特定计算机程序的硬件来实现,例如本发明的系统,以及系统中包含的电子处理单元、服务器、客户端、手机、控制单元、处理器等。本发明也可以由执行本发明的方法的计算机软件来实现,例如由微处理器、电子控制单元,客户端、服务器端等执行的控制软件来实现。但需要说明的是,执行本发明的方法的计算机软件并不限于由一个或特定个的硬件实体中执行,其也可以是由不特定具体硬件的以分布式的方式来实现。对于计算机软件,软件产品可以存储在一个计算机可读的存储介质(可以是cd-rom,u盘,移动硬盘等)中,也可以分布式存储于网络上,只要其能使得计算机设备执行根据本发明的方法。
[0105]
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者计算机设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发
明的保护范围之内。

技术特征:


1.一种语音信号处理方法,其特征在于,包括:获取待识别的语音信号;对所述语音信号处理,获取待识别的文本数据;根据预设匹配规则,对所述文本数据处理,获取目标关系对象和目标关系符号,所述预设匹配规则是基于多种类型关系式中的关系符号和关系对象确定的;根据所述目标关系对象和所述目标关系符号,确定所述语音信号中包含的目标关系式。2.根据权利要求1所述的语音信号处理方法,其特征在于,对所述语音信号处理,获取待识别的文本数据包括:通过端到端的深度学习模型,对所述语音信号进行识别,获取所述待识别的文本数据。3.根据权利要求1所述的语音信号处理方法,其特征在于,根据所述预设匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号包括:根据所述多种类型关系式中的关系符号和关系对象,分别确定字典树的匹配规则;通过所述字典树的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号。4.根据权利要求1所述的语音信号处理方法,其特征在于,根据所述预设匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号包括:根据所述多种类型关系式中的关系符号和关系对象,分别确定自动机的匹配规则;通过所述自动机的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号。5.根据权利要求1所述的语音信号处理方法,其特征在于,根据所述预设匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号包括:根据所述多种类型关系式中的关系符号和关系对象,分别确定正则表达式的匹配规则;通过所述正则表达式的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号。6.根据权利要求3所述的语音信号处理方法,其特征在于,通过所述字典树的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号包括:基于所述文本数据中的字符串,遍历字典树中的每个节点,匹配所述目标关系对象和所述目标关系符号。7.根据权利要求4所述的语音信号处理方法,其特征在于,通过所述自动机的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号包括:基于所述文本数据中的字符串和自动机中fail指针,遍历所述自动机中树的每个节点,匹配所述目标关系对象和所述目标关系符号。8.根据权利要求5所述的语音信号处理方法,其特征在于,通过所述正则表达式的匹配规则,对所述文本数据处理,获取所述目标关系对象和所述目标关系符号包括:基于所述文本数据中的字符串,遍历正则表达式中的预设对象和预设符号,匹配所述目标关系对象和所述目标关系符号。9.根据权利要求1所述的语音信号处理方法,其特征在于,根据所述目标关系对象和所
述目标关系符号,确定所述语音信号中包含的目标关系式包括:基于转换规则,对所述目标关系对象和所述目标关系符号进行转换处理,得到latex格式的目标关系式。10.一种语音信号处理装置法,其特征在于,包括:语音信号获取模块,用于获取待识别的语音信号;文本数据获取模块,用于对所述语音信号处理,获取待识别的文本数据;匹配模块,用于根据预设匹配规则,对所述文本数据处理,获取目标关系对象和目标关系符号,所述预设匹配规则是基于多种类型关系式中的关系符号和关系对象确定的;确定模块,用于根据所述目标关系对象和所述目标关系符号,确定所述语音信号中包含的目标关系式。11.一种计算机设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,其特征在于,当所述计算机程序被所述处理器执行时,所述处理器执行如权利要求1-9中任一项所述的基于文本数据确定目标用户的方法。12.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令当被处理器执行时,实现权利要求1-9中任一项所述的基于文本数据确定目标用户的方法。

技术总结


本发明属于语音信号处理领域,提供一种语音信号处理方法,包括:获取待识别的语音信号,对所述语音信号处理,获取待识别的文本数据;根据预设匹配规则,对所述文本数据处理,获取目标关系对象和目标关系符号,所述预设匹配规则是基于多种类型关系式中的关系符号和关系对象确定的,根据所述目标关系对象和所述目标关系符号,确定所述语音信号中包含的目标关系式,以此方式可以识别出语音信号中的关系式,有效地避免相关技术中语音识别模型无法识别语音信号中的关系式的技术缺陷。语音信号中的关系式的技术缺陷。语音信号中的关系式的技术缺陷。


技术研发人员:

王伟戌 王强强 商迎新

受保护的技术使用者:

北京云思智学科技有限公司

技术研发日:

2022.06.24

技术公布日:

2022/11/8

本文发布于:2024-09-20 14:22:14,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/10299.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   关系   关系式   目标
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议