一种自然语言查询领域的语义解析方法与流程



1.本发明涉及自然语言处理技术领域,具体为一种自然语言查询领域的语义解析方法。


背景技术:



2.随着计算机技术的不断发展,数字化和信息化是企业发展的趋势,企业在进行各种决策的依据逐渐从基于经验转移到基于数据的决策上来,从而给客户提供更高效更精准的服务。而数据的获取目前门槛较高,需要要求企业员工懂诸如sql之类的技术知识。为此提供了数据分析平台,提供例如创建报表的能力,但报表的制作依然需要理解诸如维度、指标等概念,门槛依然高,同时对探索类分析的场景支持并不友好。


技术实现要素:



3.本发明的目的在于提供一种自然语言查询领域的语义解析方法,能支持绝大多数的数据分析场景,保证在该场景下准确率高,支持多步的分析场景,并对数据分析场景进行抽象,提供自然语言查询领域通用的语义分析解决方案,针对自然语言语法做了特定的语义分析,支持用户更自由的问法,以解决上述背景技术中提出的问题。
4.为实现上述目的,本发明提供如下技术方案:
5.一种自然语言查询领域的语义解析方法,包括如下步骤:
6.s1、输入自然语言:将分析思路转化成自然语言;
7.s2、前置分词工作:识别出自然语言表述中的关键对象;
8.s3、语义解析,其包括:
9.a)前置处理:进行一些补全操作。
10.b)分层并确定分析主体:解析出自然语言中可能涉及到的多步分析意图,对其进行分层,并确定每一层的分析主体。
11.c)确定分析主体表现:到实体中的分析主体表现,根据自然语言的论述来出整个分析上下文中的指标。
12.d)逐层转查询语义:解析得到每一层的查询语义,并进行层与层之间的合并。
13.e)得到最终查询意图:得到最终的查询意图,并基于此做出查询意图的推荐;
14.s4、触发查询;根据查询语义转成可执行的查询sql,到计算引擎里执行查询逻辑;
15.s5、得到查询结果。
16.与现有技术相比,本发明的有益效果是:
17.1.本发明提供了一种自然语言查询领域的语义解析方法,并能支持绝大多数的数据分析场景,保证在该场景下准确率高;
18.2.语法解析设计支持多步的分析场景,并对数据分析场景进行抽象,提供自然语言查询领域通用的语义分析解决方案;
19.3.针对自然语言语法做了特定的语义分析,支持用户更自由的问法。
附图说明
20.图1为本发明的流程示意图;
21.图2为本发明的查询结果的案例一;
22.图3为本发明的查询结果的案例二。
具体实施方式
23.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
24.因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
25.请参阅图1,本发明提供了一种自然语言查询领域的语义解析方法,首先明确一些概念:
[0026][0027]
该自然语言查询领域的语义解析方法包括如下步骤:
[0028]
s1、输入自然语言:将分析思路转化成自然语言;
[0029]
s2、前置分词工作:识别出自然语言表述中的关键对象;
[0030]
s3、开始进行语义解析,其包括:
[0031]
a)前置处理:
[0032]
在自然语言口语化表述中,往往会去省略一些信息,需要到并在本步里进行补全。补全除了可能在问句里直接表述出来,也可能出现在表达式或者词组里。举例如下:
[0033][0034][0035]
在未制定分析意图的情况下,求和是默认的分析意图,对于一些字段,比如比率类字段,会选择平均作为默认分析意图。
[0036]
b)分层并确定分析主体:
[0037]
这是核心步骤,基于此来识别出多步的查询。首先来看下何为多步。
[0038]
定义最基本的查询单元(query),若该查询单元存在子查询单元(子query),称之为多步。举个简单的例子有利于理解:
[0039]
各城市交易金额求和的平均值,我们需要:
[0040]
1)各城市交易金额求和,这个是子查询单元,可以理解做sql的临时表。
[0041]
2)求和的平均值,这个是外层的查询单元,基于子查询单元进行计算。
[0042]
多层可以拆解成多个单层。只要保证单层以及层与层之间衔接的准确性。首先对多步进行分类:不全部透出。
[0043]
举个简单的例子:2022年交易金额大于100的城市下各用户的利润。
[0044]
然后来看准确性是如何保证的:
[0045]
1)如何保证单层的准确性,即需要保证单层分析对象的完整性,特别是筛选对象在自然语言表述中,一般是全局生效的。举个例子:2022年交易金额大于100的城市下各用户的利润中2022年既要作用到第一层,又要作用到第二层。
[0046]
2)层与层之间衔接的准确性,抽象出了层与层之间的关系,有依赖关系,有筛选关系,有利于推导层与层之间的合并逻辑。举个例子:2022年交易金额大于100的城市下各用户的利润
[0047]
a)2022年交易金额大于100的城市。
[0048]
b)2022年城市下各用户的利润。
[0049]
其中城市作为上下两层的衔接,他们之间的关系是筛选关系。
[0050]
c)确定分析主体表现:
[0051]
在确定了分层和分析主体之后,很自然就能根据当前的分层,得到分析主体的表现。
[0052]
举个例子:各城市交易金额;
[0053]
在当前层下,城市为分析主体,交易金额(求和)为其表现。
[0054]
d)逐层转查询语义:
[0055]
将分层的结果转成实际的查询语义,注意此处会进行层与层的合并。
[0056]
关于单层内的查询语义解析,针对不同的分析实体,转成相应的查询语义对象:
[0057][0058]
在层与层之间合并中,需要根据层与层之间的关系,进行关联方式的推导。
[0059]
e)得到最终查询意图:最外层的查询单元即为最终的查询意图
[0060]
s4、触发查询;根据查询语义转成可执行的查询sql,到计算引擎里执行查询逻辑;
[0061]
s5、得到查询结果,如图2和图3所示分别为单层场景和多层场景下的查询结果的案例。
[0062]
综上所述:该自然语言查询领域的语义解析方法降低了使用门槛,提供自然语言查询的能力,可以通过中文表述来直接进行取数,直接把取数门槛降到最底,可以让一线不懂计算机高深技术的人员也可以即时去做分析,提高企业的决策效率。
[0063]
在输入分析取数意图的自然语言表述后,首先会经过系统的前置分词工作,之后进入我们的语义解析模块,再之后生成正确的查询结果。相较于其他的语义解析设计,本发明除了针对自然语言语法做了特定的分析,还支持解析出多层多步的查询语义,并保证查询结果的准确性。
[0064]
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

技术特征:


1.一种自然语言查询领域的语义解析方法,其特征在于,包括如下步骤:s1、输入自然语言;s2、前置分词;s3、语义解析;s4、触发查询;s5、得到查询结果。2.根据权利要求1所述的一种自然语言查询领域的语义解析方法,其特征在于,所述s1中输入自然语言具体为:将分析思路转化成自然语言。3.根据权利要求2所述的一种自然语言查询领域的语义解析方法,其特征在于,所述s2中前置分词具体为:识别出自然语言表述中的关键对象。4.根据权利要求3所述的一种自然语言查询领域的语义解析方法,其特征在于,所述s3中语义解析包括依次进行的前置处理、分层并确定分析主体、确定分析主体表现、逐层转查询语义和得到最终查询意图。5.根据权利要求4所述的一种自然语言查询领域的语义解析方法,其特征在于,所述前置处理具体为:进行一些补全操作。6.根据权利要求5所述的一种自然语言查询领域的语义解析方法,其特征在于,所述分层并确定分析主体具体为:解析出自然语言中可能涉及到的多步分析意图,对其进行分层,并确定每一层的分析主体。7.根据权利要求6所述的一种自然语言查询领域的语义解析方法,其特征在于,所述确定分析主体表现具体为:到实体中的分析主体表现,根据自然语言的论述来出整个分析上下文中的指标。8.根据权利要求7所述的一种自然语言查询领域的语义解析方法,其特征在于,所述逐层转查询语义具体为:解析得到每一层的查询语义,并进行层与层之间的合并。9.根据权利要求8所述的一种自然语言查询领域的语义解析方法,其特征在于,所述得到最终查询意图具体为:得到最终的查询意图,并基于此做出查询意图的推荐。10.根据权利要求9所述的一种自然语言查询领域的语义解析方法,其特征在于,所述s4中触发查询具体为:根据查询语义转成可执行的查询sql,到计算引擎里执行查询逻辑。

技术总结


本发明公开了一种自然语言查询领域的语义解析方法,包括如下步骤:S1、输入自然语言:将分析思路转化成自然语言;S2、前置分词工作:识别出自然语言表述中的关键对象;S3、语义解析:包括依次进行的前置处理、分层并确定分析主体、确定分析主体表现、逐层转查询语义和得到最终查询意图;S4、触发查询:根据查询语义转成可执行的查询SQL,到计算引擎里执行查询逻辑;S5、得到查询结果。本发明能支持绝大多数的数据分析场景,保证在该场景下准确率高,支持多步的分析场景,并对数据分析场景进行抽象,提供自然语言查询领域通用的语义分析解决方案,针对自然语言语法做了特定的语义分析,支持用户更自由的问法。持用户更自由的问法。持用户更自由的问法。


技术研发人员:

范陈锦

受保护的技术使用者:

数预智能科技(上海)有限公司

技术研发日:

2022.09.26

技术公布日:

2022/12/16

本文发布于:2024-09-23 17:23:57,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/41420.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:自然语言   语义   领域   所述
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议