一种基于专有名词的问题答复方法及装置与流程



1.本发明涉及人工智能技术领域,具体涉及一种基于专有名词的问题答复方法及装置。


背景技术:



2.随着自然语言处理技术的发展,出现了智能问答系统,对以自然语言形式描述的问题进行解析,返回与问题匹配的答案。
3.现有技术中,对问题进行分词,然后将分词后的各个词的词向量相加,获得问题对应的句子向量,然后根据问题对应的句子向量从问答库中的预设问题中出相似度最高的预设问题对应答案作为问题匹配的答案。上述方法,当问题中出现专有名词时,由于用户的输入的问题中专有名词不完整,而有些专有业务名词又比较相近,导致专有名词的区分度不高,在匹配预设问题时,容易出现偏差,出相似度最高的预设问题对应的答案不一定是正确答案,获得的答案的准确率会下降。


技术实现要素:



4.针对现有技术中的问题,本发明实施例提供一种基于专有名词的问题答复方法及装置,能够至少部分地解决现有技术中存在的问题。
5.第一方面,本发明提出一种基于专有名词的问题答复方法,包括:
6.接收客户端发送的询问请求,所述询问请求包括咨询问题;
7.若基于专有名词清单判断获知所述咨询问题包括专有名词,则根据所述咨询问题包括的专有名词查询对应的相关信息作为所述咨询问题的回复信息;其中,所述专有名词清单是预先获得的;
8.向所述客户端返回所述咨询问题的回复信息。
9.第二方面,本发明提供一种基于专有名词的问题答复装置,包括:
10.接收模块,用于接收客户端发送的询问请求,所述询问请求包括咨询问题;
11.查询模块,用于在基于专有名词清单判断获知所述咨询问题包括专有名词之后,根据所述咨询问题包括的专有名词查询对应的相关信息作为所述咨询问题的回复信息;其中,所述专有名词清单是预先获得的;
12.返回模块,用于向所述客户端返回所述咨询问题的回复信息。
13.第三方面,本发明提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施例所述基于专有名词的问题答复方法。
14.第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一实施例所述基于专有名词的问题答复方法。
15.第五方面,本发明提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述基于专有名词的问题答复方
法。
16.本发明实施例提供的基于专有名词的问题答复方法及装置,能够接收客户端发送的询问请求,询问请求包括咨询问题,若基于专有名词清单判断获知咨询问题包括专有名词,则根据咨询问题包括的专有名词查询对应的相关信息作为咨询问题的回复信息,向客户端返回咨询问题的回复信息,由于能够基于咨询问题包括的专有名词返回专有名词的相关信息,提高了咨询问题答复的准确性。
附图说明
17.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
18.图1是本发明第一实施例提供的基于专有名词的问题答复方法的流程示意图。
19.图2是本发明第二实施例提供的基于专有名词的问题答复方法的流程示意图。
20.图3是本发明第三实施例提供的基于专有名词的问题答复方法的流程示意图。
21.图4是本发明第四实施例提供的基于专有名词的问题答复方法的流程示意图。
22.图5是本发明第五实施例提供的基于专有名词的问题答复方法的流程示意图。
23.图6是本发明第六实施例提供的基于专有名词的问题答复方法的流程示意图。
24.图7是本发明第七实施例提供的基于专有名词的问题答复方法的流程示意图。
25.图8是本发明第八实施例提供的基于专有名词的问题答复方法的流程示意图。
26.图9是本发明第九实施例提供的基于专有名词的问题答复装置的结构示意图。
27.图10是本发明第十实施例提供的基于专有名词的问题答复装置的结构示意图。
28.图11是本发明第十一实施例提供的基于专有名词的问题答复装置的结构示意图。
29.图12是本发明第十二实施例提供的基于专有名词的问题答复装置的结构示意图。
30.图13是本发明第十三实施例提供的基于专有名词的问题答复装置的结构示意图。
31.图14是本发明第十四实施例提供的基于专有名词的问题答复装置的结构示意图。
32.图15是本发明第十五实施例提供的电子设备的实体结构示意图。
具体实施方式
33.为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互任意组合。
34.为了便于理解本技术提供的技术方案,下面先对本技术技术方案的相关内容进行说明。
35.通常情况下,基础问题往往无法覆盖所有专有名词,比如,基础问题包括“中短债开放净值型理财产品起购金额多少?”不包括“长债开放净值型理财产品起购金额多少?”,此时如果客户咨询“长债开放净值型理财产品起购金额多少?”,可能会把基础问题里相似度最高的“中短债开放净值型理财产品起购金额多少?”的回答返回,导致回复出错。
36.本发明针对现有技术不擅长处理包括专有名词的问题的缺点,尤其是专有名词的长度较长(超过15个字)的专有名词的问题,提出一种基于专有名词的问题答复方法,从客户的咨询问题中识别出专有名词,然后根据专有名词查询专有名词对应的相关信息作为咨询问题的回复信息,避免了咨询问题与基础问题进行相似度匹配时的错误匹配,提高了对于包括专有名词的问题答复的准确性。
37.下面以服务器作为执行主体对本发明实施例提供的基于专有名词的问题答复方法的具体实现过程进行说明。
38.图1是本发明第一实施例提供的基于专有名词的问题答复方法的流程示意图,如图1所示,本发明实施例提供的基于专有名词的问题答复方法,包括:
39.s101、接收客户端发送的询问请求,所述询问请求包括咨询问题;
40.具体地,客户想咨询问题时,可以通过客户端向服务器发送询问请求,所述询问请求包括咨询问题。所述服务器会接收所述咨询请求。其中,所述客户端包括但不限于台式机、笔记本电脑、智能手机、平板电脑等设备。
41.例如,客户a想咨询:长债开放净值型理财产品起购金额多少,客户a可以在智能手机的银行app的智能客服的提问页面,输入上述咨询问题。智能手机会向手机银行服务器发送携带上述咨询问题的询问请求,手机银行服务器会接收所述询问请求。
42.s102、若基于专有名词清单判断获知所述咨询问题包括专有名词,则根据所述咨询问题包括的专有名词查询对应的相关信息作为所述咨询问题的回复信息;其中,所述专有名词清单是预先获得的;
43.具体地,所述服务器接收到所述询问请求之后,会基于专有名词清单判断所述咨询问题是否包括专有名词,即遍历所述专有名词清单中的每个专有名词,检测所述咨询问题是否包括所述专有名词清单中的专有名词,如果所述咨询问题包括所述专有名词清单中的词,那么所述咨询问题包括专有名词,所述服务器会根据所述咨询问题包括的专有名词查询对应的相关信息,并将查询获得的所述咨询问题包括的专有名词对应的相关信息作为所述咨询问题的回复信息。如果所述咨询问题不包括所述专有名词清单中的任何一个词,那么所述咨询问题不包括专有名词。其中,所述专有名词清单是预先获得的,包括各个专有名词以及专有名词的别称。所述专有名词清单包括的每个专有名词对应的相关信息是预设的,根据实际需要进行设置,本发明实施例不做限定。
44.例如,专有名词为某特定理财产品的全称,设置某特定理财产品的全称对应的相关信息为理财产品的期限、收益、起购金额等该理财产品的全量信息。
45.s103、向所述客户端返回所述咨询问题的回复信息。
46.具体地,所述服务器在获得所述咨询问题的回复信息之后,将所述咨询问题的回复信息返回给所述客户端,以便客户查看。
47.本发明实施例提供的基于专有名词的问题答复方法,能够接收客户端发送的询问请求,询问请求包括咨询问题,若基于专有名词清单判断获知咨询问题包括专有名词,则根据咨询问题包括的专有名词查询对应的相关信息作为咨询问题的回复信息,向客户端返回咨询问题的回复信息,由于能够基于咨询问题包括的专有名词返回专有名词的相关信息,提高了咨询问题答复的准确性。
48.在上述各实施例的基础上,进一步地,所述若基于专有名词清单判断获知所述咨
询问题包括专有名词包括:
49.若判断获知所述咨询问题包括所述专有名词清单中的一个专有名词的本体词或者分身词,则确定所述咨询问题包括专有名词;其中,所述专有名词清单包括专有名词的本体词和分身词。
50.具体地,所述服务器遍历所述专有名词清单中的每个专有名词的本体词和分身词,扫描咨询问题中是否包括专有名词的本体词或者分身词,如果咨询问题包括专有名词的本体词或者分身词,那么确定所述咨询问题包括专有名词。其中,所述专有名词清单包括专有名词的本体词和分身词。本体词是指专有名词的全称,分身词是指专有名词的别称,每个专有名词只有一个全称,但可以有1个或者多个别称。分身词可以是本体词的简略名字、相近描述等。
51.例如,某个银行理财产品的本体词为:工银理财
·
鑫添益私银尊享中短债每日开放净值型理财产品19gs2815。上述银行理财产品可以有如下多个分身词:
52.分身词1:工银理财
·
鑫添益私银尊享中短债每日开放净值型理财产品
53.分身词2:鑫添益私银尊享中短债每日开放净值型理财产品
54.分身词3:私银尊享中短债每日开放净值型理财产品
55.分身词4:中短债每日开放净值型理财产品19gs2815
56.分身词5:中短债每日开放净值型理财产品
57.专有名词的本体词和分身词可以通过专业业务词库获取,也可以从实际咨询问题中提取。专业业务词库比如理财产品名称库,标准业务名称词库等。
58.图2是本发明第二实施例提供的基于专有名词的问题答复方法的流程示意图,如图2所示,在上述各实施例的基础上,进一步地,本发明实施例提供的基于专有名词的问题答复方法还包括:
59.s201、若基于专有名词清单判断获知所述咨询问题不包括专有名词,则对咨询问题进行分词,获得所述咨询问题对应的词汇;
60.具体地,所述服务器基于专有名词清单判断所述咨询问题是否包括专有名词,如果所述咨询问题不包括所述专有名词清单中的任何一个词,那么所述咨询问题不包括专有名词。所述服务器对所述咨询问题进行分词,能够获得所述咨询问题对应的词汇。分词可以采用分词工具实现,比如jieba分词工具、pkuseg分词工具、thulac分词工具等,根据实际需要进行选择,本发明实施例不做限定。
61.s202、对所述咨询问题对应的词汇进行实体识别,获得所述咨询问题对应的实体;
62.具体地,服务器对咨询问题对应的词汇进行实体识别,从所述咨询问题对应的词汇中识别出实体,获得所述咨询问题对应的实体。其中,在本发明实施例中,实体是指专有名词清单以外的专有名词,比如人名、地名、国家名、日期等,根据实际需要进行设置,本发明实施例不做限定。
63.例如,可以预先建立实体词库,在对所述咨询问题对应的词汇进行实体识别时,将所述咨询问题对应的词汇中的每个词与实体词库中的每个专有名词进行比较,如果所述咨询问题对应的词汇中的某个词与实体词库中的一个专有名词相同,那么与实体词库中专有名词相同的词作为实体。如果所述咨询问题对应的词汇中的某个词与实体词库中的任何一个专有名词都不相同,那么该词不作为实体。
64.s203、对所述咨询问题对应的剩余词汇进行词性过滤,获得所述咨询问题对应的名词和动词;其中,所述咨询问题对应的剩余词汇是指所述咨询问题对应的词汇中去除所述咨询问题对应的实体之后剩余的词汇;
65.具体地,所述服务器在识别出所述咨询问题对应的实体之后,将所述咨询问题对应的实体从所述咨询问题对应的词汇中去除,获得所述咨询问题对应的剩余词汇,然后对所述咨询问题对应的剩余词汇进行词性过滤,保留所述咨询问题对应的剩余词汇中的名词和动词,过滤掉名词和动词以外的其他词汇,可以获得所述咨询问题对应的名词和动词。
66.例如,分词工具通常具有词性标注功能,可以先通过分词工具的词性标注功能将所述咨询问题对应的词汇中的每个词进行词性标注,然后保留动词和名词作为所述咨询问题对应的名词和动词。
67.s204、根据所述咨询问题对应的实体以及所述咨询问题对应的名词和动词,获得所述咨询问题对应的句子向量;
68.具体地,所述服务器可以获取所述咨询问题对应的实体中每个实体对应的词向量,所述咨询问题对应的名词中每个名词对应的词向量以及所述咨询问题对应的动词中每个动词对应的词向量,然后将上述实体对应的词向量、名词对应的词向量以及动词对应的词向量相加,可以获得所述咨询问题对应的句子向量。其中,将词转换成向量可以通过word2vec模型实现,word2vec模型为一种词向量模型,用于将词映射为一个向量。
69.s205、根据所述咨询问题对应的句子向量以及各个基础问题对应的句子向量,获得与所述咨询问题匹配的第一基础问题;其中,各个基础问题对应的句子向量是预先获得的;
70.具体地,所述服务器将所述咨询问题对应的句子向量与每个基础问题对应的句子向量进行比较,获得与所述咨询问题的相似度最高的基础问题作为与所述咨询问题匹配的第一基础问题。其中,每个基础问题对应的句子向量是预先获得的,基础问题是预先设置的,存储到基础问答库中。
71.例如,可以计算咨询问题对应的句子向量与基础问题对应的句子向量的余弦相似度,作为咨询问题与基础问题的相似度。
72.s206、从基础问答库中获取与所述咨询问题匹配的第一基础问题对应的答案,作为所述咨询问题的回复信息。
73.具体地,所述服务器在获得与所述咨询问题匹配的第一基础问题之后,从基础问答库中查询与所述咨询问题匹配的第一基础问题对应的答案,作为所述咨询问题的回复信息。其中,所述基础问答库是预设的,包括多个问答对,每个问答对包括一个基础问题以及基础问题对应的答案。
74.本发明实施例提供的基于专有名词的问题答复方法,通过实体匹配以及保留问题中的动词和名词,保留能够表达问题意图的关键词进行问题匹配,排除一部分干扰词,提高了咨询问题的回复信息的准确性。
75.图3是本发明第三实施例提供的基于专有名词的问题答复方法的流程示意图,如图3所示,在上述各实施例的基础上,进一步地,本发明实施例提供的基于专有名词的问题答复方法还包括:
76.s301、若判断获知所述咨询问题对应的动词的数量大于1,则从所述咨询问题对应
的动词中筛选出一个动词作为所述咨询问题的关键动词;
77.具体地,所述服务器统计所述咨询问题对应的动词的数量,如果所述咨询问题对应的动词的数量大于1,即所述咨询问题对应的动词的数量大于等于2。此时,由于存在多个动词,在后续与基础问题进行匹配时,存在相似度最高的基础问题对应的答案不是期望的答案的情况。所述服务器可以从所述咨询问题对应的动词中筛选出一个动词作为所述咨询问题的关键动词。筛选动词的具体过程详见下文所述,此处不进行赘述。
78.s302、根据所述咨询问题对应的名词以及所述咨询问题的关键动词,按照统一句型生成所述咨询问题对应的标准问句;其中,所述统一句型是预设的;
79.具体地,所述服务器根据所述咨询问题对应的实体、所述咨询问题对应的名词以及所述咨询问题的关键动词,按照统一句型生成所述咨询问题对应的标准问句。其中,所述统一句型是预设的。
80.例如,所述统一句型为实体和/或名词+“如何”+关键动词,咨询问题对应的实体和咨询问题对应的名词有多个时,咨询问题对应的实体和咨询问题对应的名词在统一句型中的排列顺序与咨询问题对应的实体和咨询问题在咨询问题中的顺序相同。
81.s303、根据所述咨询问题对应的标准问句以及各个基础问题对应的标准问句,获得与所述咨询问题匹配的第二基础问题;其中,各个基础问题对应的标准问句是预先获得的;
82.具体地,所述服务器将所述咨询问题对应的标准问句转换成所述咨询问题对应的标准问句向量,并将所述每个基础问题对应的标准问句转换成基础问题对应的标准问句向量,计算所述匹配问题对应的标准问句向量与每个基础问题对应的标准问句向量的余弦相似度,将与咨询问题相似度最高的基础问题作为与所述咨询问题匹配的第二基础问题。其中,各个基础问题对应的标准问句是预先获得的,每个基础问题对应的标准问句的具体获得过程与所述咨询问题对应的标准问句的获得过程类似。
83.s304、从所述基础问答库中获取与所述咨询问题匹配的第二基础问题对应的答案,作为所述咨询问题的回复信息。
84.具体地,所述服务器在获得与所述咨询问题匹配的第二基础问题之后,从基础问答库中查询与所述咨询问题匹配的第二基础问题对应的答案,作为所述咨询问题的回复信息。
85.本发明实施例提供的基于专有名词的问题答复方法,从多个动词中筛选出一个动词,保留能够表达问题意图的关键动词进行问题匹配,进一步排除干扰动词,提高了咨询问题的回复信息的准确性。
86.图4是本发明第四实施例提供的基于专有名词的问题答复方法的流程示意图,如图4所示,在上述各实施例的基础上,进一步地,预先获得各个基础问题对应的标准问句的步骤包括:
87.s401、对基础问题进行分词,获得基础问题对应的词汇;
88.具体地,所述服务器从所述基础问答库中的获取一个基础问题,并对基础问题进行分词,获得基础问题对应的词汇。
89.s402、对基础问题对应的词汇进行实体识别,获得基础问题对应的实体;
90.具体地,服务器对基础问题对应的词汇进行实体识别,从基础问题对应的词汇中
识别出实体,获得基础问题对应的实体。
91.s403、对基础问题对应的剩余词汇进行词性过滤,获得基础问题对应的名词和动词;其中,基础问题对应的剩余词汇是指基础问题对应的词汇中去除基础问题对应的实体之后剩余的词汇;
92.具体地,所述服务器在识别出基础问题对应的实体之后,将基础问题对应的实体从基础问题对应的词汇中去除,获得基础问题对应的剩余词汇,然后对基础问题对应的剩余词汇进行词性过滤,保留基础问题对应的剩余词汇中的名词和动词,过滤掉名词和动词以外的其他词汇,可以获得基础问题对应的名词和动词。
93.s404、若判断获知基础问题对应的动词的数量大于1,则从所述基础问题对应的动词中筛选出一个动词作为所述基础问题的关键动词;
94.具体地,所述服务器统计基础问题对应的动词的数量,如果基础问题对应的动词的数量大于1可以从基础问题对应的动词中筛选出一个动词作为基础问题的关键动词。筛选动词的具体过程详见下文所述,此处不进行赘述。
95.s405、根据所述基础问题对应的实体、基础问题对应的名词以及基础问题的关键动词,按照统一句型生成基础问题对应的标准问句。
96.具体地,所述服务器根据基础问题对应的实体、基础问题对应的名词以及基础问题的关键动词,按照统一句型生成基础问题对应的标准问句。其中,所述统一句型是预设的。
97.遍历所述基础问答库中的每个基础问题,重复步骤s401、步骤s402、步骤s403、步骤s404和步骤s405,最终可以获得所述基础问答库中的每个基础问题对应的标准问句。
98.图5是本发明第五实施例提供的基于专有名词的问题答复方法的流程示意图,如图5所示,在上述各实施例的基础上,进一步地,从目标问题对应的动词中筛选出一个动词作为所述目标问题的关键动词包括:
99.s501、获取所述目标问题对应的动词中每个动词的平均tf-idf分数;其中,每个动词的平均tf-idf分数是基于基础问答库预先获得的;所述目标问题为所述咨询问题或者基础问题;
100.具体地,所述服务器可以根据所述目标问题对应的动词中的每个动词,查询获得所述目标问题对应的动词中的每个动词的平均tf-idf(term frequency

inverse document frequency)分数。其中,每个动词的平均tf-idf分数是基于基础问答库预先获得的。所述目标问题为所述咨询问题或者基础问题,从所述咨询问题对应的动词中筛选出关键动词的过程与从基础问题对应的动词中筛选出关键动词的过程类似。
101.s502、获取平均tf-idf分数最大的动词作为所述目标问题对应的关键动词。
102.具体地,所述服务器将所述目标问题对应的动词中的各个动词的平均tf-idf分数进行比较,将平均tf-idf分数最大的动词作为所述目标问题对应的关键动词。
103.图6是本发明第六实施例提供的基于专有名词的问题答复方法的流程示意图,如图6所示,在上述各实施例的基础上,进一步地,基于基础问答库获得每个动词的平均tf-idf分数包括:
104.s601、根据所述基础问答库中每个问答对,获得每个问答对应的动词中每个动词的词频和逆向文件频率;
105.具体地,对于所述基础问答库中的每个问答对,所述服务器会根据问答对包括的基础问题以及基础问题对应的答案,计算出问答对对应的动词中每个动词的词频和逆向文件频率。
106.例如,基础问答库的一个问答对包括基础问题:银行卡如何注销?以及基础问题对应的答案:银行卡可以前往当地网点注销,也可以通过网银、手机银行进行注销;如果超过5年不使用,会自动注销。
107.上述问答对中,词汇总数为25,基础问题对应的动词注销出现了4次,注销的词频tf为4/25=0.16;假如基础问答库包括的问答对的数量为100000,其中有10个问答对出现“注销”这个词,那么注销的逆向文件频率idf为lg(100000/10)=4。
108.s602、根据每个问答对对应的动词中每个动词的词频和逆向文件频率,获得每个问答对对应的动词中每个动词的tf-idf分数;
109.具体地,对于问答对对应的动词中的每个动词,所述服务器可以计算动词的词频和逆向文件频率的乘积的结果作为动词的tf-idf分数。
110.例如,所述服务器计算出一个问答对包括动词申请的tf为0.16,申请的idf为3,那么该问答对对应的申请的tf-idf分数为0.16
×
3=0.48。
111.s603、根据每个动词的各个tf-idf分数,获得每个动词的平均tf-idf分数。
112.具体地,对于一个动词,在不同的问答对中出现,就会有多个tf-idf分数。所述服务器计算动词的各个tf-idf分数平均值,可以获得动词的平均tf-idf分数。对于所述基础问答库中各个问答对中出现的动词,可以计算出每个动词的平均tf-idf分数。
113.例如,所述基础问答库中有10个问答对中出现“申请”这个动词,“申请”这个动词的10个tf-idf分数分别为:0.1,0.2,0.3,0.4,0.5,0.5,0.4,0.3,0.2,0.1,那么“申请”这个动词的平均tf-idf分数为(0.1+0.2+0.3+0.4+0.5+0.5+0.4+0.3+0.2+0.1)/10=0.3。
114.图7是本发明第七实施例提供的基于专有名词的问题答复方法的流程示意图,如图7所示,在上述各实施例的基础上,进一步地,预先获得各个基础问题对应的句子向量的步骤包括:
115.s701、对基础问题进行分词,获得基础问题对应的词汇;
116.具体地,所述服务器从所述基础问答库中获取一个基础问题,并对基础问题进行分词,获得基础问题对应的词汇。
117.s702、对基础问题对应的词汇进行实体识别,获得基础问题对应的实体;
118.具体地,服务器对基础问题对应的词汇进行实体识别,从基础问题对应的词汇中识别出实体,获得基础问题对应的实体。
119.s703、对基础问题对应的剩余词汇进行词性过滤,获得基础问题对应的名词和动词;其中,基础问题对应的剩余词汇是指基础问题对应的词汇中去除基础问题对应的实体之后剩余的词汇;
120.具体地,所述服务器在识别出基础问题对应的实体之后,将基础问题对应的实体从基础问题对应的词汇中去除,获得基础问题对应的剩余词汇,然后对基础问题对应的剩余词汇进行词性过滤,保留基础问题对应的剩余词汇中的名词和动词,过滤掉名词和动词以外的其他词汇,可以获得基础问题对应的名词和动词。
121.s704、根据基础问题对应的实体以及基础问题对应的名词和动词,获得基础问题
对应的句子向量。
122.具体地,所述服务器可以获取基础问题对应的实体中每个实体对应的向量,基础问题对应的名词中每个名词对应的向量以及基础问题对应的动词中每个动词对应的向量,然后将上述实体对应的向量、名词对应的向量以及动词对应的向量相加,可以获得基础问题对应的句子向量。
123.遍历所述基础问答库中的每个基础问题,重复步骤s701、步骤s702、步骤s703和步骤s704,最终可以获得所述基础问答库中的每个基础问题对应的标准问句。
124.图8是本发明第八实施例提供的基于专有名词的问题答复方法的流程示意图,如图8所示,在上述各实施例的基础上,进一步地,所述根据所述咨询问题对应的实体以及所述咨询问题对应的名词和动词,获得所述咨询问题对应的句子向量包括:
125.s801、获得所述咨询问题对应的实体的词向量,所述咨询问题对应的名词的词向量和所述咨询问题对应的动词的词向量;
126.具体地,所述服务器将所述咨询问题对应的实体中的每个实体转换成所述咨询问题对应的实体中的每个实体对应的词向量,将所述咨询问题对应的名词中每个名词对应的词向量,并将所述咨询问题对应的动词中每个动词对应的词向量。
127.s802、按照所述咨询问题对应的实体、所述咨询问题对应的名词以及所述咨询问题对应的动词在所述咨询问题中的位置,将所述咨询问题对应的实体的词向量,所述咨询问题对应的名词的词向量和所述咨询问题对应的动词的词向量相加,获得所述咨询问题对应的句子向量。
128.具体地,所述服务器按照所述咨询问题对应的实体、所述咨询问题对应的名词以及所述咨询问题对应的动词在所述咨询问题中的位置,将所述咨询问题对应的实体中的每个实体对应的词向量、所述咨询问题对应的名词中每个名词对应的词向量以及所述咨询问题对应的动词中每个动词对应的词向量相加,可以获得所述咨询问题对应的句子向量。
129.下面以一个具体的实例,对本发明实施例提供的基于专有名词的问题答复方法的具体实现过程进行说明。
130.客户想咨询一下银行某款理财产品的起购金额是多少,在智能手机的银行app的智能客服的提问页面,输入“你好,我想了解一下,固定收益类3个月定期开放型理财产品起购金额多少?”131.智能手机会向手机银行服务器发送询问请求,上述询问请求包括咨询问题:你好,我想了解一下,固定收益类3个月定期开放型理财产品起购金额多少?
132.手机银行服务器接收到上述咨询问题,基于专有名词清单判断上述咨询问题是否包括专有名词的本体词或者分身词,判断出上述咨询问题包括的【固定收益类3个月定期开放型理财产品】,是专有名词清单中实体词【工银理财
·
鑫稳利私银尊享固定收益类3个月定期开放型理财产品19gs2818】的一个分身词。手机银行服务器会查询实体词【工银理财
·
鑫稳利私银尊享固定收益类3个月定期开放型理财产品19gs2818】对应的相关信息,包括起购金额、开始购买时间、收益计算方法等信息。
133.手机银行服务器将实体词【工银理财
·
鑫稳利私银尊享固定收益类3个月定期开放型理财产品19gs2818】对应的相关信息,作为上述咨询问题的回复信息发送给智能手机。智能手机会在智能客服的提问页面显示上述咨询问题的回复信息,供客户查看。
134.可以通过接口调用实现本体词对应的相关信息的查询,可以将实体词作为接口入参,接口返回本体词对应的相关信息,相对于通过相似度匹配基础问题获得回复信息的方式准确性更高。尤其是对于本体词或者分身词的长度超过15个字的咨询问题,回复更加准确。
135.下面以另一个具体的实例,对本发明实施例提供的基于专有名词的问题答复方法的具体实现过程进行说明。
136.客户想咨询一下股票型基金申购的手续费如何计算,在智能手机的银行app的智能客服的提问页面,输入“你好,我想了解一下,股票型基金申购的手续费如何计算?”137.智能手机会向手机银行服务器发送询问请求,上述询问请求包括咨询问题:你好,我想了解一下,股票型基金申购的手续费如何计算?
138.手机银行服务器接收到上述咨询问题,基于专有名词清单判断上述咨询问题是否包括专有名词的本体词或者分身词,判断出上述咨询问题不包括专有名词清单中的任何一个本体词和分身词,那么会对上述咨询问题进行分词,获得上述咨询问题对应的词汇,然后对上述咨询问题对应的词汇进行实体识别,获得上述咨询问题对应的实体为:【股票型基金】,然后从上述咨询问题对应的词汇中去除【股票型基金】,再进行词性标注,并保留名词和动词,获得上述咨询问题对应的名词为:【手续费】,获得上述咨询问题对应的动词为:【想】、【了解】、【申购】、【计算】。
139.服务器根据上述咨询问题对应的实体以及上述咨询问题对应的名词和动词,获得上述咨询问题对应的句子向量;然后根据上述咨询问题对应的句子向量以及基础问答库中各个基础问题对应的句子向量,获得上述咨询问题匹配的基础问题:“股票型基金申购的手续费如何计算?”。基础问题对应的答案作为上述咨询问题对应的回复信息。
140.图9是本发明第九实施例提供的基于专有名词的问题答复装置的结构示意图,如图9所示,本发明实施例提供的基于专有名词的问题答复装置包括接收模块901、查询模块902和返回模块903,其中:
141.接收模块901用于接收客户端发送的询问请求,所述询问请求包括咨询问题;查询模块902用于在基于专有名词清单判断获知所述咨询问题包括专有名词之后,根据所述咨询问题包括的专有名词查询对应的相关信息作为所述咨询问题的回复信息;其中,所述专有名词清单是预先获得的;返回模块903用于向所述客户端返回所述咨询问题的回复信息。
142.具体地,客户想咨询问题时,可以通过客户端向接收模块901发送询问请求,所述询问请求包括咨询问题。接收模块901会接收所述咨询请求。其中,所述客户端包括但不限于台式机、笔记本电脑、智能手机、平板电脑等设备。
143.接收到所述询问请求之后,查询模块902会基于专有名词清单判断所述咨询问题是否包括专有名词,即遍历所述专有名词清单中的每个专有名词,检测所述咨询问题是否包括所述专有名词清单中的专有名词,如果所述咨询问题包括所述专有名词清单中的词,那么所述咨询问题包括专有名词,查询模块902会根据所述咨询问题包括的专有名词查询对应的相关信息,并将查询获得的所述咨询问题包括的专有名词对应的相关信息作为所述咨询问题的回复信息。如果所述咨询问题不包括所述专有名词清单中的任何一个词,那么所述咨询问题不包括专有名词。其中,所述专有名词清单是预先获得的,包括各个专有名词以及专有名词的别称。所述专有名词清单包括的每个专有名词对应的相关信息是预设的,
根据实际需要进行设置,本发明实施例不做限定。
144.返回模块903在获得所述咨询问题的回复信息之后,将所述咨询问题的回复信息返回给所述客户端,以便客户查看。
145.本发明实施例提供的基于专有名词的问题答复装置,能够接收客户端发送的询问请求,询问请求包括咨询问题,若基于专有名词清单判断获知咨询问题包括专有名词,则根据咨询问题包括的专有名词查询对应的相关信息作为咨询问题的回复信息,向客户端返回咨询问题的回复信息,由于能够基于咨询问题包括的专有名词返回专有名词的相关信息,提高了咨询问题答复的准确性。
146.在上述各实施例的基础上,进一步地,查询模块902具体用于
147.若判断获知所述咨询问题包括所述专有名词清单中的一个专有名词的本体词或者分身词,则确定所述咨询问题包括专有名词;其中,所述专有名词清单包括专有名词的本体词和分身词。
148.图10是本发明第十实施例提供的基于专有名词的问题答复装置的结构示意图,如图10所示,在上述各实施例的基础上,进一步地,本发明实施例提供的基于专有名词的问题答复装置还包括第一分词模块904、第一实体识别模块905、第一词性过滤模块906、第一获得模块907、第二获得模块908和第一获取模块909,其中:
149.第一分词模块904用于若基于专有名词清单判断获知所述咨询问题不包括专有名词,则对咨询问题进行分词,获得所述咨询问题对应的词汇;第一实体识别模块905用于对所述咨询问题对应的词汇进行实体识别,获得所述咨询问题对应的实体;第一词性过滤模块906用于对所述咨询问题对应的剩余词汇进行词性过滤,获得所述咨询问题对应的名词和动词;其中,所述咨询问题对应的剩余词汇是指所述咨询问题对应的词汇中去除所述咨询问题对应的实体之后剩余的词汇;第一获得模块907用于根据所述咨询问题对应的实体以及所述咨询问题对应的名词和动词,获得所述咨询问题对应的句子向量;第二获得模块908用于根据所述咨询问题对应的句子向量以及各个基础问题对应的句子向量,获得与所述咨询问题匹配的第一基础问题;其中,各个基础问题对应的句子向量是预先获得的;第一获取模块909从基础问答库中获取与所述咨询问题匹配的第一基础问题对应的答案,作为所述咨询问题的回复信息。
150.图11是本发明第十一实施例提供的基于专有名词的问题答复装置的结构示意图,如图11所示,在上述各实施例的基础上,进一步地,本发明实施例提供的基于专有名词的问题答复装置还包括第一筛选模块910、第一生成模块911、第三获得模块912和第二获取模块913,其中:
151.第一筛选模块910用于若判断获知所述咨询问题对应的动词的数量大于1,则从所述咨询问题对应的动词中筛选出一个动词作为所述咨询问题的关键动词;第一生成模块911用于根据所述咨询问题对应的名词以及所述咨询问题的关键动词,按照统一句型生成所述咨询问题对应的标准问句;其中,所述统一句型是预设的;第三获得模块912用于根据所述咨询问题对应的标准问句以及各个基础问题对应的标准问句,获得与所述咨询问题匹配的第二基础问题;其中,各个基础问题对应的标准问句是预先获得的;第二获取模块913用于从所述基础问答库中获取与所述咨询问题匹配的第二基础问题对应的答案,作为所述咨询问题的回复信息。
152.图12是本发明第十二实施例提供的基于专有名词的问题答复装置的结构示意图,如图12所示,在上述各实施例的基础上,进一步地,本发明实施例提供的基于专有名词的问题答复装置还包括第二分词模块914、第二实体识别模块915、第二词性过滤模块916、第二筛选模块917和第二生成模块918,其中:
153.第二分词模块914用于对基础问题进行分词,获得基础问题对应的词汇;第二实体识别模块915用于对基础问题对应的词汇进行实体识别,获得基础问题对应的实体;第二词性过滤模块916用于对基础问题对应的剩余词汇进行词性过滤,获得基础问题对应的名词和动词;其中,基础问题对应的剩余词汇是指基础问题对应的词汇中去除基础问题对应的实体之后剩余的词汇;第二筛选模块917用于若判断获知基础问题对应的动词的数量大于1,则从所述基础问题对应的动词中筛选出一个动词作为所述基础问题的关键动词;第二生成模块918用于根据所述基础问题对应的实体、基础问题对应的名词以及基础问题的关键动词,按照统一句型生成基础问题对应的标准问句。
154.图13是本发明第十三实施例提供的基于专有名词的问题答复装置的结构示意图,如图13所示,在上述各实施例的基础上,进一步地,本发明实施例提供的基于专有名词的问题答复装置还包括第三分词模块919、第三实体识别模块920、第三词性过滤模块921和第四获得模块922,其中:
155.第三分词模块919用于对基础问题进行分词,获得基础问题对应的词汇;第三实体识别模块920用于对基础问题对应的词汇进行实体识别,获得基础问题对应的实体;第三词性过滤模块921用于对基础问题对应的剩余词汇进行词性过滤,获得基础问题对应的名词和动词;其中,基础问题对应的剩余词汇是指基础问题对应的词汇中去除基础问题对应的实体之后剩余的词汇;第四获得模块922用于根据基础问题对应的实体以及基础问题对应的名词和动词,获得基础问题对应的句子向量。
156.图14是本发明第十四实施例提供的基于专有名词的问题答复装置的结构示意图,如图14所示,在上述各实施例的基础上,进一步地,第一获得模块907包括第一获得单元9071和第二获得单元9072,其中:
157.第一获得单元9071用于获得所述咨询问题对应的实体的词向量,所述咨询问题对应的名词的词向量和所述咨询问题对应的动词的词向量;第二获得单元9072用于按照所述咨询问题对应的实体、所述咨询问题对应的名词以及所述咨询问题对应的动词在所述咨询问题中的位置,将所述咨询问题对应的实体的词向量,所述咨询问题对应的名词的词向量和所述咨询问题对应的动词的词向量相加,获得所述咨询问题对应的句子向量。
158.本发明实施例提供的装置的实施例具体可以用于执行上述各方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
159.需要说明的是,本发明实施例提供的基于专有名词的问题答复方法及装置可用于金融领域,也可用于除金融领域之外的任意技术领域,本发明实施例对基于专有名词的问题答复方法及装置的应用领域不做限定。
160.图15是本发明第十五实施例提供的电子设备的实体结构示意图,如图15所示,该电子设备可以包括:处理器(processor)1501、通信接口(communications interface)1502、存储器(memory)1503和通信总线1504,其中,处理器1501,通信接口1502,存储器1503通过通信总线1504完成相互间的通信。处理器1501可以调用存储器1503中的逻辑指令,以
执行如下方法:接收客户端发送的询问请求,所述询问请求包括咨询问题;若基于专有名词清单判断获知所述咨询问题包括专有名词,则根据所述咨询问题包括的专有名词查询对应的相关信息作为所述咨询问题的回复信息;其中,所述专有名词清单是预先获得的;向所述客户端返回所述咨询问题的回复信息。
161.此外,上述的存储器1503中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
162.本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:接收客户端发送的询问请求,所述询问请求包括咨询问题;若基于专有名词清单判断获知所述咨询问题包括专有名词,则根据所述咨询问题包括的专有名词查询对应的相关信息作为所述咨询问题的回复信息;其中,所述专有名词清单是预先获得的;向所述客户端返回所述咨询问题的回复信息。
163.本实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,所述计算机程序使所述计算机执行上述各方法实施例所提供的方法,例如包括:接收客户端发送的询问请求,所述询问请求包括咨询问题;若基于专有名词清单判断获知所述咨询问题包括专有名词,则根据所述咨询问题包括的专有名词查询对应的相关信息作为所述咨询问题的回复信息;其中,所述专有名词清单是预先获得的;向所述客户端返回所述咨询问题的回复信息。
164.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
165.本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
166.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
167.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
168.在本说明书的描述中,参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
169.以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:


1.一种基于专有名词的问题答复方法,其特征在于,包括:接收客户端发送的询问请求,所述询问请求包括咨询问题;若基于专有名词清单判断获知所述咨询问题包括专有名词,则根据所述咨询问题包括的专有名词查询对应的相关信息作为所述咨询问题的回复信息;其中,所述专有名词清单是预先获得的;向所述客户端返回所述咨询问题的回复信息。2.根据权利要求1所述的方法,其特征在于,所述若基于专有名词清单判断获知所述咨询问题包括专有名词包括:若判断获知所述咨询问题包括所述专有名词清单中的一个专有名词的本体词或者分身词,则确定所述咨询问题包括专有名词;其中,所述专有名词清单包括专有名词的本体词和分身词。3.根据权利要求1或2所述的方法,其特征在于,还包括:若基于专有名词清单判断获知所述咨询问题不包括专有名词,则对咨询问题进行分词,获得所述咨询问题对应的词汇;对所述咨询问题对应的词汇进行实体识别,获得所述咨询问题对应的实体;对所述咨询问题对应的剩余词汇进行词性过滤,获得所述咨询问题对应的名词和动词;其中,所述咨询问题对应的剩余词汇是指所述咨询问题对应的词汇中去除所述咨询问题对应的实体之后剩余的词汇;根据所述咨询问题对应的实体以及所述咨询问题对应的名词和动词,获得所述咨询问题对应的句子向量;根据所述咨询问题对应的句子向量以及各个基础问题对应的句子向量,获得与所述咨询问题匹配的第一基础问题;其中,各个基础问题对应的句子向量是预先获得的;从基础问答库中获取与所述咨询问题匹配的第一基础问题对应的答案,作为所述咨询问题的回复信息。4.根据权利要求3所述的方法,其特征在于,还包括:若判断获知所述咨询问题对应的动词的数量大于1,则从所述咨询问题对应的动词中筛选出一个动词作为所述咨询问题的关键动词;根据所述咨询问题对应的名词以及所述咨询问题的关键动词,按照统一句型生成所述咨询问题对应的标准问句;其中,所述统一句型是预设的;根据所述咨询问题对应的标准问句以及各个基础问题对应的标准问句,获得与所述咨询问题匹配的第二基础问题;其中,各个基础问题对应的标准问句是预先获得的;从所述基础问答库中获取与所述咨询问题匹配的第二基础问题对应的答案,作为所述咨询问题的回复信息。5.根据权利要求4所述的方法,其特征在于,预先获得各个基础问题对应的标准问句的步骤包括:对基础问题进行分词,获得基础问题对应的词汇;对基础问题对应的词汇进行实体识别,获得基础问题对应的实体;对基础问题对应的剩余词汇进行词性过滤,获得基础问题对应的名词和动词;其中,基础问题对应的剩余词汇是指基础问题对应的词汇中去除基础问题对应的实体之后剩余的
词汇;若判断获知基础问题对应的动词的数量大于1,则从所述基础问题对应的动词中筛选出一个动词作为所述基础问题的关键动词;根据所述基础问题对应的实体、基础问题对应的名词以及基础问题的关键动词,按照统一句型生成基础问题对应的标准问句。6.根据权利要求3所述的方法,其特征在于,预先获得各个基础问题对应的句子向量的步骤包括:对基础问题进行分词,获得基础问题对应的词汇;对基础问题对应的词汇进行实体识别,获得基础问题对应的实体;对基础问题对应的剩余词汇进行词性过滤,获得基础问题对应的名词和动词;其中,基础问题对应的剩余词汇是指基础问题对应的词汇中去除基础问题对应的实体之后剩余的词汇;根据基础问题对应的实体以及基础问题对应的名词和动词,获得基础问题对应的句子向量。7.根据权利要求3所述的方法,其特征在于,所述根据所述咨询问题对应的实体以及所述咨询问题对应的名词和动词,获得所述咨询问题对应的句子向量包括:获得所述咨询问题对应的实体的词向量,所述咨询问题对应的名词的词向量和所述咨询问题对应的动词的词向量;按照所述咨询问题对应的实体、所述咨询问题对应的名词以及所述咨询问题对应的动词在所述咨询问题中的位置,将所述咨询问题对应的实体的词向量,所述咨询问题对应的名词的词向量和所述咨询问题对应的动词的词向量相加,获得所述咨询问题对应的句子向量。8.一种基于专有名词的问题答复装置,其特征在于,包括:接收模块,用于接收客户端发送的询问请求,所述询问请求包括咨询问题;查询模块,用于在基于专有名词清单判断获知所述咨询问题包括专有名词之后,根据所述咨询问题包括的专有名词查询对应的相关信息作为所述咨询问题的回复信息;其中,所述专有名词清单是预先获得的;返回模块,用于向所述客户端返回所述咨询问题的回复信息。9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法。11.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法。

技术总结


本发明提供一种基于专有名词的问题答复方法及装置,可用于金融领域或其他技术领域。所述方法包括:接收客户端发送的询问请求,所述询问请求包括咨询问题;若基于专有名词清单判断获知所述咨询问题包括专有名词,则根据所述咨询问题包括的专有名词查询对应的相关信息作为所述咨询问题的回复信息;其中,所述专有名词清单是预先获得的;向所述客户端返回所述咨询问题的回复信息。所述装置用于执行上述方法。本发明实施例提供的基于专有名词的问题答复方法及装置,提高了咨询问题答复的准确性。性。性。


技术研发人员:

周远侠 杨卜菘 杜姗 唐杰聪

受保护的技术使用者:

中国工商银行股份有限公司

技术研发日:

2022.08.26

技术公布日:

2022/11/22

本文发布于:2024-09-20 12:40:48,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/9153.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   专有名词   基础   动词
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议