【CN110096573A】一种文本解析方法及相关设备【专利】

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910333278.3
(22)申请日 2019.04.22
(71)申请人 腾讯科技(深圳)有限公司
地址 518057 广东省深圳市南山区高新区
科技中一路腾讯大厦35层
(72)发明人 谢若冰 鲁亚楠 林芬 
(74)专利代理机构 广州三环专利商标代理有限
公司 44202
代理人 郝传鑫 熊永强
(51)Int.Cl.
G06F  16/33(2019.01)
G06F  16/36(2019.01)
G06F  17/27(2006.01)
(54)发明名称
一种文本解析方法及相关设备
(57)摘要
本发明实施例公开了一种文本解析方法及
相关设备,包括:首先当检测到目标文本时,确定
目标文本的主题类型;接着根据所述主题类型,
从预设的多个知识图谱中查目标知识图谱,该
目标知识图谱包括所述主题类型对应的R个文本
片段之间的上下文关系;然后根据目标知识图
谱,确定目标文本中的M个文本片段、以及M个文
本片段之间的上下文关系;最后根据M个文本片
段之间的上下文关系,确定目标文本的语义。采
用本发明实施例,可以提高文本语义解析的精确
性,
从而提高文本匹配效率和准确度。权利要求书3页  说明书20页  附图4页CN 110096573 A 2019.08.06
C N  110096573
A
权 利 要 求 书1/3页CN 110096573 A
1.一种文本解析方法,其特征在于,所述方法包括:
当检测到目标文本时,确定所述目标文本的主题类型;
根据所述主题类型,从预设的多个知识图谱中查目标知识图谱,所述目标知识图谱包括所述主题类型对应的R个文本片段之间的上下文关系,所述R为大于1整数;
根据所述目标知识图谱,确定所述目标文本中的M个文本片段、以及所述M个文本片段之间的上下文关系,所述M为大于1且不大于R的整数;
根据所述M个文本片段之间的上下文关系,确定所述目标文本的语义。
2.如权利要求1所述的方法,其特征在于,所述根据所述目标知识图谱,确定所述目标文本中的M个文本片段包括:
对所述目标文本进行分词处理得到所述目标文本的分词信息,所述分词信息包括所述目标文本中的多个单词;
根据所述目标知识图谱和所述多个单词,确定N个候选文本片段,所述N为不小于M的整数;
确定所述N个候选文本片段中每个候选文本片段的语义信息;
根据所述语义信息,从所述N个候选文本片段中选择所述M个文本片段。
3.如权利要求1所述的方法,其特征在于,所述上下文关系包括第一上下文关系;
所述根据所述目标知识图谱,确定所述M个文本片段之间的上下文关系包括:
确定所述M个文本片段中的第x个文本片段和第y个文本片段之间的匹配信息,所述匹配信息包括文本类型、词性以及位置信息中的至少一项,其中,所述x为不大于M的整数,所述y为不大于M且不等于x的整数;
根据所述目标知识图谱和所述匹配信息,确定所述第x个文本片段和所述第y个文本片段之间是否存在所述第一上下文关系;
当所述第x个文本片段和所述第y个文本片段之间存在所述第一上下文关系时,将所述第一上下文关系存入关系候选集。
4.如权利要求3所述的方法,其特征在于,所述上下文关系包括第二上下文关系;
所述方法还包括:
确定所述第x个文本片段的第一文本类型和所述第y个文本片段的第二文本类型;
根据所述第一文本类型和所述第二文本类型,确定所述第x个文本片段和所述第y个文本片段之间是否存在所述第二上下文关系;
当所述第x个文本片段和所述第y个文本片段之间存在所述第二上下文关系时,将所述第二上下文关系存入所述关系候选集。
5.如权利要求4所述的方法,其特征在于,所述根据所述M个文本片段之间的上下文关系,确定所述目标文本的语义包括:
获取所述目标文本对应的关系消歧信息,所述关系消歧信息包括预设的逻辑推理规则、词权重、所述目标文本的语言模型特征中的至少一项;
根据所述关系消歧信息,从所述关系候选集中选择目标上下文关系;
根据所述目标上下文关系,确定所述目标文本的语义。
6.如权利要求5所述的方法,其特征在于,所述根据所述关系消歧信息,从所述关系候选集中选择目标上下文关系包括:
2

本文发布于:2024-09-20 15:35:33,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/796102.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:文本   目标   关系   包括   信息
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议