面向中文领域的非分类关系抽取方法、装置、设备及介质[发明专利]

专利名称:面向中文领域的非分类关系抽取方法、装置、设备及介质
专利类型:发明专利
发明人:仇晶,柴瑜晗,,顾钊铨,李树栋,田志宏,殷丽华
申请号:CN201810788778.1
申请日:20180717
公开号:CN109117477A
公开日:
20190101
专利内容由知识产权出版社提供
摘要:本发明公开一种面向中文领域的非分类关系抽取方法,包括:将包含相同语义信息的术语放到同一集合得到集合对应的概念;根据术语之间的相似度及预设第一阈值构建语义图;抽取术语上下文信息;将语义图和上下文信息输入至网络表示学习方法CANE,得到术语的表示;根据术语的表示计算概念相似度,预设第二阈值,得到强关联概念对;对包含概念对的句子进行依存句法分析,得到概念对相对应的所有动词;删除很少语义信息的动词;将剩余动词中包含相同语义信息的放到同一集合,得到概念对相对应的动词集合;计算动词分数并累加,以得到动词集合总分数;将总分数靠前动词集合作为非分类关系的标注。实现了利用句法信息和语义信息能够得到更好的抽取结果。
申请人:广州大学
地址:510000 广东省广州市番禺广州大学城外环西路230号
国籍:CN
代理机构:广州三环专利商标代理有限公司

本文发布于:2024-09-23 03:12:05,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/405402.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:信息   得到   语义   动词   集合   专利   概念   关系
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议