专利名称:面向中文领域的非分类关系抽取方法、装置、设备及介质
专利类型:发明专利
发明人:仇晶,柴瑜晗,,顾钊铨,李树栋,田志宏,殷丽华
申请号:CN201810788778.1
申请日:20180717
公开号:CN109117477A
公开日:
20190101
专利内容由知识产权出版社提供
摘要:本发明公开一种面向中文领域的非分类关系抽取方法,包括:将包含相同语义信息的术语放到同一集合,得到集合对应的概念;根据术语之间的相似度及预设第一阈值构建语义图;抽取术语上下文信息;将语义图和上下文信息输入至网络表示学习方法CANE,得到术语的表示;根据术语的表示计算概念相似度,预设第二阈值,得到强关联概念对;对包含概念对的句子进行依存句法分析,得到概念对相对应的所有动词;删除很少语义信息的动词;将剩余动词中包含相同语义信息的放到同一集合,得到概念对相对应的动词集合;计算动词分数并累加,以得到动词集合总分数;将总分数靠前动词集合作为非分类关系的标注。实现了利用句法信息和语义信息能够得到更好的抽取结果。 申请人:广州大学
地址:510000 广东省广州市番禺广州大学城外环西路230号
国籍:CN
代理机构:广州三环专利商标代理有限公司