科技术语的自动化抽取方法[发明专利]

专利名称:科技术语的自动化抽取方法
专利类型:发明专利
发明人:王进,张素兰,贾学杰,任丽,王永生,张迁,王婷婷申请号:CN200910162380.8
申请日:20090814
公开号:CN101655866A
公开日:
20100224
专利内容由知识产权出版社提供
摘要:一种利用计算机对中文专利文献科技术语自动识别和人工辅助抽取的方法。本方法是基于词性标注的基本信息,采用基于规则的手段,从汉语词组构词法的角度出发,自动判别并抽取出可能成词的中文术语,并在人工辅助的基础上,对术语真实性进行判断和确认。主要步骤包括:按照领域建立不同的专利文献库;以特定专利文献库为训练语料库提取重复串,用基础词汇对重复串进行切分和词性标注,然后利用中文的词法规则,对重复串的边界进行反复检验,直到可接受为候选术语为止。为进一步核实候选术语,可再由人工辅助确认。
申请人:北京中献电子技术开发中心
地址:100088 北京市海淀区马甸南村1号
国籍:CN

本文发布于:2024-09-20 17:29:44,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/764247.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:术语   专利   进行   文献   抽取   人工   信息
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议