专利检索用语义分析方法

著录项
  • CN201610832719.0
  • 20160919
  • CN106445916A
  • 20170222
  • 合肥清浊信息科技有限公司
  • 冯晓辉;孔兴;夏方;康玉;武振;赵文曼;徐宁宁;梁瑞欣
  • G06F17/27
  • G06F17/27 G06F17/30

  • 安徽省合肥市高新区科学大道102号创业服务中心7号楼402室
  • 安徽(34)
  • 北京和信华成知识产权代理事务所(普通合伙)
  • 胡剑辉
摘要
本发明提供了一种专利检索用语义分析方法,其包括以下步骤:获取排在前若干位的技术词汇作为关键词;将所述获取到的关键词归纳为多个类别;分别在所述各个类别中选取一个关键词进行组合,并作为检索所需要的关键词组合,得到多组不同的关键词组合;将所述获取到的技术关键词组合输入到专利数据库中进行检索,分别得到若干个专利文献;将所述各技术关键词组合得到的专利文献进行比对,按照不同组合下的专利文献的重合频次进行排序。本发明提供的专利检索用语义分析方法根据关键词组合得到不同的专利文献组合,并且对专利文献的技术关联度进行评估并排序,得到的检索结果使用起来更为便捷。
权利要求

1.专利检索用语义分析方法,其特征在于,包括以下步骤:

S1:将中文技术文档以词汇为单位进行拆分,将该技术文档中出现的技术词汇按照频 次进行排序,获取排在前若干位的技术词汇作为关键词;

S2:将获取的关键词进行归类,具有重合文字的部分归为一类,将所述获取到的关键词 归纳为多个类别;

S3:分别在所述各个类别中选取一个关键词进行组合,并作为检索所需要的关键词组 合,得到多组不同的关键词组合;

S4:将所述获取到的技术关键词组合输入到专利数据库中进行检索,分别得到若干个 专利文献;

S5:将所述各技术关键词组合得到的专利文献进行比对,按照不同组合下的专利文献 的重合频次进行排序,出现频率越高的专利文献其技术关联度越高,出现频率越低的专利 文献其技术关联度越低。

2.如权利要求1所述的专利检索用语义分析方法,其特征在于,所述技术词汇为预存在 词汇库中的技术用词,所述词汇库定期进行更新。

3.如权利要求2所述的专利检索用语义分析方法,其特征在于,所述技术文档的拆分方 式为:

将技术词汇从技术文档中筛选出来,并将除技术词汇之外的其他词汇删除。

说明书

专利检索用语义分析方法

技术领域

本发明属于专利数据处理技术领域,特别是一种专利检索用语义分析方法。

背景技术

现有技术提供的专利检索方法都是通过输入关键词进行检索,并且通过人工来改 变关键词的种类与数量进行不同的组合检索,检索效率低,且获取到的文献繁多不方便使 用。

发明内容

为解决上述技术问题,本发明提供了专利检索用语义分析方法,其包括以下步骤:

S1:将中文技术文档以词汇为单位进行拆分,将该技术文档中出现的技术词汇按 照频次进行排序,获取排在前若干位的技术词汇作为关键词;

S2:将获取的关键词进行归类,具有重合文字的部分归为一类,将所述获取到的关 键词归纳为多个类别;

S3:分别在所述各个类别中选取一个关键词进行组合,并作为检索所需要的关键 词组合,得到多组不同的关键词组合;

S4:将所述获取到的技术关键词组合输入到专利数据库中进行检索,分别得到若 干个专利文献;

S5:将所述各技术关键词组合得到的专利文献进行比对,按照不同组合下的专利 文献的重合频次进行排序,出现频率越高的专利文献其技术关联度越高,出现频率越低的 专利文献其技术关联度越低。

较佳地,所述技术词汇为预存在词汇库中的技术用词,所述词汇库定期进行更新。

较佳地,所述技术文档的拆分方式为:

将技术词汇从技术文档中筛选出来,并将除技术词汇之外的其他词汇删除。

本发明具有以下有益效果:

本发明提供的专利检索用语义分析方法根据关键词组合得到不同的专利文献组 合,并且对专利文献的技术关联度进行评估并排序,得到的检索结果使用起来更为便捷。

当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。

具体实施方式

下面将结合本发明实施例对本发明中的技术方案进行清楚、完整地描述,显然,所 描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例, 本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发 明保护的范围。

本发明实施例提供了专利检索用语义分析方法,其包括以下步骤:

S1:将中文技术文档以词汇为单位进行拆分,将该技术文档中出现的技术词汇按 照频次进行排序,获取排在前若干位的技术词汇作为关键词;

S2:将获取的关键词进行归类,具有重合文字的部分归为一类,将所述获取到的关 键词归纳为多个类别;

S3:分别在所述各个类别中选取一个关键词进行组合,并作为检索所需要的关键 词组合,得到多组不同的关键词组合;

S4:将所述获取到的技术关键词组合输入到专利数据库中进行检索,分别得到若 干个专利文献;

S5:将所述各技术关键词组合得到的专利文献进行比对,按照不同组合下的专利 文献的重合频次进行排序,出现频率越高的专利文献其技术关联度越高,出现频率越低的 专利文献其技术关联度越低。

其中所述技术词汇为预存在词汇库中的技术用词,所述词汇库定期进行更新。

所述技术文档的拆分方式为:

将技术词汇从技术文档中筛选出来,并将除技术词汇之外的其他词汇删除。

本发明提供的专利检索用语义分析方法根据关键词组合得到不同的专利文献组 合,并且对专利文献的技术关联度进行评估并排序,得到的检索结果使用起来更为便捷。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽 叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容, 可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明 的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅 受权利要求书及其全部范围和等效物的限制。

本文发布于:2024-09-24 15:18:56,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/68656.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议