一种专利检索用语义解码方法

著录项
  • CN201410446871.6
  • 20140904
  • CN105426369A
  • 20160323
  • 上海尧博信息科技有限公司
  • 姚王平
  • G06F17/30
  • G06F17/30

  • 上海市普陀区同普路1175弄3号143室
  • 上海(31)
  • 上海精晟知识产权代理有限公司
  • 冯子玲
摘要
一种专利检索用语义解码方法,包括设置在前台终端的用于检索者的命令接口模块,所述的用于检索者的命令接口模块能够导进输入的专利检索用关键词,另外所述的用于检索者的命令接口模块还能够导进用于检索的组件检索后发送来的检索得到的专利检索数据,而且还能把所述的检索得到的专利检索数据链接成专利检索数据的链接表并据此而导出;存放在后台服务器内的所述的用于检索的组件以及存放在后台服务器内的映射表,所述的映射表中包括有词义库。结合了步骤方法避免了现有技术的无法全方位多层次地适应客户的要求使得检索无法保证完整性、检索速度不高并且让通信链路的带宽损失大的缺陷。
权利要求

1.一种专利检索用语义解码方法,其特征在于,步骤如下:

步骤1:首先设置在前台终端的用于检索者的命令接口模块,所述的用于 检索者的命令接口模块能够导进输入的专利检索用关键词,另外所述的用于检 索者的命令接口模块还能够导进用于检索的组件检索后发送来的检索得到的 专利检索数据,而且还能把所述的检索得到的专利检索数据链接成专利检索数 据的链接表并据此而导出;存放在后台服务器内的所述的用于检索的组件能够 把涉及到检索目的的专利检索用关键词在存放有专利数据的后台服务器内检 索,以此获得检索到的专利数据;存放在后台服务器内的映射表,所述的映射 表中包括有词义库;所述的专利检索用语义解码方法另外还包括设置在前台终 端内的通信链路组织模块,所述的通信链路组织模块能够按照设定的通信规则 经过通信链路导进前台终端导出的检索者检索用关键词,另外还能把检索者检 索用关键词传输至用于检索者的命令接口模块,以及通信链路组织模块还能够 导入用于检索者的命令接口模块导出的专利检索数据的链接表;所述的专利检 索用语义解码方法内还包括存放在后台服务器内的检索者的以前检索经验表, 所述的过去检索经验表包括有检索者的以前检索的数据;所述的检索者的以前 检索的数据包括专利检索用关键词、检索的计数量和选择检索的频率;所述的 专利检索用语义解码方法内还包括存放在后台服务器内的词义样本筛选模块, 所述的词义样本筛选模块能够凭借所述的映射表中的词义库以及以前检索经 验表中的专利检索用关键词,筛选出词义样本,并把词义样本存放在用来存放 词义样本的词义样本表中;所述的后台服务器中的专利数据是以XML格式存储 的或者为带有指定检索用数据项的数据库;所述的后台服务器中还包括有词义 拓展模块,所述的词义拓展模块能够凭借所述的映射表来把专利检索用关键词 进行词义拓展;所述的以XML格式存储的专利数据包括XML格式的专利数据 以及用来检索的关键词数据;所述的带有指定检索用数据项的数据库包括专利 数据以及带有指定检索用数据项的数据;

步骤2:在专利检索过程时,先通过用于检索者的命令接口模块导进输入 的专利检索用关键词;

步骤3:通过前台终端把输入的专利检索用关键词发送到后台服务器中经 过映射表和词义样本筛选模块的共同筛选出词义样本,并根据该词义样本来作 为能够实现检索目的的关键词;

步骤4:并在后台服务器的专利数据中进行检索,检索后得到的专利数据 发送到前台终端进行输出。

2.根据权利要求1所述的专利检索用语义解码方法,其特征在于所述的经过 映射表和词义样本筛选模块的共同筛选出词义样本,并根据该词义样本来作为 能够实现检索目的的关键词的步骤如下:

步骤1:经过以前检索经验表为映射表中的词义库内的每个词义的每个检 索目的进行等级划分,等级划分的大小用数值大小来区分,使得每个词义均带 着各自对应的检索目的的等级值;

步骤2:把所述的专利检索用关键词同每个词义进行比较,获取同所属的专 利检索用关键词相同或相近的若干词义;

步骤3:把同所述的专利检索用关键词相同或相近的若干词义各自对应的 检索目的的等级值进行求和,获得初级求和值;

步骤4:经过同所述的专利检索用关键词相同或相近的若干词义在词义库 内的属性值,分别来同初级求和值进行相加,获得词义库的全面的检索目的的 数值组;

步骤5:把词义库的全面的检索目的的数值组中的每个数值把预设的限定 值相比较;

步骤6:如果预设的限定值小于或等于词义库的全面的检索目的的数值组 的一个以上的数值,就把词义库的全面的检索目的的数值组中的最大数值所对 应的词义作为专利检索用关键词;

步骤7:如果预设的限定值大于词义库的全面的检索目的的数值组的一个 以上的数值,就把原有的输入的专利检索用关键词作为专利检索用关键词。

说明书
技术领域

本发明属专利检索技术领域,具体涉及一种专利检索用语义解码方法。

现在由于专利的电子信息化公开的日见普遍,在通过通信链路来连接的各 种存储专利文档的服务器中,产生了不断增大的各种专利文档的繁杂数据,但 是于存储专利文档的服务器中检索客户所想检索的专利数据来说,在通过通信 链路连接的存储专利文档的服务器中繁杂的专利数据进行检索确实太难以准 确高效的得到检索结果了,而比如佰腾、soopat这样的一些专利检索工具的出 现,终于能够部分的为客户检索专利数据提供提高检索速度的工具。专利检索 工具往往为在通信链路中使用的模块化检索工具,按照特有的方式在存储专利 文档的服务器中进行检索以及获取对应的专利数据,另外于获取对应的专利数 据中实现规整以及排列,最终提供检索的结果。一般来说,此类专利检索工具 采用BS架构的形式,通过客户端的检索用文本框输入检索用关键字,随之在短 时间内在显示器上显示出检索出的专利数据概要,这样的专利数据的数量往往 是非常大的,每一个检索出来的专利数据意味着针对该专利的一个链接。

但是迄今为止的专利检索工具面向客户端输入的检索用关键字均为根据 检索用关键字所形成的序列码来认定的,好比面向客户端输入的检索用关键字 为戴尔笔记本电脑,专利检索工具仅仅就会把这样的关键字所形成的序列码拆 成戴尔与笔记本电脑,据此于存储专利文档的服务器中实施检索,把涉及到戴 尔或笔记本电脑的关键词的链接机械的反映出来,但是这样的专利检索工具不 可以把客户所输入的专利检索用关键词实施内涵以及词义的认识,好比客户端 输入的专利检索用关键词是戴尔笔记本电脑,专利检索工具并没有把戴尔认识 成笔记本电脑的一种型号;与此同时就没有认识专利检索用关键词的检索目 的,乃至于专利检索用关键词还具备有格式种类不少并且检索的目的也不少的 特性时,这样的检索工具就无法全方位多层次地适应客户的要求,使得检索无 法保证完整性,从而使得要不断输入各种各样的专利检索用关键词方得到检索 目的所要的专利检索数据,导致检索速度不高并且让通信链路的带宽损失大的 缺陷。

本发明的目的提供一种专利检索用语义解码方法,包括设置在前台终端的 用于检索者的命令接口模块,所述的用于检索者的命令接口模块能够导进输入 的专利检索用关键词,另外所述的用于检索者的命令接口模块还能够导进用于 检索的组件检索后发送来的检索得到的专利检索数据,而且还能把所述的检索 得到的专利检索数据链接成专利检索数据的链接表并据此而导出;存放在后台 服务器内的所述的用于检索的组件能够把涉及到检索目的的专利检索用关键 词在存放有专利数据的后台服务器内检索,以此获得检索到的专利数据;存放 在后台服务器内的映射表,所述的映射表中包括有词义库。结合步骤方法避免 了现有技术的无法全方位多层次地适应客户的要求使得检索无法保证完整性、 检索速度不高并且让通信链路的带宽损失大的缺陷。

为了克服现有技术中的不足,本发明提供了一种专利检索用语义解码方法 的解决方案,具体如下:

一种专利检索用语义解码方法,步骤如下:

步骤1:首先设置在前台终端5的用于检索者的命令接口模块1,所述的用 于检索者的命令接口模块1能够导进输入的专利检索用关键词,另外所述的用 于检索者的命令接口模块1还能够导进用于检索的组件2检索后发送来的检索 得到的专利检索数据,而且还能把所述的检索得到的专利检索数据链接成专利 检索数据的链接表并据此而导出;存放在后台服务器3内的所述的用于检索的 组件2能够把涉及到检索目的的专利检索用关键词在存放有专利数据的后台服 务器3内检索,以此获得检索到的专利数据;存放在后台服务器3内的映射表4, 所述的映射表4中包括有词义库;所述的专利检索用语义解码方法另外还包括 设置在前台终端5内的通信链路组织模块6,所述的通信链路组织模块6能够按 照设定的通信规则经过通信链路导进前台终端5导出的检索者检索用关键词, 另外还能把检索者检索用关键词传输至用于检索者的命令接口模块1,以及通 信链路组织模块6还能够导入用于检索者的命令接口模块1导出的专利检索数 据的链接表;所述的专利检索用语义解码方法内还包括存放在后台服务器3内 的检索者的以前检索经验表8,所述的过去检索经验表8包括有检索者的以前检 索的数据;所述的检索者的以前检索的数据包括专利检索用关键词、检索的计 数量和选择检索的频率;所述的专利检索用语义解码方法内还包括存放在后台 服务器3内的词义样本筛选模块9,所述的词义样本筛选模块9能够凭借所述的 映射表4中的词义库以及以前检索经验表8中的专利检索用关键词,筛选出词义 样本,并把词义样本存放在用来存放词义样本的词义样本表中;所述的后台服 务器3中的专利数据是以XML格式存储的或者为带有指定检索用数据项的数据 库;所述的后台服务器3中还包括有词义拓展模块10,所述的词义拓展模块10 能够凭借所述的映射表4来把专利检索用关键词进行词义拓展;所述的以XML 格式存储的专利数据包括XML格式的专利数据以及用来检索的关键词数据;所 述的带有指定检索用数据项的数据库包括专利数据以及带有指定检索用数据 项的数据;

步骤2:在专利检索过程时,先通过用于检索者的命令接口模块1导进输入 的专利检索用关键词;

步骤3:通过前台终端5把输入的专利检索用关键词发送到后台服务器3中 经过映射表和词义样本筛选模块的共同筛选出词义样本,并根据该词义样本来 作为能够实现检索目的的关键词;

步骤4:并在后台服务器3的专利数据中进行检索,检索后得到的专利数据 发送到前台终端5进行输出。

所述的经过映射表和词义样本筛选模块的共同筛选出词义样本,并根据该 词义样本来作为能够实现检索目的的关键词的步骤如下:

步骤1:经过以前检索经验表8为映射表4中的词义库内的每个词义的每个 检索目的进行等级划分,等级划分的大小用数值大小来区分,使得每个词义均 带着各自对应的检索目的的等级值;

步骤2:把所述的专利检索用关键词同每个词义进行比较,获取同所属的专 利检索用关键词相同或相近的若干词义;

步骤3:把同所述的专利检索用关键词相同或相近的若干词义各自对应的 检索目的的等级值进行求和,获得初级求和值;

步骤4:经过同所述的专利检索用关键词相同或相近的若干词义在词义库 内的属性值,分别来同初级求和值进行相加,获得词义库的全面的检索目的的 数值组;

步骤5:把词义库的全面的检索目的的数值组中的每个数值把预设的限定 值相比较;

步骤6:如果预设的限定值小于或等于词义库的全面的检索目的的数值组 的一个以上的数值,就把词义库的全面的检索目的的数值组中的最大数值所对 应的词义作为专利检索用关键词;

步骤7:如果预设的限定值大于词义库的全面的检索目的的数值组的一个 以上的数值,就把原有的输入的专利检索用关键词作为专利检索用关键词。

应用本发明上述方案,具有如下优点:

根据包括有词义库的所述的映射表4,就能进一步深入的认识专利检索使 用者导入的专利检索用关键词,由此拆分专利检索关键词的分解词,以此来专 利检索关键词的组成体系,再把专利检索用关键词实施词义拓展,这样就能在 专利检索使用者筛选出更好的检索关键词来适应检索使用者的目的,这样就可 以让专利检索使用者检索速度加快并且让通信链路的带宽使用减小。

图l为本发明的结构示意图。

下面结合附图对发明内容作进一步说明:

参照图1所示,专利检索用语义解码方法,步骤如下:

步骤1:首先设置在前台终端5的用于检索者的命令接口模块1,所述的用 于检索者的命令接口模块1能够导进输入的专利检索用关键词,另外所述的用 于检索者的命令接口模块1还能够导进用于检索的组件2检索后发送来的检索 得到的专利检索数据,而且还能把所述的检索得到的专利检索数据链接成专利 检索数据的链接表并据此而导出;存放在后台服务器3内的所述的用于检索的 组件2能够把涉及到检索目的的专利检索用关键词在存放有专利数据的后台服 务器3内检索,以此获得检索到的专利数据;存放在后台服务器3内的映射表4, 所述的映射表4中包括有词义库;所述的专利检索用语义解码方法另外还包括 设置在前台终端5内的通信链路组织模块6,所述的通信链路组织模块6能够按 照设定的通信规则经过通信链路导进前台终端5导出的检索者检索用关键词, 另外还能把检索者检索用关键词传输至用于检索者的命令接口模块1,以及通 信链路组织模块6还能够导入用于检索者的命令接口模块1导出的专利检索数 据的链接表;所述的专利检索用语义解码方法内还包括存放在后台服务器3内 的检索者的以前检索经验表8,所述的过去检索经验表8包括有检索者的以前检 索的数据;所述的检索者的以前检索的数据包括专利检索用关键词、检索的计 数量和选择检索的频率;所述的专利检索用语义解码方法内还包括存放在后台 服务器3内的词义样本筛选模块9,所述的词义样本筛选模块9能够凭借所述的 映射表4中的词义库以及以前检索经验表8中的专利检索用关键词,筛选出词义 样本,并把词义样本存放在用来存放词义样本的词义样本表中;所述的后台服 务器3中的专利数据是以XML格式存储的或者为带有指定检索用数据项的数据 库;所述的后台服务器3中还包括有词义拓展模块10,所述的词义拓展模块10 能够凭借所述的映射表4来把专利检索用关键词进行词义拓展;所述的以XML 格式存储的专利数据包括XML格式的专利数据以及用来检索的关键词数据;所 述的带有指定检索用数据项的数据库包括专利数据以及带有指定检索用数据 项的数据;

步骤2:在专利检索过程时,先通过用于检索者的命令接口模块1导进输入 的专利检索用关键词;

步骤3:通过前台终端5把输入的专利检索用关键词发送到后台服务器3中 经过映射表和词义样本筛选模块的共同筛选出词义样本,并根据该词义样本来 作为能够实现检索目的的关键词;

步骤4:并在后台服务器3的专利数据中进行检索,检索后得到的专利数据 发送到前台终端5进行输出。

所述的经过映射表和词义样本筛选模块的共同筛选出词义样本,并根据该 词义样本来作为能够实现检索目的的关键词的步骤如下:

步骤1:经过以前检索经验表8为映射表4中的词义库内的每个词义的每个 检索目的进行等级划分,等级划分的大小用数值大小来区分,使得每个词义均 带着各自对应的检索目的的等级值;

步骤2:把所述的专利检索用关键词同每个词义进行比较,获取同所属的专 利检索用关键词相同或相近的若干词义;

步骤3:把同所述的专利检索用关键词相同或相近的若干词义各自对应的 检索目的的等级值进行求和,获得初级求和值;

步骤4:经过同所述的专利检索用关键词相同或相近的若干词义在词义库 内的属性值,分别来同初级求和值进行相加,获得词义库的全面的检索目的的 数值组;

步骤5:把词义库的全面的检索目的的数值组中的每个数值把预设的限定 值相比较;

步骤6:如果预设的限定值小于或等于词义库的全面的检索目的的数值组 的一个以上的数值,就把词义库的全面的检索目的的数值组中的最大数值所对 应的词义作为专利检索用关键词;

步骤7:如果预设的限定值大于词义库的全面的检索目的的数值组的一个 以上的数值,就把原有的输入的专利检索用关键词作为专利检索用关键词。

以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的 限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何 熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示 的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发 明技术方案内容,依据本发明的技术实质,在本发明的精神和原则之内,对以 上实施例所作的任何简单的修改、等同替换与改进等,均仍属于本发明技术方 案的保护范围之内。

本文发布于:2024-09-25 00:37:40,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/68521.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议