一种基于深度学习的大数据专利检索系统

著录项
  • CN202010217206.5
  • 20200325
  • CN111428111A
  • 20200717
  • 浙江知多多网络科技有限公司
  • 杨磊;张蕾;胡智敏
  • G06F16/951
  • G06F16/951 G06F16/31 G06F16/33 G06F21/60 G06F21/31 G06Q50/18 G06N3/04 G06N3/08

  • 浙江省杭州市江干区高德置地中心1号楼3003室-1
  • 浙江(33)
  • 北京恒泰铭睿知识产权代理有限公司
  • 周成金
摘要
本发明涉及专利检索技术领域,且公开了一种基于深度学习的大数据专利检索系统,包括:检索代理服务器调用专利索引服务器集中相对应的专利索引节点服务器Si,在专利索引节点服务器Si上的索引表IPi内检索出具有专利检索关键词xi的各专利对应的Web网页地址,采用网络爬虫去抓取专利大数据;检索代理服务器采用多层前馈人工神经网络模型计算输出专利检索关键词xi与专利技术内容yi之间的相似度f(xi,yi),根据相似度f(xi,yi)对检索出的专利大数据进行排序;专利索引服务器集中的专利索引节点服务器Si的调用管理系统采用零知识证明的验证方法对检索代理服务器的用户身份进行验证。本发明解决了未经授权的服务器非法调用专利索引服务器集中的节点服务器的问题。
权利要求

1.一种基于深度学习的大数据专利检索系统,其特征在于,包括:专利查询服务器、部署有多层前馈人工神经网络模型的检索代理服务器、部署有网络爬虫的专利索引服务器集、以及存储有专利大数据并支持访问和下载的Hidden Web网页服务器;

所述的专利索引服务器集由专利索引节点服务器S1、专利索引节点服务器S2、专利索引节点服务器S3,…,专利索引节点服务器Sn组成;专利索引服务器集中的专利索引节点服务器Si内存储有索引表IPi,该索引表IPi中的每一项都包括一个属性值即专利检索关键词xi,以及与具有专利检索关键词xi的各专利对应的Web网页地址;

检索代理服务器调用专利索引服务器集中相对应的专利索引节点服务器Si,在专利索引节点服务器Si上的索引表IPi内检索出具有专利检索关键词xi的各专利对应的Web网页地址,并且利用网络爬虫去抓取Hidden Web网页服务器中的专利大数据;

检索代理服务器以专利检索关键词xi和网络爬虫所抓取并返回的专利大数据中任一专利的技术内容yi为输入层,采用多层前馈人工神经网络模型计算输出专利检索关键词xi与专利技术内容yi之间的相似度f(xi,yi),根据相似度f(xi,yi)对检索出的专利大数据进行排序,将排序之后的专利大数据返回给专利查询服务器;

专利索引服务器集中的专利索引节点服务器Si的调用管理系统采用零知识证明的验证方法对检索代理服务器的用户身份进行验证,其交互验证方法,包括以下步骤:

步骤一:检索代理服务器在专利索引节点服务器Si的调用管理系统上进行用户注册,具体包括:检索代理服务器选定图Ga和图Gb,图Ga和图Gb是同构的,并且图Ga和Gb的同构置换为f,随机选定置换g,将图Ga转换为图H,即H=g(Ga),将图Gb和图H传送给调用管理系统;

步骤二:当检索代理服务器向专利索引节点服务器Si发送调用请求时,调用管理系统开始对检索代理服务器的身份进行验证,具体的验证过程为:

(1)调用管理系统在验证页面上弹出与检索代理服务器进行交互式通信的对话框;

(2)调用管理系统随机选择α=0或1,将α显示在对话框内;

(3)如果α=0,则检索代理服务器计算π=g-1;如果α=1,则检索代理服务器计算π=g-1f;检索代理服务器将π输入到对话框内;

(4)调用管理系统验证H在π的变换下是否等于Gb,即Gb=π(H)是否成立;

若等式Gb=π(H)成立,证明检索代理服务器知道复合的私有密钥f和g,则调用管理系统通过检索代理服务器的身份验证,否则就拒绝通过检索代理服务器的身份验证。

2.根据权利要求1所述的基于深度学习的大数据专利检索系统,其特征在于,所述的专利索引节点服务器Si之间不进行通信连接、呈现出相互独立的分布式运行状态。

3.根据权利要求2所述的基于深度学习的大数据专利检索系统,其特征在于,所述的多层前馈人工神经网络模型采用监督学习算法,该监督学习算法包括以下步骤:

步骤一:给定n组以专利检索关键词xi和专利大数据中任一专利的技术内容yi为输入层、以xi与yi之间的相似度f(xi,yi)为输出层的训练集;

步骤二:通过支持向量机的线性函数来学习如何关联输入和输出,获得基于专利检索关键词xi与专利技术内容yi之间相似度的多层前馈人工神经网络模型。

4.根据权利要求1所述的基于深度学习的大数据专利检索系统,其特征在于,所述的步骤一:检索代理服务器在专利索引节点服务器Si的调用管理系统上进行用户注册,具体包括:

(1)调用管理系统在注册页面上弹出与检索代理服务器进行交互式通信的对话框;

(2)检索代理服务器选定图Ga和图Gb,图Ga和图Gb是同构的,并且图Ga和Gb的同构置换为f,随机选定置换g,将图Ga转换为图H,即H=g(Ga),将图Gb和图H传送给调用管理系统,即输入到对话框内。

说明书

一种基于深度学习的大数据专利检索系统

技术领域

本发明涉及专利检索技术领域,具体为一种基于深度学习的大数据专利检索系统。

背景技术

当前,世界上每年发明创造成果的90%以上能在专利文献中查到,而且许多发明创造成果仅仅出现于专利文献中。在信息化极度膨胀的时代,专利以公开换取保护已经成为新常态。如果企业能够充分利用专利文献指导技术创新,将可以节约50%以上的研究经费和70%以上的研究时间,企业研发技术人员的技术创新能力和水平也将得到实质的提升。由此可见,专利文献已发展成为企业科技创新和投资者商业战略决策的重要参考。

专利检索及专利检索系统越发重要。专利检索系统不仅是一种全面、快速查询的工具,更是企业联接世界的桥梁。专利检索使企业明晰世界专利的动态,避免重复开发与资金浪费。

企业在进行专利检索时,往往需要架设比较专业的专利索引服务器集,而在实际运行过程中专利索引服务器集中的节点服务器存在被非法调用的风险。

发明内容

(一)解决的技术问题

针对现有技术的不足,本发明提供一种基于深度学习的大数据专利检索系统,以解决未经授权的服务器非法调用专利索引服务器集中的节点服务器的问题。

(二)技术方案

为实现上述目的,本发明提供如下技术方案:

一种基于深度学习的大数据专利检索系统,包括:专利查询服务器、部署有多层前馈人工神经网络模型的检索代理服务器、部署有网络爬虫的专利索引服务器集、以及存储有专利大数据并支持访问和下载的Hidden Web网页服务器;

所述的专利索引服务器集由专利索引节点服务器S1、专利索引节点服务器S2、专利索引节点服务器S3,…,专利索引节点服务器Sn组成;专利索引服务器集中的专利索引节点服务器Si内存储有索引表IPi,该索引表IPi中的每一项都包括一个属性值即专利检索关键词xi,以及与具有专利检索关键词xi的各专利对应的Web网页地址;

检索代理服务器调用专利索引服务器集中相对应的专利索引节点服务器Si,在专利索引节点服务器Si上的索引表IPi内检索出具有专利检索关键词xi的各专利对应的Web网页地址,并且根据Web网页地址利用部署在专利索引节点服务器Si上的网络爬虫去抓取Hidden Web网页服务器中的专利大数据,再将所抓取的专利大数据返回至检索代理服务器;

检索代理服务器以专利检索关键词xi和网络爬虫所抓取并返回的专利大数据中任一专利的技术内容yi为输入层,采用多层前馈人工神经网络模型计算输出专利检索关键词xi与专利技术内容yi之间的相似度f(xi,yi),根据相似度f(xi,yi)对检索出的专利大数据进行排序,将排序之后的专利大数据返回给专利查询服务器;

专利索引服务器集中的专利索引节点服务器Si的调用管理系统采用零知识证明的验证方法对检索代理服务器的用户身份进行验证,其交互验证方法,包括以下步骤:

步骤一:检索代理服务器在专利索引节点服务器Si的调用管理系统上进行用户注册,具体包括:检索代理服务器选定图Ga和图Gb,图Ga和图Gb是同构的,并且图Ga和Gb的同构置换为f,随机选定置换g,将图Ga转换为图H,即H=g(Ga),将图Gb和图H传送给调用管理系统;

步骤二:当检索代理服务器向专利索引节点服务器Si发送调用请求时,调用管理系统开始对检索代理服务器的身份进行验证,具体的验证过程为:

(1)调用管理系统在验证页面上弹出与检索代理服务器进行交互式通信的对话框;

(2)调用管理系统随机选择α=0或1,将α显示在对话框内;

(3)如果α=0,则检索代理服务器计算π=g-1;如果α=1,则检索代理服务器计算π=g-1f;检索代理服务器将π输入到对话框内;

(4)调用管理系统验证H在π的变换下是否等于Gb,即Gb=π(H)是否成立;

若等式Gb=π(H)成立,证明检索代理服务器知道复合的私有密钥f和g,则调用管理系统通过检索代理服务器的身份验证,否则就拒绝通过检索代理服务器的身份验证。

优选的,所述的专利索引节点服务器Si之间不进行通信连接、呈现出相互独立的分布式运行状态。

优选的,所述的多层前馈人工神经网络模型采用监督学习算法,该监督学习算法包括以下步骤:

步骤一:给定n组以专利检索关键词xi和专利大数据中任一专利的技术内容yi为输入层、以xi与yi之间的相似度f(xi,yi)为输出层的训练集;

步骤二:通过支持向量机的线性函数来学习如何关联输入和输出,获得基于专利检索关键词xi与专利技术内容yi之间相似度的多层前馈人工神经网络模型。

优选的,所述的步骤一:检索代理服务器在专利索引节点服务器Si的调用管理系统上进行用户注册,具体包括:

(1)调用管理系统在注册页面上弹出与检索代理服务器进行交互式通信的对话框;

(2)检索代理服务器选定图Ga和图Gb,图Ga和图Gb是同构的,并且图Ga和Gb的同构置换为f,随机选定置换g,将图Ga转换为图H,即H=g(Ga),将图Gb和图H传送给调用管理系统,即输入到对话框内。

(三)有益的技术效果

与现有技术相比,本发明具备以下有益的技术效果:

1.本发明在专利索引服务器集中的专利索引节点服务器Si上部署调用管理系统,调用管理系统采用零知识证明的验证方法对请求调用的检索代理服务器的用户身份进行验证,并且只有请求调用的检索代理服务器的用户身份通过了专利索引节点服务器Si的验证,专利索引节点服务器Si才执行检索代理服务器的调用请求,否则专利索引节点服务器Si拒绝执行检索代理服务器的调用请求;

并且上述的身份验证完成之后,调用管理系统只是知道检索代理服务器的身份是否合法,其并不知道检索代理服务器的复合的私有密钥f和g,即检索代理服务器在不泄露自己的私有密钥f和g的前提下,完成了身份的验证;

从而解决了未经授权的服务器非法调用专利索引服务器集中的节点服务器的问题。

2.专利索引服务器集的组织方式不仅可以最大限度降低节点间通信开销,而且由于索引节点之间相互独立工作,整个索引查询系统具有很高的容错性。

具体实施方式

下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

一种基于深度学习的大数据专利检索系统,包括:专利查询服务器、检索代理服务器、部署有网络爬虫的专利索引服务器集、以及存储有专利大数据并支持访问和下载的Hidden Web网页服务器;

所述的专利索引服务器集由专利索引节点服务器S1、专利索引节点服务器S2、专利索引节点服务器S3,…,专利索引节点服务器Sn组成;各个专利索引节点服务器Si之间不进行通信连接、呈现出相互独立的分布式运行状态;专利索引节点服务器Si内存储有索引表IPi,该索引表IPi中的每一项都包括一个属性值即专利检索关键词xi,以及与具有专利检索关键词xi的各专利对应的Web网页地址,并且索引表IPi的索引创建过程独立进行;

其中,专利索引服务器集的组织方式不仅可以最大限度降低节点间通信开销,而且由于索引节点之间相互独立工作,整个索引查询系统具有很高的容错性;

所述的专利查询服务器与检索代理服务器进行通信连接;专利查询服务器接受用户的专利检索请求、并且将该专利检索请求发送给检索代理服务器,专利查询服务器接收检索代理服务器返回的专利大数据、并且将检索出的专利大数据向用户返回;

检索代理服务器对专利检索请求进行分类,根据分类来选择检索方式,调用专利索引服务器集中相对应的专利索引节点服务器Si,在专利索引节点服务器Si上的索引表IPi内检索出具有专利检索关键词xi的各专利对应的Web网页地址,并且根据Web网页地址利用部署在专利索引节点服务器Si上的网络爬虫去抓取Hidden Web网页服务器中的专利大数据,再将所抓取的专利大数据返回至检索代理服务器;

检索代理服务器上运行有多层前馈人工神经网络模型,该多层前馈人工神经网络模型采用监督学习算法,该监督学习算法包括以下步骤:

步骤一:给定n组以专利检索关键词xi和专利大数据中任一专利的技术内容yi为输入层、以xi与yi之间的相似度f(xi,yi)为输出层的训练集;

步骤二:通过支持向量机的线性函数来学习如何关联输入和输出,获得基于专利检索关键词xi与专利技术内容yi之间相似度的多层前馈人工神经网络模型;

检索代理服务器以专利检索请求的专利检索关键词xi和网络爬虫所抓取并返回的专利大数据中任一专利的技术内容yi为输入层,采用所述的多层前馈人工神经网络模型计算输出专利检索关键词xi与专利技术内容yi之间的相似度f(xi,yi),根据相似度f(xi,yi)对检索出的专利大数据进行排序,之后再将排序之后的专利大数据返回给专利查询服务器;

为了防止或避免未经授权的服务器非法对专利索引服务器集中的专利索引节点服务器Si进行访问,专利索引节点服务器Si的调用管理系统采用零知识证明的验证方法对检索代理服务器的用户身份进行验证,并且只有检索代理服务器的用户身份通过了专利索引节点服务器Si的验证,专利索引节点服务器Si才执行检索代理服务器的调用请求,否则专利索引节点服务器Si拒绝执行检索代理服务器的调用请求;

专利索引节点服务器Si的调用管理系统与检索代理服务器的交互验证方法,包括以下步骤:

步骤一:检索代理服务器在专利索引节点服务器Si的调用管理系统上进行用户注册,具体包括:

(1)调用管理系统在注册页面上弹出与检索代理服务器进行交互式通信的对话框;

(2)检索代理服务器选定图Ga和图Gb,图Ga和图Gb是同构的,并且图Ga和Gb的同构置换为f,随机选定置换g,将图Ga转换为图H,即H=g(Ga),将图Gb和图H传送给调用管理系统,即输入到对话框内;

同构置换f和置换g为复合的私有密钥,该私有密钥为唯一合法的证明密钥,并且该私有密钥仅为检索代理服务器单独拥有,即调用管理系统并不知晓所述的私有密钥;

步骤二:当检索代理服务器向专利索引节点服务器Si发送调用请求时,调用管理系统开始对检索代理服务器的身份进行验证,具体的验证过程为:

(1)调用管理系统在验证页面上弹出与检索代理服务器进行交互式通信的对话框;

(2)调用管理系统随机选择α=0或1,将α显示在对话框内;

(3)如果α=0,则检索代理服务器计算π=g-1;如果α=1,则检索代理服务器计算π=g-1f;检索代理服务器将π输入到对话框内;

(4)调用管理系统验证H在π的变换下是否等于Gb,即Gb=π(H)是否成立;

若等式Gb=π(H)成立,证明检索代理服务器知道复合的私有密钥f和g,则调用管理系统通过检索代理服务器的身份验证,否则就拒绝通过检索代理服务器的身份验证;

上述的身份验证完成之后,调用管理系统只是知道检索代理服务器的身份是否合法,其并不知道检索代理服务器的复合的私有密钥f和g,即检索代理服务器在不泄露自己的私有密钥f和g的前提下,完成了身份的验证;

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

本文发布于:2024-09-22 17:36:54,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/68066.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议