一种专利信息查询系统及查询方法

著录项
  • CN201610411504.1
  • 20160614
  • CN106095933A
  • 20161109
  • 北京汽车研究总院有限公司
  • 殷玉恩;程新化;张玥
  • G06F17/30
  • G06F17/30 G06F17/28

  • 北京市顺义区双河大街99号
  • 北京(11)
摘要
本发明涉及一种专利信息查询系统和查询方法,所述查询系统包括服务器、客户机和数据源,所述客户机向服务器发送专利查询请求,服务器将对应的专利文件信息返回给客户机,还包括翻译模块,所述翻译模块将服务器返回给客户机的专利文件信息转换成特定的语言形式以后再返回给客户机。本发明提供的专利信息查询系统可对检索到的专利文件信息进行翻译,并以特定的语言形式呈现,有利于技术人员理解专利技术,提高专利信息查询系统的利用效率。
权利要求

1.一种专利信息查询系统,包括服务器(1)、客户机(2)和数据源(3),所述客户机(2)向 服务器(1)发送专利查询请求,服务器(1)将对应的专利文件信息返回给客户机(2),其特征 在于:还包括翻译模块(4),所述翻译模块(4)将服务器(1)返回给客户机(2)的专利文件信 息转换成特定的语言形式以后再返回给客户机(2)。

2.根据权利要求1所述的专利信息查询系统,其特征在于:所述翻译模块(4)之前还包 括语言识别模块。

3.根据权利要求1所述的专利信息查询系统,其特征在于:还包括OCR模块(5),所述OCR 模块(5)将服务器(1)返回给客户机(2)的图片形式的专利文件信息转换成文字形式,返回 给翻译模块(4),所述翻译模块(4)将文字形式的专利文件信息转换成特定的语言形式以后 再返回给客户机(2)。

4.根据权利要求1所述的专利信息查询系统,其特征在于:所述服务器(1)包括侦测模 块(11)、转换模块(12)、索引模块(13)及数据库(17);所述客户端(2)包括检索模块(20)及 显示模块(21)。

5.一种专利信息查询方法,其特征在于,包括以下步骤:

步骤1:客户机(2)向服务器(1)发送专利查询请求;

步骤2:服务器(1)从数据库(17)中查对应的专利文件信息;

步骤3:翻译模块(4)将上一步骤中的专利文件信息转换成特定的语言形式以后再返回 给客户机(2)。

6.根据权利要求5所述的专利信息查询方法,其特征在于:

在步骤2和步骤3之间还有一个步骤2a:OCR模块(5)将上一步骤中的图片形式的专利文 件信息转换成文字形式的专利文件信息。

7.根据权利要求5所述的专利信息查询方法,其特征在于:

在步骤2和步骤3之间还有一个步骤2b:语言识别模块确认上一步骤中返回的专利文件 信息的语言形式,然后通知翻译模块(4)。

说明书
技术领域

本发明涉及专利信息查询技术领域,具体涉及一种专利信息查询系统和查询方 法。

随着经济的迅速发展,知识产权的作用日益体现,所受到的重视程度也在逐步提 升。专利作为核心竞争力和创新能力的象征,包含了大量的技术信息,对研发人员来说,通 过专利信息可以启发研究思路,避免重复研究;对于企业来说,更要时时监控相关领域的专 利情况,避免专利侵权,降低企业经营风险。

目前,已经有很多成熟的专利查询管理系统,可以实现自动更新、按申请人、发明 人、地址、IPC分类号等分类管理,有的甚至可以实现复杂的专利分析功能。国家知识产权局 提供官方的专利查询工具,可以检索1985年至今所有在中国的专利申请,而美国、欧盟、日 本、韩国等知识产权发达国家和地区及WIPO等国际知识产权组织也提供一些专利查询工具 和平台;另一方面,还有很多专业的知识产权信息提供商也提供专利查询工具,如Thomson Reuters公司的innography专利数据库就提供世界诸多重要专利局的专利文件,可针对自 己的需要构建检索式进行检索,对检索的专利文献可直接在注册账号下建立工程进行保 存,在任何联网的地方都能方便的使用自己的搜索结果。对于检索得到的专利文献可进行 下载,单篇专利的分析报告生成与下载,批量专利的分析报告生成与下载,批量专利标题、 专利号、申请日、申请地、失效时间等各项重要信息的列表抽取等,方便世界范围内在需要 领域的专利搜索,还具有强大的分析功能,有气泡图、直方图等各种直观的分析图表结果, 帮助正确了解相关领域世界最前沿的技术态势和最具竞争力的对手。

但是,由于各国要求专利申请文件必须以本国文字撰写和提交,因此技术人员检 索到的国外的专利申请文件的权利要求书和说明书等内容都是以外文撰写的,必然对于技 术人员理解专利技术带来了很大的困难。

本发明针对现有技术的专利信息查询系统不能提供查询者认同的语言形式这一 技术问题,提出一种专利信息查询系统和专利信息查询方法,具体的技术方案是:

一种专利信息查询系统,包括服务器1、客户机2和数据源3,所述客户机2向服务器 1发送专利查询请求,服务器1将对应的专利文件信息返回给客户机2,其特征在于:还包括 翻译模块4,所述翻译模块4将服务器1返回给客户机2的专利文件信息转换成特定的语言形 式以后再返回给客户机2。

本发明的有益效果:对检索到的专利文件信息进行翻译,并以特定的语言形式呈 现,有利于技术人员理解专利技术。

图1为专利信息查询系统的模块图;

图2为带OCR模块的专利信息查询系统模块图;

图3为服务器模块图;

图4为客户机模块图;

图5为专利信息查询系统的索引建立方法流程图;

图6为专利信息查询系统的检索方法流程图。

本发明专利信息查询系统的模块图如图1所示,包括服务器1、客户机2和数据源3, 所述客户机2向服务器1发送专利查询请求,服务器1将对应的专利文件信息返回给客户机 2,其特征在于:还包括翻译模块4,所述翻译模块4将服务器1返回给客户机2的专利文件信 息转换成特定的语言形式以后再返回给客户机2。

所述服务器1包括侦测模块11、转换模块12、索引模块13及数据库17。所述客户端2 包括检索模块20及显示模块21。

每一专利文件包括说明书摘要、说明书、权利要求书三个组成部分,说明书部分又 分为标题、技术领域、背景技术、发明内容、附图说明、具体实施方式等多个子部分。说明书 摘要部分提供相应的说明书摘要主要内容和关键字,说明书各子部分也提供相应的主要内 容和关键字,权利要求书部分的每一项权利要求提供相应权利要求的主要内容和关键字。

侦测模块11用于探测数据源3中是否增加了新的专利文件,当侦测到数据源3中增 加了新的专利文件时,启动转换模块12进行转换作业。转换模块12用于从数据源3中获得新 增的专利文件,依据上述描述的专利文件的组成部分对其进行分析,读取各组成部分的内 容,并将该各组成部分的内容以预先定义的文件格式进行保存。该预先定义的文件格式的 文件由标题、说明书摘要、说明书、权利要求书等部分组成,该预先定义的文件格式的文件 所属的类型可以是网页、XML或其他可以转换成文本文件的类型。索引模块13使用索引建立 技术将上述转换之后的专利文件各组成部分的内容添加到数据库17中,并对该数据库17中 的所有转换之后的专利文件的各个组成部分的内容分别重新建立全文索引,包括对标题建 立全文索引,说明书摘要部分建立全文索引,对说明书部分建立全文索引及对权利要求书 部分建立全文索引。所述建立全文索引是指通过扫描每一部分内容的每一个词,对每一个 词建立一个索引,指明该词在每一部分出现的次数及位置。该数据库17中包含与专利文件 转换后的文件中各组成部分相对应的栏位,用来存储专利文件转换后各部分的内容和关键 字。

数据源3可以采用国家知识产权局专利检索数据库或欧盟、美国、世界知识产权组 织等建立的专利检索数据库。

检索模块20用于根据查询者的检索标的对上述建立好索引的数据库17进行检索。 通过检索每一专利文件各组成部分的条目对应的栏位,获得检索结果。检索结果为按照关 键字在数据库17中检索出的所有专利文件的简要信息,包括专利标题、部分摘要内容、申请 号等,所述条目包括专利文件的标题、说明书摘要、说明书内容及权利要求书。检索模块20 进行的检索方式可为单一条目检索和多条目联合检索。显示模块21用于显示上述检索出的 与当前关键词相关的专利文件的简要信息,从而方便阅读、参考;还用于当查询者点击检索 出的专利标题时将专利文件下载或开启供查询者阅读;还用于在下载专利全文前进行专利 全文的预览。

还包括翻译模块4,所述翻译模块4将服务器1返回给客户机2的专利文件信息转换 成特定的语言形式以后再返回给客户机2。

优选在翻译模块4之前还包括语言识别模块,所述语言识别模块的作用是在服务 器1返回给客户机2的专利文件信息到达翻译模块4之前确认其语言形式,并通知翻译模块 4,翻译模块4将服务器1返回给客户机2的专利文件信息转换成特定的语言形式以后再返回 给客户机2。

所谓语言识别模块确定语言形式是指服务器1返回的专利文件信息是用什么语言 记载的,语言识别模块确认专利文件信息的语言形式以后,通知翻译模块4。

所谓特定的语言形式是指查询者熟悉的语言,如汉语或英语。本发明的目的就是 将检索到的以日语、韩语、德语、法语等查询者不熟悉的语言翻译成查询者熟悉的语言如汉 语,呈现给查询者的是其熟悉的语言,有助于理解发明专利的技术内容。

本发明进一步优化的专利信息查询系统的模块图如图2所示,还包括OCR模块5,所 述OCR模块5将服务器1返回给客户机2的图片形式的专利文件信息转换成文字形式,返回给 翻译模块4,所述翻译模块4将文字形式的专利文件信息转换成特定的语言形式以后再返回 给客户机2。

存储在数据库17中的专利文件信息大部分为文字形式,如标题、说明书摘要部分 等,但是对于一些以纸件形式申请的专利,其权利要求书部分和说明书在数据源3中是以图 片的形式存在,专利信息查询系统的服务器1将这些图片形式的专利信息存放到数据库17 中,客户机查询到的权利要求书和说明书只能是图片形式,在这种情况下,翻译模块4不能 对图片形式的专利信息进行转换,只有先通过OCR模块5对图片形式的专利信息进行识别, 将图片形式的专利信息转换成文字形式的专利信息以后再返回给翻译模块4,翻译模块4才 能对文字形式的专利信息进行识别,并转换成特定的语言形式以后再返回给客户机2。

本发明专利信息查询系统的索引建立方法流程图如图5所示。首先,侦测模块11在 侦测到数据源3中增加了新的专利文件时,转换模块12从数据源3中获取该专利文件;转换 模块12读取该专利文件各组成部分的内容,并将读取的专利文件的各组成部分的内容以预 先定义的文件格式进行保存,该预先定义的文件格式的文件所属的类型可以是网页、XML或 其他可以转换成文本文件的类型;索引模块13使用索引建立技术将上述转换之后的专利文 件的各部分内容添加到数据库17中,并对该数据库17中的转换之后的所有专利文件的各个 组在部分的内容分别重新建立全文索引,包括对标题建立全文索引,说明书摘要部分建立 全文索引,对说明书部分建立全文索引及对权利要求书部分建立全文索引,所述建立全文 索引是指通过扫描每一部分内容的每一个词,对每一个词建立一个索引,指明该词在每一 部分出现的次数及位置。

本发明专利信息查询系统的检索方法流程图如图6所示。检索模块20根据查询者 提供的关键字,在建立索引之后的数据库17中依专利条目进行专利文件检索,检索到与该 关键字相关的所有专利;所述检索结果指检索到的所有专利的简要信息,该简要信息包括 专利标题、部分摘要内容、申请号等;所述专利条目可以是标题、说明书摘要、说明书内容及 权利要求书。显示模块21显示上述检索出的与当前关键字相关的专利文件的简要信息,从 而方便阅读。显示模块21根据查询者的选择,下载及显示所需的专利全文或预览专利全文。

本文发布于:2024-09-25 11:11:28,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/68372.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议