专利搜索的方法、服务器及计算机可读介质

著录项
  • CN201811041125.3
  • 20180907
  • CN110888894A
  • 20200317
  • 深圳中利汇信息技术有限公司
  • G06F16/242
  • G06F16/242 G06F16/2457

  • 广东省深圳市龙华区大浪街道龙平社区腾龙路淘金地电子商务孵化基地展滔商业广场E座707
  • 广东(44)
  • 深圳市兰锋知识产权代理事务所(普通合伙)
  • 曹明兰
摘要
本发明提供专利搜索的方法、服务器及计算机可读介质,所述专利搜索的方法包括:对专利数据库中的专利文本全文或指定部分进行识别,从所述专利文本中提取与所述专利文本的符号相对应的关键词;将提取到的所述关键词存储到关键词数据库,并存储所述关键词与对应的专利文本的对应关系;接收专利搜索请求,所述专利搜索请求包括非著录项目关键词;获取所述关键词数据库中与所述非著录项目关键词相匹配的关键词;根据所述关键词与所述对应文本的对应关系确定所述专利搜索请求的专利搜索结果;返回所述专利搜索结果,使用户可以快速到实际需要的具有高价值的专利。
权利要求

1.一种专利搜索的方法,其特征在于,包括:

对专利数据库中的专利文本全文或指定部分进行识别,从所述专利文本中提取与所述专利文本的符号相对应的关键词;

将提取到的所述关键词存储到关键词数据库,并存储所述关键词与对应的专利文本的对应关系;

接收专利搜索请求,所述专利搜索请求的专利搜索请求语包括非著录项目关键词;

获取所述关键词数据库中与所述非著录项目关键词相匹配的关键词;

根据所述关键词与所述对应文本的对应关系确定所述专利搜索请求的专利搜索结果;

返回所述专利搜索结果。

2.根据权利要求1所述的专利搜索的方法,其特征在于,从所述专利文本中提取与所述专利文本的符号相对应的关键词具体包括:

在所述专利文本中识别数字或英文字母或两者的结合获得第一候选符号;

遍历所述专利文本确定所述第一候选符号的出现次数,在所述第一候选符号中去除只出现一次的候选符号,获得第二候选符号;

比对相同的所述第二候选符号中每一个第二候选符号相邻位置的文字,将重复出现的文字相邻的第二候选符号确定为所述专利文本的符号。

3.根据权利要求2所述的专利搜索的方法,其特征在于,在比对相同的所述第二候选符号中每一个第二候选符号相邻位置的文字,将重复出现的文字相邻的第二候选符号确定为所述专利文本的符号之后,还包括:

将符号相邻位置重复出现的文字确定为所述专利文本的符号名称;

存储所述符号名称与所述符号的对应关系。

4.根据权利要求3所述的专利搜索的方法,其特征在于,所述符号名称的权重与所述符号名称在所述专利文本中出现的频率正相关。

5.根据权利要求4所述的专利搜索的方法,其特征在于,根据所述符号名称在每一个专利文本中的权重确定所述专利文本对应的专利在所述专利搜索结果中的排序。

6.根据权利要求4或5所述的专利搜索的方法,其特征在于,在将符号相邻位置重复出现的文字确定为所述专利文本的符号名称之后,还包括:

对所述符号名称进行分类,获得符号名称类别以及所述符号名称类别的权重,所述符号名称类别的权重为该类符号名称的权重之和;

以所述符号名称类别的权重为所述符号名称类别中的每一个符号名称的权重。

7.根据权利要求3所述的专利搜索的方法,其特征在于,在对专利数据库中的专利文本全文或指定部分进行识别,从所述专利文本中提取与所述专利文本的符号相对应的关键词之后,还包括:

在所述专利文本的附图的相邻区域配置对应的用于链接所述符号名称的符号控件。

8.根据权利要求3所述的专利搜索的方法,其特征在于,在所述专利文本的附图区域中的符号的相邻位置配置对应的符号名称。

9.一种服务器,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行根据权利要求1-8任一项所述的方法。

10.一种计算机可读介质,其特征在于,所述计算机存储介质有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行根据权利要求1-8任一项所述的方法。

说明书
技术领域

本发明涉及计算机通信领域,具体涉及专利搜索的方法、服务器及计算机可读介质。

在当前这个技术高速革新、新的发明创造不断涌现的时代,每天都有大量的发明创造以专利申请的形式提交,每周都有大量的新专利公开和授权。而对于从事发明创造工作,或对发明创造及其成果感兴趣的个人和组织机构而言,对这些包括发明创造的专利信息进行充分的挖掘,通过检索和分析来研究其内容并加以利用,就是一件非常有意义的事情。但因为专利申请中往往包括了很多相对不具价值的“垃圾”专利,导致从大量检索到的专利文献中出实际需要的具有高价值的专利变得十分困难。传统的专利检索方法仅仅以搜索引擎提供的“相关度”排序,它过于依赖表象的专利检索关键词,用户难以快速到实际需要的具有高价值的专利。

因此,亟需一种全新的专利搜索方法,以出用户实际需要的具有高价值的专利。

本发明正是基于上述问题,提出了专利搜索的方法、服务器及计算机可读介质,使用户可以快速到实际需要的具有高价值的专利。

有鉴于此,本发明实施例第一方面提供了专利搜索的方法,该方法包括:

对专利数据库中的专利文本全文或指定部分进行识别,从所述专利文本中提取与所述专利文本的符号相对应的关键词;

将提取到的所述关键词存储到关键词数据库,并存储所述关键词与对应的专利文本的对应关系;

接收专利搜索请求,所述专利搜索请求包括非著录项目关键词;

获取所述关键词数据库中与所述非著录项目关键词相匹配的关键词;

根据所述关键词与所述对应文本的对应关系确定所述专利搜索请求的专利搜索结果;

返回所述专利搜索结果。

在一些可能设计中,从所述专利文本中提取与所述专利文本的符号相对应的关键词具体包括:

在所述专利文本中识别数字或英文字母或两者的结合获得第一候选符号;

遍历所述专利文本确定所述第一候选符号的出现次数,在所述第一候选符号中去除只出现一次的候选符号,获得第二候选符号;

比对相同的所述第二候选符号中每一个第二候选符号相邻位置的文字,将重复出现的文字相邻的第二候选符号确定为所述专利文本的符号。

在一些可能设计中,在比对相同的所述第二候选符号中每一个第二候选符号相邻位置的文字,将重复出现的文字相邻的第二候选符号确定为所述专利文本的符号之后,还包括:

将符号相邻位置重复出现的文字确定为所述专利文本的符号名称;

存储所述符号名称与所述符号的对应关系。

在一些可能设计中,所述符号名称的权重与所述符号名称在所述专利文本中出现的频率正相关。

在一些可能设计中,根据所述符号名称在每一个专利文本中的权重确定所述专利文本对应的专利在所述专利搜索结果中的排序。

在一些可能设计中,在将符号相邻位置重复出现的文字确定为所述专利文本的符号名称之后,还包括:

对所述符号名称进行分类,获得符号名称类别以及所述符号名称类别的权重,所述符号名称类别的权重为该类符号名称的权重之和;

以所述符号名称类别的权重为所述符号名称类别中的每一个符号名称的权重。

在一些可能设计中,在对专利数据库中的专利文本全文或指定部分进行识别,从所述专利文本中提取与所述专利文本的符号相对应的关键词之后,还包括:

在所述专利文本的附图的相邻区域配置对应的用于链接所述符号名称的符号控件。

在一些可能设计中,在所述专利文本的附图区域中的符号的相邻位置配置对应的符号名称。

本发明实施例第二方面提供一种服务器,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行第一方面或第一方面的任意可能设计中的方法。

本发明实施例第三方面提供一种计算机可读介质,所述计算机存储介质有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行第一方面或第一方面的任意可能设计中的方法。

本发明实施例的技术方案通过对专利数据库中的专利文本全文或指定部分进行识别,从所述专利文本中提取与所述专利文本的符号相对应的关键词;将提取到的所述关键词存储到关键词数据库,并存储所述关键词与对应的专利文本的对应关系;接收专利搜索请求,所述专利搜索请求包括非著录项目关键词;获取所述关键词数据库中与所述非著录项目关键词相匹配的关键词;根据所述关键词与所述对应文本的对应关系确定所述专利搜索请求的专利搜索结果;返回所述专利搜索结果,使用户可以快速到实际需要的具有高价值的专利。

为了更清楚地说明本发明实施例的技术方案,下面对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1为本发明实施例提供的专利搜索系统的系统架构示意图;

图2为本发明实施例提供的专利搜索的方法的示意性流程图;

图3为本发明实施例提供的一种服务器的结构示意图。

需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合及所有可能组合,并且包括这些组合。

如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

下面将参见图1并结合实施例来详细说明本发明。

在本发明的一些实施例中,本发明提供一种专利搜索系统100,所述专利搜索系统包括终端101和服务器102。

应理解,在本发明实施例中,所述终端101在本领域中也可以为客户端,且所述终端101至少为一个。具体实现中,本发明实施例中描述的终端101包括但不限于诸如移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在本发明的某些实施例中,所述设备并非便携式通信设备,例如台式个人计算机或者大型工作站等。

在接下来的讨论中,描述了包括显示器和输入设备的终端。然而,应当理解的是,所述终端101可以包括诸如物理键盘、鼠标和/或控制杆的一个或多个其它物理用户接口设备。

应理解,所述终端101和服务器102可以是物理设备,也可以是设置于物理设备中的装置、单元或模块;另外,所述终端101和服务器102可以在同一物理设备上实现,也可以分别在不同的物理设备上实现。

在本发明的一些实施例中,所述服务器102可以是局域网服务器,也可以是本地服务器,但不仅限于此。需要说明的是,所述服务器102可以为一个,也可以为多个,本领域技术人员可以根据实际需要选择不同数量的服务器以达到提高搜索效率的效果。其中,所述服务器102与专利数据库连接,其中的连接关系具体包括:所述专利数据库包括于所述服务器102中,或所述专利数据库独立于所述服务器102,应理解,上述两种实施例只是本发明的一些较佳实施例,并不代表本发明只有上述两种情况。

如图2所示的专利搜索的方法包括:

步骤S01:对专利数据库中的专利文本全文或指定部分进行识别,从所述专利文本中提取与所述专利文本的符号相对应的关键词。

在本发明的一些实施例中,按照所述专利文本的种类,所述专利文本包括专利公开文本和专利授权文本,专利公开文本为申请人提交到专利局的原始文本,专利授权文本为经过申请人修改之后专利局认为符合授予专利权要求的最终公告文本。具体地,按照所述专利文本的保护对象,所述专利文本包括具有附图的发明专利文本或者实用新型专利文本,更具体地,所述发明专利文本包括摘要、摘要附图、说明书、权利要求书、说明书附图;所述实用新型专利文本包括摘要、摘要附图、说明书、权利要求书、说明书附图。所述专利文本还不限于此,所述专利文本还可以是美国专利文本、日本专利文本、欧洲专利文本、以及其他国家专利文本,但以各国或各地区所指定的法条法规或者约定协议为限。前述只是本发明实施例中的一些较佳实施例,在此不再一一穷举。

需要说明的是,所述专利文本指定部分可以为用户对于所述专利文本中的部分内容进行指定,当用户不对所述专利文本的内容进行指定时,所述服务器102还会根据预设规则指定所述专利文本的全文内容或部分内容。所述预设规则为用户预先设定的指定所述专利文本的内容的规则,即用户可以预先指定所述专利文本的全文内容或部分内容。所述服务器102在用户没有进行额外操作指令时默认按照所述预设规则对所述专利文本进行指定。例如,用户可以指定所述专利文本的说明书中的具体实施方式部分,或者用户预先指定所述专利文本的说明书中的具体实施方式部分,但不限于此。应理解,所述专利文本指定部分为所述专利文本的文字部分,而非所述专利文本的附图。

应理解,所述服务器102对专利数据库中的专利文本全文或指定内容进行识别,识别的方式可以有多种,例如,当所述专利文本为PDF格式,或TIF格式或其他图片格式时,可以通过图像识别,对所述专利文本中进行识别;当所述专利文本为文字格式,例如WORD文档格式或TXT文档格式时,可以通过文本内容识别,对所述专利文本的文字部分进行数据分析,也可以不限于此,用其他方式来对所述专利文本全文或指定内容进行识别。

在本发明的一些实施例中,所述专利文本的符号可以包括多种符号,例如,所述专利文本的符号可以包括所述专利文本的附图标号,还可以包括所述专利文本的附图标号以外的符号,但不限于此。

在本发明的一些实施例中,常见的符号包括如下种类:

(1)数字类型的符号。比如“机身100”中的“100”就是数字类型的符号。数字类型的符号既可以是单个数字,也可以是有多个字符的数字字符串,具体不作限定。

(2)数字和字母两者相结合的符号。比如“壳体100a”中的“100a”就是数字和字母相结合的符号。

(3)字母形式的符号。比如,比如“第一转轴a”中的“a”就是字母形式的符号。

(4)其它由用户设定的符号形式。除了前面所说明的符号的类型之外,还包括其它的符号类型。符号也没有特定的限制,既有约定俗成的形式,也有用户根据实际的需求灵活设定的形式。

在本发明的一些实施例中,与所述专利文本的符号相对应的关键词具体为在所述专利文本中所述符号相邻位置的短语,所述的短语主要包括词或词组,还有可能是简化的词语,例如英文缩写,或中文简称。例如,“机身100”,其中的“机身”就是短语形式的关键词,其中的“100”为与其对应的符号;例如,“PC01”,其中的“PC”是personal computer(个人计算机)的英文缩写;例如,“直流电机18”,其中的“直流电机”是直流电动机的中文简称。需要说明的是,在所述专利文本中,所述符号与对应的关键词同时出现,而且,所述关键词通常在所述符号之前,两者之间不允许出现除了空格之外的其他标点符号或字符。当然,对于一些特殊的情况,也有可能将所述关键词写在对应的符号之后,两者之间不出现除了空格之外的其它标点符号或字符,例如,在所述专利文本的说明书部分中,“提供一底座4,所述底座4上固定安装有照明装置5。”中的“底座4”,“底座”与“4”在所述专利文本的说明书中的具体实施方式部分中没有除了空格之外的其他标点符号或字符,另外,关键词“底座”位于“4”之后,但不限于此。

进一步地,从所述专利文本中提取与所述专利文本的符号相对应的关键词具体包括:在所述专利文本中识别数字或英文字母或两者的结合获得第一候选符号;遍历所述专利文本确定所述第一候选符号的出现次数,在所述第一候选符号中去除只出现一次的候选符号,获得第二候选符号;比对相同的所述第二候选符号中每一个第二候选符号相邻位置的文字,将重复出现的文字相邻的第二候选符号确定为所述专利文本的符号。

在本发明的一些实施例中,所述专利文本的符号还可以通过其他方式进行确定,例如,首先在所述专利文本中获取符号,所述符号为数字或英文字母或两者的结合,当然还可以为其他形式的符号。并且,在所述专利文本中获取符号不仅可以通过在所述专利文本的附图中获取,也可以在所述专利文本的文字内容部分获取,也可以不限于此,本领域技术人员可以根据实际情况选择需要的获取符号的方式。此时,所述服务器102将从所述专利文本中获取的符号作为所述第一候选符号,所述第一候选符号的获得是为了后续步骤中获取更准确的符号。

例如,在一个专利文本中识别数字或英文字母或两者的结合,获取“20”、“21”、“22”、“23”、“24”、“25”、“26”、“27”、“28”等作为所述专利文本中的第一候选符号。通过第一次遍历,查所述第一候选符号在所述专利文本中出现的次数,当候选符号“20”、“23”、“26”、“27”在所述专利文本中只出现一次,这说明所述候选符号“20”、“23”、“26”、“27”与所述专利文本相关程度不高,从而相对于所述专利文本来说重要程度不高,因此,获取所述专利文本的关键词中应当不包含在所述专利文本中只出现一次的符号,从而可以将只出现一次的符号“20”、“23”、“26”、“27”从所述专利文本中到的所有第一候选符号中去掉。因而,在第一次遍历后,所述专利文本的候选候选符号为“21”、“22”、“24”、“25”、“28”,为了方便说明之前的所述第一候选符号,因此,将候选符号为“21”、“22”、“24”、“25”、“28”作为所述专利文本的第二候选符号。

更具体地,再进行第二次遍历,查与所述第二候选符号相对应的符号名称,首先,根据在所述专利文本中符号名称位于所述第二候选符号相邻位置的位置关系,以所述第二候选符号“28”为例进行描述,此时所述第二候选符号“28”的符号名称为“光源”,但并不因此作出限定。对符号“28”之前的第一个字符进行遍历,获取所有符号“28”之前的第一个字符,确定所述第一个字符是否在所有符号“28”之前都是相同的,若是相同的,存储所述第一个字符,此时第一个字符为“光”;进行第三次遍历,对符号“28”之前的第二个字符进行遍历,获取所有符号“28”之前的第二个字符,确定所述第二个字符是否在所有符号“28”之前都是相同的,若是相同的,存储所述第二个字符,此时第一个字符为“源”;进行第四次遍历,对符号“28”之前的第三个字符进行遍历,获取所有符号“28”之前的第三个字符,确定所述第三个字符是否在所有符号“28”之前都是相同的,若是相同的,存储所述第三个字符,所述第三个字符为“述”,同理进行第五次遍历获得第四个字符“所”,在进行第六次遍历时发现此时所述第五个字符在所有符号“28”之前都是不相同的,因此停止遍历,获得一共四个字符“所述光源”。

更具体地,由于“所述”为与所述专利文本内容无关的限定词,因此将所述第三个字符和所述第四个字符“所述”去掉,从而获得与所述第二候选符号“28”对应的符号名称为“光源”,此时,所述第二候选符号“28”为所述专利文本的符号,所述“光源”为与所述第二候选符号“28”相对应的关键词。

上述举例均为本发明的一些较佳实施例,但并不因此作出限定。需要说明的是,通过遍历可以获得所述第二候选符号对应的符号名称,不仅可以从所述第二候选标号之前的相邻位置进行遍历,还可以从所述第二候选标号之后的相邻位置进行遍历,遍历至没有重复的文字停止遍历。应理解,针对数字或字母或两者的结合或其他形式的符号,考虑到这些符号包括单个字符形式和字符串形式的符号,所述服务器102在进行第一次遍历时,将相邻位置的单个字符形式的符号组合成为字符串形式的符号,并作为组合成的字符串形式的符号作为所述专利文本的第一候选符号;若单个字符形式的符号相邻位置没有其他单个字符形式的符号,则将该单个字符形式的符号作为所述专利文本的第一候选符号。

在本发明的一些实施例中,所述服务器102在所述专利文本中进行遍历,从而获得所述第一候选符号在所述专利文本中的出现次数。更具体地,所述服务器102在所述第一候选符号中取出只出现一席的候选符号,获得所述第二候选符号,从而可以使得所述服务器102更容易获取与所述专利文本相关度更大的关键词。

在本发明的一些实施例中,所述服务器102还将所述第二候选符号中每一个第二候选符号相邻位置的文字都进行对比,并将重复出现的文字相邻的第二候选符号确定为所述专利文本的符号。由于所述第二候选符号中可能出现与所述专利文本内容无关的符号,例如“图1”、“步骤S1”、“(1)”,这些是需要去掉的,但是,如果在遍历过程中,所述专利文本中出现“图1”时,“图1”之前相邻位置的文字也重复出现,从而组成“标图1”或“海景图1”或其他带有“图1”的短语或名词时,将所述专利文本中出现的“图1”予以保留,不能去掉。另外,应当说明的是,由于标点符号不涉及所述专利文本的内容,无法根据标点符号获得关键词,因此所述第一候选符号、所述第二候选符号以及所述专利文本的符号均不包括标点符号。因此,为了筛选出与所述专利文本内容相关程度较高的符号以及符号名称,因此,需要在确定所述符号所对应的符号名称或关键词中,如果出现如“第一”或其他表示逻辑顺序的序数词、“步骤”以及“所述”等的限定用语时,要将所述限定用语去掉。需要说明的是除了上述列举的之外,限定用语还可以不限于此。因此,将重复出现的文字相邻的第二候选符号确定为所述专利文本的符号,从而可以将与所述专利文本无关的符号去掉。

进一步地,在比对相同的所述第二候选符号中每一个第二候选符号相邻位置的文字,将重复出现的文字相邻的第二候选符号确定为所述专利文本的符号之后,还包括:将符号相邻位置重复出现的文字确定为所述专利文本的符号名称;存储所述符号名称与所述符号的对应关系。

在本发明的一些实施例中,所述符号相邻位置重复出现的文字是对所述符号的具体解释,即符号相邻位置重复出现的文字为符号名称。所述服务器102将将符号相邻位置重复出现的文字确定为所述专利文本的符号名称,所述服务器还将所述符号名称与所述符号进行存储。

需要说明的是,所述符号名称的主要形式有两种,分别是短语与句子。所述的短语,主要包括词或词组。对于描述结构关系的附图来说,短语形式的符号名称是主要形式。比如,“机身100”,其中的“机身”就是短语形式的符号名称,其中的“100”为与其对应的符号。

进一步地,所述符号名称的权重与所述符号名称在所述专利文本中出现的频率正相关。

在本发明的一些实施例中,所述符号名称在所述专利文本中出现的频率越高,说明所述符号名称与所述专利文本的相关度越高,从而所述服务器102通过所述符号名称更容易到实际需要的具有高价值的专利文本。因此,将所述符号名称的权重与所述符号名称在所述专利文本中出现的频率正相关,当所述符号名称在所述专利文本中出现的频率越高,所述符号名称在所述专利文本中的权重就越高,所述服务器102也更快更容易到实际需要的具有高价值的专利文本。

进一步地,在将符号相邻位置重复出现的文字确定为所述专利文本的符号名称之后,还包括:对所述符号名称进行分类,获得符号名称类别以及所述符号名称类别的权重,所述符号名称类别的权重为该类符号名称的权重之和;以所述符号名称类别的权重为所述符号名称类别中的每一个符号名称的权重。

在本发明的一些实施例中,为了将所述符号名称更好地整理,减小所述服务器102的运算负荷,所述服务器102还将所述符号名称进行分类,将同类的符号名称作为一类符号名称,并与其他类的符号名称区分开,此时所述服务器102获得符号名称类别以及所述符号名称类别的权重。需要说明的是,所述符号名称类别的权重为该类符号名称的权重之和。更具体地,每个符号名称类别中每一个符号名称的权重也可以为所述符号名称类别的权重,从而将分散的不同符号名称关联起来,大大提高了所述服务器102的工作效率。

在本发明的一个实施例中,为了具体描述,以“第一侧面101”、“第二侧面102”、“第三侧面103”、“第四侧面104”、“第一底面120”以及“第二底面130”为例进行描述,但不对此进行限制。“第一侧面101”、“第二侧面102”、“第三侧面103”、“第四侧面104”、“第一底面120”以及“第二底面130”均为不同的符号和符号名称,但是可以分成两类进行整理,“第一侧面101”、“第二侧面102”、“第三侧面103”、“第四侧面104”可以归为“侧面”的类别中,“第一底面120”以及“第二底面130”可以归为“底面”一类中,“侧面”在所述专利文本中的权重为“第一侧面101”、“第二侧面102”、“第三侧面103”、“第四侧面104”在所述专利文本中的权重之和,同时“第一侧面101”、“第二侧面102”、“第三侧面103”、“第四侧面104”中的每一个在所述专利文本中的权重也可以为“侧面”在所述专利文本中的权重,即所述权重之和,以此类推,“第一底面120”、“第二底面130”以及“底面”同样如此。

进一步地,在对专利数据库中的专利文本全文或指定部分进行识别,从所述专利文本中提取与所述专利文本的符号相对应的关键词之后,还包括:在所述专利文本的附图的相邻区域配置对应的用于链接所述符号名称的符号控件。

在本发明的一些实施例中,需要说明的是,所述符号控件包括标签控件、按钮控件、旋转控件、动画控件或者滑标控件,所述符号控件还可以为其他控件,在此不再一一穷举。优选的,所述符号控件具体为标签控件,用户可以通过在所述终端101上点击符号直接向所述服务器102发送获取与所述符号对应的符号名称的请求,在本发明的一些实施例中,所述符号控件为标签控件为例进行描述,但并不因此限定。所述服务器102接收到所述获取与所述符号相匹配的符号名称的请求后,所述服务器102向所述终端101返回所述符号与对应的符号名称之间的对应关系,此时用户无需自己将所述符号与对应的符号名称进行一一对应,而是所述服务器102自动整理,更加方便用户,节约了用户的精力和时间。在本发明的另一些实施例中,还可以为所述符号控件具体为标签控件,所述服务器102预先向所述终端101发送所述符号和与所述符号相对应的符号名称以及两者之间的对应关系,用户通过在所述终端101上点击选择的符号,从而所述终端101自动在客户端上直接跳到与是符号相对应的符号名称的位置并显示出来,无需通过所述服务器102进行运算,这也大大减小了所述服务器102的运算负荷,同时减小了所述终端101与所述服务器102的反应时间,大大提升了用户的体验。

需要说明的是,用户点击所述标签控件可以通过在触摸显示屏上进行触摸点击的方式进行,也可以通过用鼠标点击的方式进行。

进一步地,在所述专利文本的附图区域中的符号的相邻位置配置对应的符号名称。

需要说明的是,用户需要通过所述终端101获得所述专利文本时,所述终端101上往往显示的是所述专利文本全文以及所述专利文本的附图,但是所述专利文本的文字内容与附图是分开显示的,用户往往需要花费很多精力和时间将所述专利文本的文字内容与附图一一对应,从而获得自己实际需要的具有高价值的信息。在本发明的一些实施例中,可以在所述专利文本的附图旁边的空白区域中配置与附图对应的符号,以及与所述符号相对应的符号名称。其中,配置的符号与对应的符号名称处于相邻位置,从而能让用户快速地到自己实际需要的符号以及对应的符号。

步骤S02:将提取到的所述关键词存储到关键词数据库,并存储所述关键词与对应的专利文本的对应关系。

在本发明的一些实施例中,所述服务器102首先建立一个关键词数据库,所述关键词数据库用于存储提取到的所述关键词,并且存储所述关键词与对应的专利文本的对应关系。此时,所述符号名称为所述服务器102存储进所述关键词数据库中的关键词,所述符号名称与所述符号的对应关系即为所述服务器102从所述专利文本提取到的所述关键词与所述符号之间的对应关系。例如,所述对应关系可以为如下关系:当所述服务器102从所述关键词数据库中调取出所需要的关键词时,同时也调取出与所述需要的关键词对应的专利文本,还可以为其他对应关系,不限于此。因此,通过从所述专利文本中提取所述关键词并获得与所述关键词对应的对应关系,使得所述服务器102调取所述专利文本更加准确,也更容易到实际需要的具有高价值的专利文本。

步骤S03:接收专利搜索请求,所述专利搜索请求包括非著录项目关键词。

应理解,所述专利搜索请求具体可以为用户通过至少一个终端101输入专利检索关键词后提交的专利搜索请求,所述专利搜索请求具体包括专利检索关键词以及其他相关信息。在本发明的一些实施例中,所述专利搜索请求包括非著录项目关键词,其中,著录项目关键词包括:申请号、申请日、发明创造名称、分类号、优先权事项(包括在先申请的申请号、申请日和原受理机构的名称)、申请人或者专利权人事项(包括申请人或者专利权人的姓名或者名称、国籍或者注册的国家或地区、地址、、组织机构代码或者居民身份证件号码)、发明人姓名、专利代理事项(包括专利代理机构的名称、机构代码、地址、、专利代理人姓名、执业证号码、)、联系人事项(包括姓名、地址、、)以及代表人等。其中有关人事的著录项目关键词有:申请人或者专利权人事项、发明人姓名、专利代理事项、联系人事项、代表人。例如,所述专利搜索请求包括的非著录项目关键词可以是关于所述专利文本的主题的关键词,或对应专利文本中的专利摘要、权利要求或说明书任一部分中的文本内容的关键词,例如,汽车,显示面板等,还可以为其他关键词,不仅限于此。

在本发明的一些实施例中,所述专利搜索请求具体为所述至少一个终端101为获取目标专利而向所述服务器102发送的专利搜索请求,具体为,所述至少一个终端101与服务器102进行网络连接后,用户打开至少一个终端101的客户端,向所述至少一个终端101的客户端输入专利搜索请求,所述至少一个终端101获取所述专利搜索请求后,向所述服务器102发送所述专利搜索请求。具体地,所述客户端可以为浏览器,也可以为APP软件,还可以不限于此。

需要说明的是,所述服务器102在接收所述至少一个终端101发送的专利搜索请求之前,所述至少一个终端101还向所述服务器102发送所述至少一个终端101中的每一个终端的地址信息,其中,所述地址信息包括有每一个终端的域名。所述服务器102在接收到所述至少一个终端101发送的地址信息之后,所述服务器102向所述至少一个终端101返回专利搜索页面信息,用于当所述至少一个终端101接收所述专利搜索页面信息后,用户可以在所述至少一个终端101的客户端上显示的专利搜索页面中进行操作,输入所需要的目标专利文本的专利搜索请求。

步骤S04:获取所述关键词数据库中与所述非著录项目关键词相匹配的关键词。

在本发明的一些实施例中,所述专利搜索请求根据用户在所述至少一个终端101所显示的专利搜索页面输入的关键词生成。具体地,用户通过至少一个终端101输入专利检索关键词后提交的专利搜索请求,具体地,所述至少一个终端101可以根据用户输入的专利检索关键词进行归类整理。优选的,所述服务器102也可以根据用户发送的专利检索关键词指令进行归类整理,从而生成更加准确的关键词。

在本发明的一些实施例中,所述服务器102根据归类整理之后生成的关键词,从所述关键词数据库中获取与所述非著录项目关键词相匹配的关键词。其中,所述服务器102首先对所述归类整理后生成的关键词与所述关键词数据库中的关键词进行解析和匹配。

更具体地,对关键词进行匹配的方式可以通过相似率进行匹配,例如,确认在所述关键词数据库中是否存在与所述归类整理后生成的关键词相似率大于或等于90%的关键词,若存在,所述服务器102将所述相似率大于或等于90%的关键词作为与所述非著录项目关键词相匹配的关键词。另外,对关键词进行匹配的方式还可以为其他方式,不仅限于此。

步骤S05:根据所述关键词与所述对应文本的对应关系确定所述专利搜索请求的专利搜索结果;返回所述专利搜索结果。

在本发明的一些实施例中,所述专利搜索结果具体可以为与所述专利搜索请求相对应的专利文本内容(包括附图),可以为与所述专利搜索请求相对应的专利文本的著录项目信息,还可以是与所述专利搜索请求相对应的专利文本的排序的列表,也可以是根据与所述专利搜索请求相对应的专利文本中提取的关键词的权重对所述专利文本进行排序的列表,甚至可以是上述与所述专利搜索请求对应的信息的任意组合,但不仅限于此,所述专利搜索结果可以为与所述专利搜索请求相对应的任意信息,本领域技术人员可以根据实际需求确定输出的所述专利搜索结果的具体内容。

在本发明的一些实施例中,由于所述关键词库中还存储有与关键词具有对应关系的专利文本,因此,所述服务器102在获得步骤S04中与所述非著录项目关键词相匹配的关键词之后,所述服务器102从而可以获得与所述专利搜索请求相匹配的专利搜索结果,此时,所述服务器102获得的专利搜索结果与所述专利搜索请求的相关性是较大的。

在本发明的一些实施例中,在获得与所述专利搜索请求相匹配的专利搜索结果之后,所述服务器102将与所述专利搜索请求相匹配的专利搜索结果存储于临时存储空间中,并向所述终端101返回所述专利搜索结果,从而完成整个专利搜索的过程。其中,由于所述终端101至少为一个,为了避免至少一个终端在同一个时间段(例如10分钟)内发送相同的专利搜索请求,所述服务器102需要进行两次重复的数据处理的问题,所述服务器102还配置有临时存储空间,并且预设临时存储时间,超过预设临时存储时间之后所述服务器102自动清除所述临时存储空间中的专利搜索结果数据。例如,设定临时存储时间为24小时,还可以设定为其他时间,不仅限于此。所述服务器102可以将临时存储空间中的与所述专利搜索请求相匹配的专利搜索结果发送给不同的终端101。

在本发明的一些实施例中,所述至少一个终端101在接收到与所述专利搜索请求相匹配的专利搜索结果之后,在所述至少一个终端101的客户端上显示所述专利搜索结果,从而让用户可以直接在所述至少一个终端101的显示器中直观地查看。可选地,所述显示器可以为触摸屏显示器和/或触摸板,也可以为非触摸式显示器和/或触摸板,也可以不限于此。

进一步地,根据所述符号名称在每一个专利文本中的权重确定所述专利文本对应的专利在所述专利搜索结果中的排序。

在本发明的一些实施例中,所述服务器102根据所述符号名称在每一个专利文本中的权重确定所述专利文本对应的专利在所述专利搜索结果中的排序,当所述符号名称在所述专利文本中所占的权重越高,所述专利文本在所述专利搜索结果中的排序就越靠前,从而用户在对所述至少一个终端101进行操作输入非著录项目关键词,并发送所述专利搜索请求时,在获得的专利搜索结果就更快更容易到与所述非著录项目关键词相匹配的专利文本。

参见图3,图3为本发明实施例提供的一种搜索服务器的结构示意图。本实施例的搜索服务器包括的各组件用于执行前述实施例中的各步骤,具体请参阅前述实施例中的相关描述,此处不赘述。本实施例的搜索服务器包括处理器302、输入设备(图未示)、输出设备(图未示)和存储器306,所述处理器302、输入设备和存储器306相互连接,其中,所述存储器306用于存储计算机程序3061,所述计算机程序3061包括程序指令,所述程序指令当被处理器执行时使所述处理器执行前述本发明实施例的各个方法。

可选地,本发明实施例提供的搜索服务器的结构包括至少一个处理器302(例如CPU),至少一个网络接口305或者其他通信接口,存储器306,和至少一个通信总线303;通信总线303用于实现这些部件之间的连接通信。处理器302用于执行存储器306中存储的可执行模块,例如计算机程序。存储器306可能包括高速随机存取存储器(RandomAccessMemory,RAM),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个网络接口305(可以是有线或者无线)实现与至少一个其他网元之间的通信连接。

在一些实施方式中,存储器306存储了程序3061,处理器302执行程序3061,用于执行前述本发明实施例的各个方法。

所述计算机可读介质可以是前述任一实施例所述的服务器的内部存储单元,例如服务器的硬盘或内存。所述计算机可读介质也可以是所述服务器的外部存储设备,例如所述服务器上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读介质还可以既包括所述服务器的内部存储单元也包括外部存储设备。所述计算机可读介质用于存储所述计算机程序及所述服务器所需的其他程序和数据。所述计算机可读介质还可以用于暂时地存储已经输出或者将要输出的数据。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经根据功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的方法、装置和服务器的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本发明所提供的几个实施例中,应该理解到,所揭露的方法、装置和服务器,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

本文发布于:2024-09-22 19:36:52,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/68155.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议