专利评估判定方法、专利评估判定装置以及专利评估判定程序

著录项
  • CN201880002848.4
  • 20180731
  • CN111194457A
  • 20200522
  • 株式会社艾飒木兰
  • 白坂一;三上崇志
  • G06Q50/18
  • G06Q50/18

  • 日本东京都
  • 日本(JP)
  • 北京律诚同业知识产权代理有限公司
  • 王玉双;高龙鑫
  • 20190116
摘要
专利评估判定方法以包含以下步骤的方式得以构成:接收发明相关的发明文本的输入的发明输入步骤、在以单词单位对所述输入的发明文本进行语法分析的基础上提取所述发明文本中的任意检索关键词的关键词提取步骤、用所述提取的检索关键词从数据库中提取包含该检索关键词的专利文本组的专利文本组提取步骤、比较所述发明文本以及所述专利文本组所包含的文本来判定所述发明文本的专利性的判定步骤。
权利要求

1.一种专利评估判定方法,其特征在于,包含:

接收发明相关的发明文本的输入的发明输入步骤、

在以单词单位对所述输入的发明文本进行语法分析的基础上,提取所述发明文本中的任意检索关键词的关键词提取步骤、

用所述提取的检索关键词从数据库中提取包含该检索关键词的专利文本组的专利文本组提取步骤、以及

比较所述发明文本以及所述专利文本组所包含的文本来判定所述发明文本的专利性的判定步骤。

2.如权利要求1所述的专利评估判定方法,其特征在于,

所述判定步骤基于所述发明文本以及所述专利文本组所包含的文本的编辑距离来判定所述发明文本的专利性。

3.如权利要求2所述的专利评估判定方法,其特征在于,

所述判定步骤基于用所述专利文本组所包含的文本的编辑距离的倒数乘以所述发明文本的长度指数以及所述检索关键词的含有率而得的结果来判定所述发明文本的专利性。

4.如权利要求2或3所述的专利评估判定方法,其特征在于,

所述判定步骤在把所述发明文本切分成单个构成要素的基础上,基于切分的所述单个构成要素与所述专利文本组所包含的文本之间的编辑距离来判定所述发明文本的专利性。

5.如权利要求1~4中任一项所述的专利评估判定方法,其特征在于,

所述专利文本组提取步骤提取所述专利文本组附带的专利分类,从该提取的专利分类中选择提取数多的排名靠前的专利分类,并用所述检索关键词以及所述选择的排名靠前的专利分类再一次提取所述专利文本组。

6.如权利要求5所述的专利评估判定方法,其特征在于,

所述专利文本组提取步骤从用所述检索关键词以及所述选择的排名靠前的专利分类得到的所述专利文本组中,提炼出在分布式表示空间中与所述检索关键词邻近的专利组,并将该提炼结果提取为所述专利文本组。

7.如权利要求1~6中任一项所述的专利评估判定方法,其特征在于,

所述判定步骤通过比较所述发明文本以及所述专利文本组所包含的文本,来提取与所述发明文本类似的专利文本,并基于对所述发明文本以及该提取的专利文本的类似度的判定来判定所述发明文本的专利性。

8.一种专利评估判定装置,其特征在于,包含:

接收发明相关的发明文本的输入的发明输入部、

在以单词单位对所述输入的发明文本进行语法分析的基础上,提取所述发明文本中的任意检索关键词的关键词提取部、

用所述提取的检索关键词从数据库中提取包含该检索关键词的专利文本组的专利文本组提取部、以及

比较所述发明文本以及所述专利文本组所包含的文本来判定所述发明文本的专利性的判定部。

9.一种专利评估判定程序,其特征在于,

在电脑中实现:

接收发明相关的发明文本的输入的发明输入功能、

在以单词单位对所述输入的发明文本进行语法分析的基础上,提取所述发明文本中的任意检索关键词的关键词提取功能、

用所述提取的检索关键词从数据库中提取包含该检索关键词的专利文本组的专利文本组提取功能、以及

比较所述发明文本以及所述专利文本组所包含的文本来判定所述发明文本的专利性的判定功能。

说明书
技术领域

本发明涉及专利评估判定方法、专利评估判定装置以及专利评估判定程序。

随着信息处理技术的发展,进行各种模拟成为可能。即,由于高性能的信息处理终端变得容易获得,从而能由较多的人来廉价地处理复杂的算法。

由于专利从申请到授权要产生较多的费用,因此可在申请前实施现有技术检索,但检索也会产生费用。因此,作为模拟的一种技术,存在发明专利等的专利性判定技术。例如,专利文献1中记载了当专利申请A的权利要求1所包含的语素组中一定比例以上的语素也被包含在别的专利申请B的说明书中时,判定专利申请B与专利申请A类似。另外,在专利文献1中记载了如TF(Term Frequency)·IDF(Inverse Document Frequency)法所述,还可在引入每个语素的重要性的基础上判定类似与否。

然而,如上所述,在专利文献1中检索的是作为评估对象的专利的权利要求所包含的单词是否被包含在别的专利申请的整个说明书中,从而分析不了单词被用在怎样的语句中。即,即使与作为评估对象的专利所表达的意思完全不同,只要包含相同的单词,就会被判定为类似专利。

现有技术文献

专利文献

专利文献1:日本特开2009-238074号公报

发明要解决的问题

因此,本发明是鉴于上述情况而完成的,其目的在于,提供能以更高的精度来判定与评估对象专利(发明)相类似的专利文献是否已经公知的专利评估判定方法、专利评估判定装置以及专利评估判定程序。

用于解决问题的方法

(1)本发明的第一方面涉及一种专利评估判定方法,其特征在于,包含:接收发明相关的发明文本的输入的发明输入步骤、在以单词单位对上述输入的发明文本进行语法分析的基础上提取上述发明文本中的任意检索关键词的关键词提取步骤、用上述提取的检索关键词从数据库中提取包含该检索关键词的专利文本组的专利文本组提取步骤、以及比较上述发明文本以及上述专利文本组所包含的文本来判定上述发明文本的专利性判定步骤。

(2)在上述(1)中,上述判定步骤可基于上述发明文本以及上述专利文本组所包含的文本的编辑距离来判定上述发明文本的专利性。

(3)在上述(2)中,上述判定步骤可基于用上述专利文本组所包含的文本的编辑距离的倒数乘以上述发明文本的长度指数以及上述检索关键词的含有率而得的结果来判定上述发明文本的专利性。

(4)在上述(2)或(3)中,上述判定步骤可在将上述发明文本切分为单个构成要素的基础上,基于切分的上述单个构成要素和上述专利文本组所包含的文本之间的编辑距离来判定上述发明文本的专利性。

(5)在上述(1)~(4)中任意一者中,上述专利文本组提取步骤可提取上述专利文本组附带的专利分类,从该提取的专利分类中选择提取数多的排名靠前的专利分类,并用上述检索关键词以及上述选择的排名靠前的专利分类来再次提取上述专利文本组。

(6)在上述(5)中,上述专利文本组提取步骤可从用上述检索关键词以及上述选择的排名靠前的专利分类得到的上述专利文本组中,提炼出与分布式表示空间中的上述检索关键词邻近的专利组,且将该提炼结果提取为上述专利文本组。

(7)在上述(1)~(6)中的任意一者中,上述判定步骤可通过比较上述发明文本以及上述专利文本组所包含的文本,来提取与上述发明文本类似的专利文本,并基于对上述发明文本以及该提取的专利文本的类似度的判定来判定上述发明文本的专利性。

(8)本发明的第二方面涉及一种专利评估判定装置,其特征在于,包含:接收发明相关的发明文本的输入的发明输入部、在以单词单位对上述输入的发明文本进行语法分析的基础上提取上述发明文本中的任意检索关键词的关键词提取部、用上述提取的检索关键词从数据库中提取包含该检索关键词的专利文本组的专利文本组提取部、以及比较上述发明文本以及上述专利文本组所包含的文本来判定上述发明文本的专利性判定部。

(9)本发明的第三方面涉及一种专利评估判定程序,其特征在于,在电脑中实现:接收发明相关的发明文本的输入的发明输入功能、在以单词单位对上述输入的发明文本进行语法分析的基础上提取上述发明文本中的任意检索关键词的关键词提取功能、用上述提取的检索关键词从数据库中提取包含该检索关键词的专利文本组的专利文本组提取功能、以及比较上述发明文本以及上述专利文本组所包含的文本来判定上述发明文本的专利性判定功能。

发明的效果

根据本发明,通过语法分析从发明文本中提取构成发明的技术领域的检索关键词,在此基础上来比较发明文本以及提取的专利文本组所包含的文本,从而能提供以高精度进行专利性判定的专利评估判定方法、专利评估判定装置以及专利评估判定程序。

图1是用于说明专利评估判定系统所进行的处理的一个例子的示意图。

图2是表示专利评估判定系统的结构示意的一个例子的图。

图3是表示用户的终端装置的结构示意的一个例子的图。

图4是表示服务器的结构示意的一个例子的图。

图5是表示判定部给出的发明文本与类似专利的类似评分表的一个例子。

图6是本实施方式的专利评估判定系统根据来自用户的终端装置对发明文本的判定要求来判定该发明文本的专利性,并直至将判定结果发送到用户的终端装置这一连串的流程的操作顺序的一个例子的图。

图7是表示由用户的终端装置的终端显示部所显示的、发明文本输入画面的一个例子的图。

图8是表示由用户的终端装置的终端显示部所显示的、发明文本显示画面的一个例子的图。

图9是表示由用户的终端装置的终端显示部所显示的、发明文本评估画面的一个例子的图。

图10是本实施方式的变形例1的专利评估判定系统根据来自用户的终端装置对发明文本的判定要求来判定该发明文本的专利性,并直至将判定结果发送到用户的终端装置这一连串的流程的操作顺序的一个例子的图。

图11是本实施方式的变形例2的专利评估判定系统根据来自用户的终端装置对发明文本的判定要求来判定该发明文本的专利性,并直至将判定结果发送到用户的终端装置这一连串的流程的操作顺序的一个例子的图。

部件代表符号说明

1 专利评估判定系统

2 用户的终端装置

211 终端通信部

212 终端存储部

213 终端操作部

214 终端显示部

215 终端处理部

3 专利文本提供装置

4 服务器

411 服务器存储部

412 检索关键词提取部

413 专利文本组提取部

414 判定部

415 生成部

416 服务器处理部

417 服务器通信部

5 因特网

以下,参照附图对本发明的一个方面的专利评估判定系统、专利评估判定方法以及专利评估判定程序进行说明。但,请注意,本发明的技术范围并不受这些实施方式限制,还应涉及到权利要求所记载的发明及其等同方案。

专利评估判定系统1的处理概要

图1是用于说明专利评估判定系统1所进行的处理的一个例子的示意图。

专利评估判定系统1具有多个用户的终端装置2、2、2···、专利文本数据库3、与这些多个用户的终端装置2以及专利文本数据库3相互通信的服务器4。服务器4具有从多个用户的终端装置2接收希望进行专利性评估判定的发明文本,且提取代表该发明文本所包含的发明的关键词来作为检索关键词的检索关键词提取部412。服务器4具有基于提取的检索关键词从专利文本数据库3提取类似专利文本组的专利文本组提取部413。进而,服务器4具有对从多个用户的终端装置2、2、2···接收的发明文本和提取的专利文本组进行比较来判定发明文本的专利性的专利性判定部414。进而,服务器4将判定部413判定的专利性评估发送到多个用户的终端装置2、2、2···。

且,在本实施方式中,虽然记载的是将存储于专利文本数据库3的专利文本作为检索对象,但服务器4也可以构成为从专利文本数据库3下载专利文本,并在服务器4内提取类似专利文本组。通过该构成,可在本地完成处理,从而能提高处理速度。

专利文本数据库3例如为专利局的数据库。专利局的数据库可以包含一个局,也可以包含多个局。且,通过包含美国、欧州、日本、中国以及韩国的五局数据库,可网罗全世界约90%的专利,从而为了提高专利性判定的精度,最好包含这五个局的数据库。

另外,服务器4从用户的终端装置2、2、2···接收的发明文本可以是已由专利局公开的公知文献中所包含的权利要求。另外,也可以是申请前的权利要求相关的文本,还可以是申请审查后等的预定修改的权利要求。且,该发明文本优选只包含一个发明。即,最好是以一个权利要求的形式进行记载。当然,用户的终端装置2也可以按照多个权利要求的形式将发明文本发送到服务器4。此时,最好由服务器4的服务器处理部416来对每个发明的分段进行识别,并对每个发明进行专利性判定。且,在本实施方式中虽然将申请前的发明内容作为发明文本进行了说明,但本发明不受该构成限制。

专利评估判定系统1的结构示意

图2是表示专利评估判定系统1的结构示意的一个例子的图。

专利评估判定系统1具有多个用户的终端装置2、2、2···、专利文本数据库3、以及服务器4。以下,会将多个用户的终端装置简称为用户的终端装置2。用户的终端装置2、2、2···以及服务器4例如通过因特网5等的通信网络而分别相互连接。进而,专利文本数据库3以及服务器4例如通过因特网5等的通信网络而分别相互连接。另外,此处举出的是一个因特网5的例子,但当因特网5由多个网络构成时,可在各网络间适当地设置网关(未图示)。用户的终端装置2中执行的程序(例如阅读程序)和服务器4中执行的程序(例如管理程序)之间用超文本传输协议(HTTP)等的通信协议进行通信。

进而,由于处理的信息为机密信息,因此用户的终端装置2和服务器4之间的连接、以及专利文本数据库3和服务器4之间的连接的因特网5的通信环境在安全性方面必须优异。另外,就用户的终端装置2和服务器4之间的连接、以及专利文本数据库3和服务器4之间的连接而言,可通过准备专线来强化安全性。

用户的终端装置2的结构示意

图3是表示用户的终端装置2的结构示意的一个例子的图。

用户的终端装置2执行与无线通信网络的连接、Web访问等。为此,用户的终端装置2具备终端通信部211、终端存储部212、终端操作部213、终端显示部214、以及终端处理部215。

且,作为用户的终端装置2,虽然假设的是平板电脑或笔记本电脑,但本发明并不限于此。用户的终端装置2只要是本发明可适用的即可,例如可以是多功能移动电话(所谓的“智能手机”)、移动电话(所谓的“功能手机”)、便携式信息终端(PDA)、便携式游戏机、便携式音乐播放器、平板终端等。

终端通信部211具备通信接口电路,并将用户的终端装置2连接于因特网5。终端通信部211通过网络将从终端处理部215提供的数据发送到服务器4等中。另外,终端通信部211通过网络将从服务器4等处接收的数据提供给终端处理部215。

终端存储部212例如具备半导体存储装置。终端存储部212存储用于在终端处理部215中进行处理的操作系统程序、驱动程序、应用程序、数据等。例如,作为驱动程序,终端存储部212存储有控制终端操作部213的输入设备驱动程序、控制终端显示部214的输出设备驱动程序等。另外,作为应用程序,终端存储部212存储有显示登录画面的阅读程序等,所述登录画面是将由店铺相关人员通过操作终端操作部213而输入的检索条件、特征信息以及特征图像等登录到服务器4的登录画面。各种程序例如可以用公知的安装程序等从CD-ROM、DVD-ROM等计算机可读的移动存储介质安装到终端存储部212中。另外,终端存储部212可临时存储与指定的处理相关的临时数据。

终端操作部213只要能进行用户的终端装置2的操作,则可以是任何设备,例如鼠标、触摸面板或键盘等。用户可用终端操作部213来进行信息的选定或取消,来输入文字或数字等。终端操作部213受用户操作而产生与该操作对应的信号。进而,产生的信号被发送到终端处理部215。

终端显示部214只要能进行视频或图像等的显示,则也可以是任何设备,例如液晶显示器或有机EL(Electro-Luminescence)显示器等。终端显示部214显示由终端处理部215提供的与视频数据相应的视频、或与图像数据相应的图像等。

终端处理部215具备一个或多个处理器以及其外围电路。终端处理部215是对用户的终端装置2的整体操作进行整体控制的设备,例如为CPU。终端处理部215控制终端通信部211或终端显示部214等的操作,使得用户的终端装置2的各种处理基于终端存储部212所存储的程序或终端操作部213的操作等而以适当的步骤得到执行。终端处理部215基于终端存储部212所存储的程序(操作系统程序、驱动程序、或应用程序等)来执行处理。另外,终端处理部215可并列执行多个程序(应用程序等)。

终端处理部215具备将从用户的终端装置2的外部接收的画面显示信息处理成用户可阅读的画面显示的功能、或把基于用户对终端操作部213的操作内容的处理转换成能发送到用户的终端装置2外部的信号并将其发送到终端通信部211的功能。这些功能是由终端处理部215所具备的处理器执行的程序来实现的功能。或者,这些各个部可作为独立的集成电路、微处理器或者固件安装在用户的终端装置2中。

用户的终端装置2的处理

用户的终端装置2由用户操作。用户操作终端操作部213将想进行专利性判定的发明文本输入到用户的终端装置2中。根据需要,终端处理部215可进行发明文本的笔误修正,或进行语法的修正。

另外,用户的终端装置2可以是企业的终端装置或企业的整体网络。进而,用户的终端装置2可以是专利局的终端装置或专利局的整体网络。

专利文本数据库3的构成

专利文本数据库3根据服务器4的要求而将期望的专利文本组提供给服务器4。即,专利文本数据库3根据从服务器4接收的检索条件提取符合该检索条件的专利文本组,并将其发送到服务器4。专利文本数据库3可以在有来自服务器4的要求时检索专利文本并将其发送到服务器4,专利文本数据库3也可以定期地针对代表性的检索结果将专利文本发送到服务器4。虽然未图示,但优选的是,专利文本数据库3最好具备处理部、通信部以及存储部等作为服务器的构成要素。

进而,当服务器4兼具专利文本数据库3时,专利文本数据库3将专利文本发送到服务器4,服务器4的服务器存储部411等存储专利文本。专利文本数据库3可根据来自服务器4的要求将专利文本发送到服务器4,专利文本数据库3也可主动将专利文本发送到服务器4。此时,服务器4可在服务器4内完成检索以及判定,从而能自由地调整处理速度。

专利文本数据库3积累并储存有新公开的专利公布公报或专利公告公报。专利文本数据库3在过去的全部专利文本中优选进行项目划分。例如,优选划分为摘要、权利要求书(权利要求)、全文等。在本实施方式中,专利评估判定系统1如后所述地进行全文检索以及权利要求所包含的检索关键词的自由词检索。

服务器4的结构示意

图4是表示服务器4的结构示意的一个例子的图。

服务器4包含作为服务器4的存储区域的服务器存储部411。另外,进一步具备服务器处理部416,所述服务器处理部416包含检索关键词提取部412、专利文本组提取部413、判定部414以及生成部415。进而,为了与用户的终端装置2以及专利文本数据库3通信,服务器4具备服务器通信部417。

服务器存储部411例如具有半导体存储器、磁盘装置以及光盘装置中的至少一者,并通过总线与服务器4连接。服务器存储部411存储用于由服务器处理部416处理的驱动程序、操作系统程序、应用程序、数据等。例如,作为驱动程序,服务器存储部411存储有控制服务器通信部417的通信设备驱动程序等。电脑程序例如可以用公知的安装程序等从CD-ROM、DVD-ROM等的计算机可读的移动存储介质安装到服务器存储部411中。另外,服务器存储部411存储专利文本表等。且,服务器存储部411可相当于本发明的存储部。

服务器处理部416包含检索关键词提取部412、专利文本组提取部413、判定部414以及生成部415。服务器处理部416的功能是通过由服务器处理部416具备的处理器执行的程序而实现的功能。或者,这些各个部可作为独立的集成电路、微处理器或者固件安装在服务器4中。且,关于服务器处理部416的处理内容将在下面叙述。另外,服务器处理部416的构成要素的切分只是一个例子,就哪个构成要素进行哪个处理而言,并不限于本实施方式的记载。

检索关键词提取部412在服务器通信部417从用户的终端装置2接收的发明文本所包含的多个单词中提取用于检索专利文本组的检索关键词。检索关键词提取部412将接收的发明文本分割为单个要素。具体而言,最好使用短词分析。即,将发明文本分割成多个单词单位,提取哪个单词修饰了哪个单词的依存关系。当发明文本为英语时,最好进行分隔符处理,所述分隔符处理按照句号、冒号、分号、逗号或关系代词的优先顺序进行分割。进而,从发明文档所包含的多个单词中提取检索关键词。例如,可以将出现频率高的单词提取为检索关键词,也可以根据单词的依存关系将重要的用语提取为检索关键词。即,检索关键词是用一个单词表示用户输入的发明文本所属技术领域的用语。且,虽然检索关键词通常为一个单词,但在难以将检索关键词提炼为一个单词等的情况下,也可以为多个单词。作为从输入的发明文本提取检索关键词的技术可以使用一般技术,并不限于上述方法。

如此,在发明文本中,通过将重要的检索关键词从发明文本中提取出来,从而专利文本组提取部413能容易地提取专利文本组。另外,作为专利评估判定系统1能迅速地处理专利性评估判定。

专利文本组提取部413利用检索关键词提取部412所提取的检索关键词,提取与输入的发明文本相类似的专利文本组。在专利文本组的提取中,可以单纯借助关键词检索对专利文本数据库3所包含的专利文本进行检索。例如,可以把专利文本的全文中记载有检索关键词的专利文本组作为检索结果,或者也可以把全部权利要求中记载有检索关键词的专利文本组提取为检索结果,还可以把权利要求1中记载有检索关键词的专利文本组提取为检索结果。在本实施方式中,虽然把在专利文本的全文中检测到检索关键词的检索结果作为专利文本组,但本发明不受检索目标位置的限制。由于检索目标文本越短,处理越轻松,因此,作为简易检索可以只将权利要求1作为检索目标。

专利文本组提取部413可考虑来自包含有检索关键词的专利文本组中的检索关键词的重要度来提高专利文本组的精度。例如,专利文本组提取部413用TF-IDF法等来评估专利文本组中的其中包含有检索关键词的文本的重要程度。此处,假设检索关键词在一个专利文本整体中出现时,专利文本的重要度低,并假设检索关键词当只有在一个专利文本中的特定文本处出现时,专利文本的重要度高。且,当用户可以在终端装置2中输入发明文本并在得到检索关键词时,可执行利用TF-IDF法等的针对检索关键词的专利文本组的提取,且也可以预先将与代表性的检索关键词对应的专利文本组存储在服务器存储部411内。

如此,专利文本组提取部413由于与单纯在自由词检索中提取的专利文本组相比,能在考虑到检索关键词的重要度的基础上提取专利文本组,从而专利评估判定系统1可在不进行无用处理的情况下实施高精度的专利评估判定。另外,通过提取更优的专利文本组,从而专利评估判定系统1能迅速地处理专利性评估判定。

判定部414把专利文本组提取部413提取的专利文本组中包含的文本的全文(以下也会记载为“专利文本组的全文”)与发明文本进行比较,并求出类似度。判定部414把专利文本组所包含的文本的全文以及发明文本分割成最小的句子单位(以下称为最小句子),求出这些最小句子之间的类似度。即,通过在发明文本所包含的构成要素的单位中将文本分割成最小句子并判定构成要素是否在专利文本组中被公开,来求出类似度。且,判定部414可将发明文本所包含的最小句子究竟是包含在一个专利文本中、还是分开地被记载在多个专利文本中的情况反映在类似度中。当在一个文本中公开了所有最小句子时,可判定输入的发明文本缺乏新颖性。另外,当最小句子跨越记载在多个专利文本中时,可判定输入的专利文本缺乏创造性。

如此,判定部414由于在预先将发明文本以及专利文本分成最小句子的基础上来进行发明文本以及专利文本组的比较,因此,比起比较发明文本整体以及专利文本整体,能以小的规模来进行文本之间的类似判定。从而,专利评估判定系统1的类似判定的精度得到提高。

在求类似度时,判定部414根据以下的类似度的评分计算公式来进行计分。且,该评分计算虽然以最小句子为基础来计算,但也可以为求出发明文本整体以及专利文本组整体的编辑距离的构成。

类似度的评分计算公式=(发明文本的长度损失)×(最小句子的单词单位的含有率)×(字符串等级的编辑距离的倒数)

此处,编辑距离是指,当有两个字符串时,将一个字符串编辑到另一个字符串时的距离。即,追加或删除1个字符的评分为1,删除1个字符后再追加1个文字时,评分为2,由此进行计算。在本发明的专利性判定中采用编辑距离是为了吸收拼写变化。

另外,发明句子的长度损失是在过短的句子之间进行比较时,由于编辑距离过小而用于修正的系数。

如此,判定部414通过用编辑距离来进行发明文本和专利文本组的类似的判定,从而能按照单词或文字单位来细致、正确地算出文本之间的类似度。虽然在通常的专利评估判定方法中根据是否含有几个类似单词来进行专利性判定,但通过采用编辑距离,使得作为文本在含义上是否类似的判定也成为可能。

如上所述,判定部414对专利文本组求出类似度,根据类似度高的专利文本和发明文本的类似度来进行专利性判定结果的计算。根据类似度进行最终的专利性判定的方法有各种方法,且本发明不限于这些方法。

例如,将根据用户输入的发明文本的最小句子与类似度高的专利文本的全文的最小句子之间的编辑距离而算出的评分、以及在分布式表示空间中相符的专利文本的全文的评分进行相加,按照作为专利文本的全文的构成要素的每个最小句子来判定评分。进而,判定部414将评分标准化为0~1,并输出为百分比。

进而,当判定部414给出的排序为A~D这四个等级时,A的专利性最高,B~D的专利性逐级降低。该排序的判断是通过对发明文本的所有要素的评分而算出的。

判定部414可提取多个类似度高的专利文本。在本实施方式中,采用的构成是提取三件类似专利文本。例如,在作为类似专利文本的全文的最小句子的构成要素中,最高评分(三件专利文本中的最高类似度)如果有一个比指定值低,则为B级以上,如果有两个以上比指定值低,则为A级。另外,如果最高评分的最小值(任一构成要素都在任一专利文本中有记载)高于指定值,则为D级。另外,当构成要素的几乎所有的评分都比指定值低时,则为B级,如果构成要素的半数高于指定值,则为C级。当与上述任一条件都不相符时,判定部414可根据文档整体的关键词一致率或向量类似度来给出评分。

通过根据排序来表示专利性,使得用户能简单地把握专利性判定。另外,当即使只提取了一件类似度高的专利文本时,也可通过降低评分来将正确的专利性判断结果发送到用户的终端装置2。

图5是表示判定部414给出的发明文本与类似专利的类似评分表的一个例子。发明文本被分割为构成要素AAA、构成要素BBB、构成要素CCC以及构成要素DDD这四个构成要素,且用百分比表示与类似专利X、类似专利Y以及类似专利Z的类似度。根据上述排序规则,发明文本的等级为C级,将其作为判定结果并与类似度一并算出。

生成部415生成向用户的终端装置2发送的各种显示画面。尤其,生成包含判定部414判定的专利性判定结果的画面,并通过服务器通信部417将其发送到用户的终端装置2。

生成部415生成的专利性判定结果可存储在服务器存储部411中。然而,出于发明文本机密性的观点,优选构成为不将发明文本的内容以及专利性判定结果存储在服务器存储部411中,而将这些信息存储在临时的保存区域(内存)中,并发送到用户的终端装置2。也可由服务器存储部411充当该临时保存区域。

服务器通信部417具有用于将服务器4与因特网5连接的通信接口电路。服务器通信部417从用户的终端装置2接收要求专利性判定的发明文本,并将判定部414做出的判定结果发送到用户的终端装置2。另外,服务器通信部417在从专利文本数据库3接收专利文本的提供时接收信息。服务器通信部417根据需要与用户的终端装置2进行各种通信,且服务器通信部417根据需要与专利文本数据库3进行各种通信。

专利评估判定系统1的处理

图6是表示本实施方式的专利评估判定系统1根据来自用户的终端装置2的发明文本的判定要求来判定该发明文本的专利性,并直至将判定结果发送到用户的终端装置2这一连串的流程的操作顺序的一个例子的图。

以下说明的操作顺序是基于预先存储在服务器存储部411中的程序,并主要通过服务器处理部416来与服务器4的各要素协作而得以执行的。另外,在以下说明的操作顺序中,服务器4通过服务器通信部417与用户的终端装置2进行各种的信息发送和接收。

首先,服务器4的服务器通信部417从用户的终端装置2接收想要进行专利性判定的发明文本(步骤S101)。且,服务器通信部417在从用户的终端装置2收到发明文本时开始本处理。

接着,服务器处理部416判定发明文本是否为了进行专利性判定而被记述为相应的形式(步骤S102)。例如,在本实施方式中,由于发明文本需要由一个发明构成,从而如果是存在多个逗号的文本,则服务器处理部416将出错信息通过服务器通信部417发送到用户的终端装置2。当发明文本被以错误形式记述时(步骤S102为NO),服务器处理部416将出错信息发送到用户的终端装置2(步骤S103)并结束处理。进而,服务器处理部416等待形式得到修正后的发明文本、或下一次的发明文本的接收。

当发明文本被以正确形式记述时(步骤S102为YES),服务器处理部416提取用于将从用户的终端装置2接收的发明文本所属的技术领域用一个单词进行表示的用语(步骤S104)。服务器处理部416将发明文本分割成多个单词单位,并提取哪个单词修饰哪个单词的依存关系,根据单词的依存关系提取重要用语来作为检索关键词。

接着,服务器处理部416用提取的检索关键词来提取与输入的发明文本类似的专利文本组(步骤S105)。具体而言,服务器处理部416从专利文本数据库3中提取出专利文本的全文中记载有检索关键词的专利文本组来作为检索结果。此时,服务器处理部416判定在各个专利文本中检索关键词为哪个重要程度的单词,在此基础上,只提取关联性高的专利文本来作为专利文本组。

进而,服务器处理部416比较专利文本组全文和发明文本,求出类似度(步骤S106)。具体而言,服务器处理部416通过在发明文本所包含的构成要素单位中将文本分割为最小句子并判定构成要素是否被专利文本组公开,从而求出类似度。服务器处理部416算出各个专利文本组所包含的专利文本的类似度评分,并提取三件类似度评分高的专利文本。此处,考虑到从用户的终端装置2所输入的发明文本的长度,当其过短时,服务器处理部416可修正类似度评分来提高类似度。

进而,服务器处理部416基于提取的三件类似度评分高的专利文本的最小句子和从用户的终端装置2所输入的发明文本的最小句子之间的编辑距离,对输入的发明文本进行专利性判定(步骤S107)。此处,服务器处理部416算出用户的终端装置2所输入的发明文本的专利性判定来作为等级。即,将专利性评估以A~D的等级进行评估并作为判定结果发送到用户的终端装置(步骤S108)。

用户的终端装置2的功能

图7是表示由用户的终端装置2的终端显示部214显示的发明文本输入画面200的一个例子的图。

图7是表示由用户的终端装置2显示的发明文本的输入画面的一个例子的图。发明文本输入画面200是用于用户通过终端装置2输入发明文本并要求专利性判定的画面。发明文本输入画面200显示有作为形成输入任意发明文本的输入栏的区域的发明文本输入区域201、以及用于进入确认所输入的发明文本是否得到了正确输入的确认画面的确认按钮202。

图8是表示由用户的终端装置2的终端显示部214显示的发明文本显示画面300的一个例子的图。

如图8所示,发明文本显示画面300是表示用户通过终端装置2输入的发明文本是否得到正确输入的画面。在发明文本显示画面300中按照每个构成要素对输入的发明文本作区分显示。在图8的例子中模拟的是,将由构成要素AAA、构成要素BBB、构成要素CCC以及构成要素DDD这四个构成要素构成的发明文本输入到图7的发明文本输入区域201中,且确认按钮202受到用户的鼠标点击操作等而按下时所显示的画面。即,在图8的例子中,发明文本被以分为构成要素AAA、构成要素BBB、构成要素CCC以及构成要素DDD这四个构成要素而构成的发明文本的状态显示。发明文本显示画面300中显示有作为形成显示发明文本的显示栏的区域的发明文本显示区域301、以及用于针对该发明文本显示区域301中显示的发明文本进行专利性判定的判定开始按钮302。

图9是表示由用户的终端装置2的终端显示部214显示的发明文本评估画面400的一个例子的图。

图9是表示用户的终端装置2所显示的发明文本评估画面400的一个例子的图。发明文本评估画面400是表示用户通过终端装置2输入的发明文本是否得到正确输入的画面。发明文本评估画面400中包含比较结果显示区域401,所述比较结果显示区域401将输入的发明文本区分为单个构成要素,并分别按照单个构成要素用百分比表示出与类似度高的专利文本的比较结果。另外,发明文本评估画面400中包含按照A~D的等级来显示从这些比较结果算出的发明文本的专利性判定结果的等级显示区域402。在图9的例子中,从构成要素AAA、构成要素BBB、构成要素CCC以及构成要素DDD这四个构成要素以及与类似专利文本的比较结果算出的发明文本的专利性判定结果为C级。

如上所述,本实施方式的专利评估判定系统1可对来自多个用户的终端装置2的要求中所包含的发明文本的专利性进行判定。进而,专利评估判定系统1由于将发明文本以及类似专利文本的全文的最小句子作为文字的编辑距离来算出类似度,从而与单纯判定专利文本组是否包含相同的单词的方法相比,能以高的精度判定发明文本的专利性。

且,在本发明中,作为专利评估判定系统1虽然记载了用户的终端装置2、专利文本数据库3以及服务器4相互独立的系统,但即使采用使这些功能全部存在于一处而成的判定装置,也能起到同样的效果。另外,作为用于在用户的终端装置等中安装的程序也可以提供这些功能。

本领域技术人员应该理解,在不脱离本发明的技术构思以及范围的情况下,可对其进行各种变更、替换以及修正。本领域技术人员还应该理解,在以下说明的变形例中,可将各个变形例进行组合来实施本发明。

变形例1

服务器处理部416的专利文本组提取部413为了提高专利文本组的精度,可进行以下处理。服务器处理部416的专利文本组提取部413对所提取的专利文本组的专利文本附带的专利分类(例如IPC或CPC)进行提取,绘制柱状图,选择排名靠前的几件的专利分类。进而,用选择的专利分类再一次进行与检索关键词的AND检索。此处,借助检索关键词的检索虽然可以单纯地为自由词检索,但优选用如上TF-IDF法等,并在评估检索关键词究竟在专利文本组所包含的文本中具有多大程度的重要度的基础上来得到检索结果。将该检索结果作为用于和发明文本比较的专利文本组而进行更新。通过该处理,作为专利文本组的集合体的精度得到提高,专利性判定的精度也得以上升。即,专利文本组提取部413通过使用专利分类来提高作为集合体的完整性,由此减少专利文本的提取遗漏。

图10是表示本实施方式的变形例1的专利评估判定系统1根据用户的终端装置2的发明文本的判定要求来判定该发明文本的专利性,并直至将判定结果发送到用户的终端装置2这一连串的流程的操作顺序的一个例子的图。

在通过步骤S105用提取的检索关键词来提取与输入的发明文本类似的专利文本组后,服务器处理部416从专利文本组提取专利分类,选择提取数多的排名靠前的专利分类(步骤S109)。接着,服务器处理部416用检索关键词以及选择的排名靠前的专利分类来再一次提取专利文本组(步骤S110)。且,在借助该专利分类的检索中,当包含多个专利分类时,可通过OR检索来扩大专利文本组。

变形例2

服务器处理部416的专利文本组提取部413为了提高专利文本组的精度,可进行以下处理。服务器处理部416的专利文本组提取部413针对所提取的专利文本组的各个专利文本中包含的文本的全文,提取在分布式表示空间中与检索关键词邻近的专利文本,并将提取的结果作为用于和发明文本进行比较的专利文本组进行更新。即,专利文本组提取部413通过机器学习假设类似文本中使用的单词具有相似的概念,并把类似单词模拟成相同向量。通过该处理,可以将类似关键词也识别成向量相同。通过该处理,专利文本组作为集合体的精度得到提高,专利性判定的精度也得以上升。即,专利文本组提取部413由于提取了在分布式表示空间中与检索关键词邻近的专利文本,因此,还可提取具备与检索关键词类似的用词的专利文本。

图11是表示本实施方式的变形例2的专利评估判定系统1根据用户的终端装置2的发明文本的判定要求来判定该发明文本的专利性,并直至把判定结果发送到用户的终端装置2这一连串的流程的操作顺序的一个例子的图。

在通过步骤S105用所提取的检索关键词提取与输入的发明文本类似的专利文本组后,服务器处理部416提炼出在分布式表示空间中与所述检索关键词邻近的专利组,并将该提炼结果提取为专利文本组(步骤S111)。

且,当把本变形例2的处理和变形例1的处理进行组合时,如果在变形例1的步骤S110后,服务器处理部416实施变形例2的步骤S111,则作为专利文本组的精度变高。当然,服务器处理部416也可在变形例2的步骤S111后进行实施变形例1的步骤S110的处理。

变形例3

在本实施方式中,就发明文本而言,说明的是将申请前的发明内容作为发明文本,但也可将专利评估判定系统1用于申请后的专利申请等中所包含的权利要求的专利性判定。此时,考虑到进行专利性判定的专利申请等的申请日,专利文本组提取部413从申请日前公开的专利文本中提取专利文本组。该申请日可以是专利文本数据库3存储的申请日,也可以是由用户直接输入终端装置2的日期。

权利要求书(按照条约第19条的修改)

1.(修改)一种专利评估判定方法,其特征在于,包含:

接收发明相关的发明文本的输入的发明输入步骤、

在以单词单位对所述输入的发明文本进行语法分析的基础上,提取所述发明文本中的任意检索关键词的关键词提取步骤、

用所述提取的检索关键词从数据库中提取包含该检索关键词的专利文本组的专利文本组提取步骤、以及

比较所述发明文本以及所述专利文本组所包含的文本来判定所述发明文本的专利性的判定步骤,

所述判定步骤基于用所述专利文本组所包含的文本的编辑距离的倒数乘以所述发明文本的长度指数以及所述检索关键词的含有率而得的结果来判定所述发明文本的专利性。

2.如权利要求1所述的专利评估判定方法,其特征在于,

所述判定步骤基于所述发明文本以及所述专利文本组所包含的文本的编辑距离来判定所述发明文本的专利性。

3.(删除)

4.(修改)如权利要求1或2所述的专利评估判定方法,其特征在于,

所述判定步骤在把所述发明文本切分成单个构成要素的基础上,基于切分的所述单个构成要素与所述专利文本组所包含的文本之间的编辑距离来判定所述发明文本的专利性。

5.如权利要求1~4中任一项所述的专利评估判定方法,其特征在于,

所述专利文本组提取步骤提取所述专利文本组附带的专利分类,从该提取的专利分类中选择提取数多的排名靠前的专利分类,并用所述检索关键词以及所述选择的排名靠前的专利分类再一次提取所述专利文本组。

6.如权利要求5所述的专利评估判定方法,其特征在于,

所述专利文本组提取步骤从用所述检索关键词以及所述选择的排名靠前的专利分类得到的所述专利文本组中,提炼出在分布式表示空间中与所述检索关键词邻近的专利组,并将该提炼结果提取为所述专利文本组。

7.如权利要求1~6中任一项所述的专利评估判定方法,其特征在于,

所述判定步骤通过比较所述发明文本以及所述专利文本组所包含的文本,来提取与所述发明文本类似的专利文本,并基于对所述发明文本以及该提取的专利文本的类似度的判定来判定所述发明文本的专利性。

8.(修改)一种专利评估判定装置,其特征在于,包含:

接收发明相关的发明文本的输入的发明输入部、

在以单词单位对所述输入的发明文本进行语法分析的基础上,提取所述发明文本中的任意检索关键词的关键词提取部、

用所述提取的检索关键词从数据库中提取包含该检索关键词的专利文本组的专利文本组提取部、以及

比较所述发明文本以及所述专利文本组所包含的文本来判定所述发明文本的专利性的判定部,

所述判定部基于用所述专利文本组所包含的文本的编辑距离的倒数乘以所述发明文本的长度指数以及所述检索关键词的含有率而得的结果来判定所述发明文本的专利性。

9.(修改)一种专利评估判定程序,其特征在于,

在电脑中实现:

接收发明相关的发明文本的输入的发明输入功能、

在以单词单位对所述输入的发明文本进行语法分析的基础上,提取所述发明文本中的任意检索关键词的关键词提取功能、

用所述提取的检索关键词从数据库中提取包含该检索关键词的专利文本组的专利文本组提取功能、以及

比较所述发明文本以及所述专利文本组所包含的文本来判定所述发明文本的专利性的判定功能,

所述判定功能基于用所述专利文本组所包含的文本的编辑距离的倒数乘以所述发明文本的长度指数以及所述检索关键词的含有率而得的结果来判定所述发明文本的专利性。

本文发布于:2024-09-22 18:16:45,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/68149.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议