适用于电力行业的专利体系划分方法、设备及存储介质

著录项
  • CN202011436001.2
  • 20201210
  • CN112632217A
  • 20210409
  • 国网江苏省电力有限公司电力科学研究院;国家电网有限公司;国网江苏省电力有限公司;江苏省电力试验研究院有限公司
  • 孙涛;王存超;王德胜;王鹏;李岩松;赵新冬;戴威
  • G06F16/33
  • G06F16/33 G06F16/35 G06Q50/18 G06Q50/06

  • 江苏省南京市江宁区帕威尔路1号
  • 江苏(32)
  • 南京纵横知识产权代理有限公司
  • 俞翠华
摘要
本发明公开了一种适用于电力行业的专利体系划分方法、设备及存储介质,所述方法包括获取电力行业专利池内的专利文本;对获取到的专利文本进行分区域处理,分别获取不同区域的区域数据;当存在专利文本内的区域数据和预设的标签数据相对应时,标签数据与预设标签对应设置,则对所述专利文本添加至少一个预设的标签,完成专利体系划分。本发明能够对专利体系基于标签的方式进行划分,使得使用者方便基于标签进行统计,方便使用者对电力行业专利数据进行挖掘和价值分析,筛选高价值专利、挖掘潜藏在数据中的深度信息,使电力行业提高创新能力、促进成果转化。
权利要求

1.一种适用于电力行业的专利体系划分方法,其特征在于,包括:

获取电力行业专利池内的专利文本;

对获取到的专利文本进行分区域处理,分别获取不同区域的区域数据;

当存在专利文本内的区域数据和预设的标签数据相对应时,标签数据与预设标签对应设置,则对所述专利文本添加至少一个预设的标签,完成专利体系划分。

2.根据权利要求1所述的一种适用于电力行业的专利体系划分方法,其特征在于,所述获取电力行业专利池内的专利文本步骤之前或之后还包括:

获取数据库中所有的专利文本;

设置第一预设时间和至少一个预设标签数据;

间隔所述第一预设时间,自动遍历数据库中的所有专利文本;

对专利文本进行分区域处理,分别获取不同区域的区域数据;

当存在专利文本内的区域数据和某预设标签数据相对应时,将具有标签数据的专利文本存储至电力行业专利池内,其中每一个专利文本具有与其对应的标签数据。

3.根据权利要求2所述的一种适用于电力行业的专利体系划分方法,其特征在于:所述区域数据包括第一文本,所述第一文本包括至少一个字。

4.根据权利要求2所述的一种适用于电力行业的专利体系划分方法,其特征在于:所述标签数据包括第二文本,所述第二文本包括至少一个字。

5.根据权利要求2-4中任一项所述的一种适用于电力行业的专利体系划分方法,其特征在于,所述对获取到的专利文本进行分区域处理,分别获取不同区域的区域数据,具体为:

将获取到的专利文本按照内容不同分为著录项目区域、权利要求书区域、说明书区域以及说明书附图区域。

6.根据权利要求2所述的一种适用于电力行业的专利体系划分方法,其特征在于:所述适用于电力行业的专利体系划分方法,还包括:

设置一关键词,遍历数据库中的所有专利,将与所述关键词相对应的专利文本进行显示。

7.根据权利要求1所述的一种适用于电力行业的专利体系划分方法,其特征在于,所述当存在专利文本内的区域数据和预设的标签数据相对应时,标签数据与预设标签对应设置,则对所述专利文本添加至少一个预设的标签,包括以下步骤:

将专利文本的各个区域数据和预设的标签数据输入至预设的相似度计算模型,计算出相似度值;

当计算出的相似度值大于基准值时,将与该相似度值对应的专利文本与标签数据相关联,并对专利文本添加预设的标签,预设的标签与标签数据相对应。

8.根据权利要求1所述的一种适用于电力行业的专利体系划分方法,其特征在于,所述获取电力行业专利池内的专利文本步骤之后还包括:

选中任意一专利文本,将所述专利文本与任意一个或多个预设的标签数据进行对应,完成对所述专利文本添加标签。

9.根据权利要求1所述的一种适用于电力行业的专利体系划分方法,其特征在于:所述标签数据为阈值数据。

10.一种适用于电力行业的专利体系划分设备,其特征在于,包括:存储器、处理器以及计算机程序,所述计算机程序存储在所述存储器中,所述处理器运行所述计算机程序执行权利要求1至9任一所述的方法。

11.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现权利要求1至9任一所述的方法。

说明书
技术领域

本发明属于互联网、大数据技术领域,具体涉及一种适用于电力行业的专利体系划分方法、设备及存储介质。

在21世纪的知识经济时代,专利成为了全球各大技术密集型企业竞争的对象。专利数据涵盖丰富的技术、法律、经济等价值。专利数据是世界上最大的技术信息源,囊括了全球90%以上的最新技术情报,比一般技术刊物所提供的信息早5-6年,包含技术、市场、法律等信息,通过对专利信息进行分析研究,可以提高技术研发项目的研究起点和水平,大大减少研发时长和投入经费。以欧洲为例,其通过专利文献每年节约的研发经费就高达300亿欧元。如何能更快、更准确地到企业所需专利信息,并进行检索分析、技术挖掘等系列深度应用,这是许多国家正着手攻克的课题。

我国电力行业专利数据资源丰富,专利申请量与日俱增。截至到公开日2019年7月,国网江苏省电力有限公司及下辖地市级、县(市)级、控股份公司全球专利申请,共计16572件,其中国内申请量共计16457件,其中4600多件发明专利处于在审状态,7000多件有效专利需要进行维持,每年还有2000多件新的专利申请,且专利技术涉及到13个市及20余个科研单位的管理,知识产权管理工作非常艰巨。国网江苏省电力有限公司的专利许可仅有25件,占专利申请总量的很小。可见,虽然电力有限公司拥有大量的高端人才且具备雄厚的研究资金、强大的研发实力,但这些研发成果并没有得到有效的维护,专利转化实施效率也比较低。

针对大型电力企业,专利价值计算的意义主要在于:大型电力企业想要在全球技术贸易的竞争中脱颖而出,就必须通过不断提升自身的研发实力,加强技术储备,进行合理的专利布局,规避侵权诉讼等,这些目标的实现需要依靠对专利价值做出科学客观的评估,以便于电力企业进行有效的资源配置;电力行业是国民经济发展战略中的先行产业,是衡量一个国家经济发达程度的重要标志,因此,当电力行业专利投人到经济市场进行运营时,需要对其价值进行评估,将其量化,进而成为衡量经济的一个重要指标。

但是专利作为一种无形资产,其价值的评估受到许多不定因素的影响。对于国内大型电力企业而言,随着经济体制的不断改良和企业的发展,市场对该行业的专利价值评估的需求越发旺盛。可惜的是,目前专门针对电力行业的专利价值评估进行的研究还有待深入,评估方法的选择多借鉴其他行业的做法,或者是专利价值评估的基本方法,没有具有行业特的专利价值评估方法。专利价值评估方法的同一化是电力行业专利价值评估目前的困境,走出困境的办法就是出评估电力行业专利价值的有效方法。

因此,如何利用大数据技术,对电力行业专利数据进行挖掘和价值分析,筛选高价值专利、挖掘潜藏在数据中的深度信息,是电力行业提高创新能力、促进成果转化的发展重点。

针对上述问题,本发明提出一种适用于电力行业的专利体系划分方法、设备及存储介质,能够对专利体系基于标签的方式进行划分,使得使用者方便基于标签进行统计,方便使用者对电力行业专利数据进行挖掘和价值分析,筛选高价值专利、挖掘潜藏在数据中的深度信息,使电力行业提高创新能力、促进成果转化。

为了实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:

第一方面,本发明提供了一种适用于电力行业的专利体系划分方法,包括:

获取电力行业专利池内的专利文本;

对获取到的专利文本进行分区域处理,分别获取不同区域的区域数据;

当存在专利文本内的区域数据和预设的标签数据相对应时,标签数据与预设标签对应设置,则对所述专利文本添加至少一个预设的标签,完成专利体系划分。

可选地,所述获取电力行业专利池内的专利文本步骤之前或之后还包括:

获取数据库中所有的专利文本;

设置第一预设时间和至少一个预设标签数据;

间隔所述第一预设时间,自动遍历数据库中的所有专利文本;

对专利文本进行分区域处理,分别获取不同区域的区域数据;

当存在专利文本内的区域数据和某预设标签数据相对应时,将具有标签数据的专利文本存储至电力行业专利池内,其中每一个专利文本具有与其对应的标签数据。

可选地,所述区域数据包括第一文本,所述第一文本包括至少一个字。

可选地,所述标签数据包括第二文本,所述第二文本包括至少一个字。

可选地,所述对获取到的专利文本进行分区域处理,分别获取不同区域的区域数据,具体为:

将获取到的专利文本按照内容不同分为著录项目区域、权利要求书区域、说明书区域以及说明书附图区域。

可选地,所述适用于电力行业的专利体系划分方法,还包括:

设置一关键词,遍历数据库中的所有专利,将与所述关键词相对应的专利进行显示

可选地,所述当存在专利文本内的区域数据和预设的标签数据相对应时,标签数据与预设标签对应设置,则对所述专利文本添加至少一个预设的标签,包括以下步骤:

将专利文本的各个区域数据和预设的标签数据输入至预设的相似度计算模型,计算出相似度值;

当计算出的相似度值大于基准值时,将与该相似度值对应的专利文本与标签数据相关联,实现对专利文本添加预设的标签。

可选地,所述获取电力行业专利池内的专利文本步骤之后还包括:

选中任意一专利文本,将所述专利文本与任意一个或多个预设的标签数据进行对应,完成对所述专利文本添加标签。

可选地,所述标签数据为阈值数据。

第二方面,本发明提供了一种适用于电力行业的专利体系划分设备,包括:存储器、处理器以及计算机程序,所述计算机程序存储在所述存储器中,所述处理器运行所述计算机程序执行第一方面任一所述的方法。

第三方面,本发明提供了一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现第一方面中任一所述的方法。

与现有技术相比,本发明的有益效果:

本发明提供的一种适用于电力行业的专利体系划分方法、设备及存储介质,能够对专利体系基于标签的方式进行划分,使得使用者方便基于标签进行统计。并且在标签的添加过程中采取了多种方式,可以是基于人工智能自动设置、也可以是主动的设置,方便使用者对电力行业专利数据进行挖掘和价值分析,筛选高价值专利、挖掘潜藏在数据中的深度信息,使电力行业提高创新能力、促进成果转化。

为了使本发明的内容更容易被清楚地理解,下面根据具体实施例并结合附图,对本发明作进一步详细的说明,其中:

图1为一种适用于电力行业的专利体系划分方法的第一种实施方式的流程图;

图2为一种适用于电力行业的专利体系划分方法的第二种实施方式的流程图。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。

应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含A、B和C”、“包含A、B、C”是指A、B、C三者都包含,“包含A、B或C”是指包含A、B、C三者之一,“包含A、B和/或C”是指包含A、B、C三者中任1个或任2个或3个。

应当理解,在本发明中,“与A对应的B”、“与A相对应的B”、“A与B相对应”或者“B与A相对应”,表示B与A相关联,根据A可以确定B。根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。A与B的匹配,是A与B的相似度大于或等于预设的阈值。

取决于语境,如在此所使用的“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。

下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。

本发明提供一种适用于电力行业的专利体系划分方法,如图1所示其流程图,包括以下步骤:

S1、获取步骤,即获取电力行业专利池内的专利文本;

在本发明实施例的一种具体实施方式中,所述电力行业专利池内为电力领域专利知识库;所述专利文本可以是任意申请人、任意国家、任意专利权人的专利申请,也可以是任意专利权人、发明人的全部专利申请的专利文本数据。

在步骤S1中还包括以下步骤:

获取数据库中所有的专利文本,所述专利文本优选为国家知识产权局公开的专利申请文件;

设置第一预设时间和至少一个标签数据,所述第一预设时间可以是5分钟、十分钟、一小时等。所述标签数据可以是寿命标签、市场标签和价格标签,寿命标签包括专利池的许可协议寿命、法定寿命、经济寿命,市场标签包括技术特性和产品市场,价格标签包括技术本质、产品市场、交易过程等。

间隔第一预设时间,自动遍历数据库中的所有专利,获取各个数据库中新加入的专利。随着时间的增长,专利文本会越来越多,所以为了达到即时更新预设数据库的目的,没间隔第一预设时间则获取其余数据库的专利数据。

S2、处理步骤:对专利文本进行分区域处理,分别获取不同区域的区域数据;所述专利文本在不同区域具有不同的技术信息,例如说著录项目区域就存在着申请人、专利权人、发明人、申请时间、专利类型等等的信息,而在权利要求书区域中,主要是对保护内容进行的公布,即专利的技术信息。所以需要对一个专利区域进行分区域处理,并且针对不同区域所代表的区域数据也是不同的。

当存在专利文本内的区域数据和预设的标签数据相对应时,则证明此时该专利与标签相适应,将具有标签数据的专利文本存储至电力行业专利池内,其中每一个专利文本具有与其对应的标签数据。。

在具体实施过程中,所述还包括将专利文本按照内容不同分为著录项目区域、权利要求书区域、说明书区域以及说明书附图区域,其中所述区域数据为不同区域的文本,所述文本包括至少一个字。

S3、添加标签步骤:当存在专利文本内的区域数据和预设的标签数据相对应时,对所述专利文本添加至少一个预设的标签。其中标签数据包括文本,其中每个标签数据分别对应专利文本的至少一个区域。

在步骤S3中,还包括,在所述当存在专利文本内的区域数据和预设的标签数据相对应时,对所述专利文本添加至少一个预设的标签的步骤,还包括:

A1、相似度计算步骤:将专利不同区域的文本和标签数据的文本基于预设模型进行相似度计算得到相似度。其中预设模型可以是LSTM模型、Bi-LSTM模型、ESSM模型、ESIM模型等等。在该步骤中,将不同区域的文本和标签数据的文本分别进行计算,进而得到相似值,该相似度值反应的是标签和专利文本的相关性。例如说标签可以是专利权期限2年到期、专利权期限3年到期等等。例如说2015年1月1日申请一件实用新型专利,将于2025年1月1日到期,例如说当前时间是2020年1月1日,则该实用新型专利还有五年到期,则该寿命标签为五年。

A2、关联步骤:当相似度值大于基准值时,将所述专利与标签相关联,所述标签和标签数据相对应。当相似度值较大时,则证明相关联的程度较高。

在本发明实施例的一种具体实施方式中,所述方法还包括以下步骤:选中任意一专利文本,将所述专利文本与任意一个或多个预设的标签进行对应。该步骤达到的效果是,使用者进行自动标签添加,例如说一个专利文本,需要添加或者是修改寿命标签,可以直接对该专利文本进行添加。

在本发明实施例的一种具体实施方式中,所述方法还包括以下步骤:选中任意一专利文本,将所述专利文本与任意一个或多个预设的标签进行对应的步骤中还包括:设置一关键词,遍历数据库中的所有专利,将与所述关键词相对应的专利进行显示。其中关键词可以是电力、电能等等,通过以上方式,达到对具有电力、电能等关键词的专利进行筛选的功能。其中标签数据可以为阈值数据。例如说寿命标签为两年至三年,其中两年至三年就是阈值。

实施例2

本发明实施例中提供一种适用于电力行业的专利体系划分系统,包括:处理器、存储器和计算机程序;其中

存储器,用于存储所述计算机程序,该存储器还可以是闪存(flash)。所述计算机程序例如是实现上述方法的应用程序、功能模块等。

处理器,用于执行所述存储器存储的计算机程序,以实现实施例1方法中终端执行的各个步骤。具体可以参见前面方法实施例中的相关描述。

可选地,存储器既可以是独立的,也可以跟处理器集成在一起。

当所述存储器是独立于处理器之外的器件时,所述终端还可以包括:

总线,用于连接所述存储器和处理器。终端还可以进一步包括发送器,用于向服务器发送处理器生成的第一类事件信息。

实施例3

本发明实施例中还提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现上述的各种实施方式提供的方法。

其中,可读存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如,可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(ApplicationSpecific Integrated Circuits,简称:ASIC)中。另外,该ASIC可以位于用户设备中。当然,处理器和可读存储介质也可以作为分立组件存在于通信设备中。可读存储介质可以是只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。设备的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得设备实施上述的各种实施方式提供的方法。

在上述终端或者服务器的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

本文发布于:2024-09-23 15:23:51,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/68064.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议