结合网络特征和标准分数的专利质量评估方法及系统

著录项
  • CN202110561025.9
  • 20210520
  • CN113361872A
  • 20210907
  • 浙江工业大学
  • 傅晨波;邱君瀚;余金隆;岳昕晨;潘星宇;胡剑波;罗浩耕
  • G06Q10/06
  • G06Q10/06 G06Q50/18 G06F17/18

  • 浙江省杭州市拱墅区潮王路18号
  • 浙江(33)
  • 杭州天正专利事务所有限公司
  • 王兵
摘要
结合网络特征和标准分数的专利质量评估方法,包括以下步骤:S1:获取专利信息;S2:构建加权网络;S3:用网络特征指标计算标准分数;S4:计算新颖性和典型性,并并对典型性和新颖性进行排名;S5:以专利的各项指标为自变量,被引数为因变量进行回归分析,确定专利的各项指标与被引数之间的关系;S6:用户输入专利各项信息,得到专利质量评估。本发明还包括结合网络特征和标准分数的专利质量评估系统,由数据获取与存储模块、网络构建模块、专利分级模块、被引数预测模块、用户输入模块组成。本发明不仅可以对专利质量进行评估,还能预测新申请专利的未来被引数,可以为申请人有针对性地处理专利未来事项提供参考。
权利要求

1.结合网络特征和标准分数的专利质量评估方法,其特征在于:包括以下步骤:

S1:从互联网获取专利的各项信息,包括专利的名称、申请号、IPC分类号、被引数、同族数的信息,储存在数据库中,从中筛选具有两个及以上IPC分类号的专利,形成数据集;

S2:用数据库中的专利信息构建IPC分类号的加权网络;

S3:计算步骤S2中构建的加权网络的网络特征指标,用网络特征指标来计算IPC分类号配对的标准分数;

S4:通过IPC分类号配对的新颖性和典型性来计算专利的新颖性和典型性,并对新颖性和典型性进行排名;

S5:以专利的各项指标作为为自变量,被引数为因变量进行多重线性回归分析,确定各个指标与被引数之间的关系;

S6:用户输入想要评估的专利的各项信息,得到专利的典型性和新颖性、对应的排名以及预测的未来被引数。

2.如权利要求1所述的结合网络特征和标准分数的专利质量评估方法,其特征在于:步骤S2中构建加权网络的具体方法如下:网络中的节点为每项专利中的IPC分类号,如果两个IPC同时出现在一个专利中,则在对应的两个节点之间形成一条连边,连边权重为连边在加权网络中出现的次数。

3.如权利要求1所述的结合网络特征和标准分数的专利质量评估方法,其特征在于:步骤S3中的IPC分类号配对标准分数的计算公式如下:

式(1)中,X和Y为粗粒化到大组级别的IPC分类号,用所有属于X和Y大组的IPC分类号对应的节点和它们的连边组成的集合来表示,ZXY为计算得出的标准分数,VXY为集合内所有IPC分类号配对的实际出现次数,用对应节点之间的连边权重表示,EXY为集合内所有IPC分类号配对的期望出现次数,SXY为集合内所有IPC分类号配对出现次数的标准差;

EXY的计算公式如下:

SXY的的计算公式如下:

式(2)和式(3)中,X和Y集合内的IPC分类号以大组级别为界分为两部分,用xi和yj表示,其中x和y分别表示X和Y集合内的IPC分类号大组级别及以上的字符,i和j表示X和Y集合内的IPC分类号大组级别及以下的字符,M为数据集中的专利总数,δxy为去重变量,当x和y相同时,δxy=1,否则,δxy=0。

4.如权利要求3所述的结合网络特征和标准分数的专利质量评估方法,其特征在于:步骤S4具体包括:

S4.1:先将一项专利中的IPC分类号粗粒化到大组级别,然后统计所有大组级别IPC分类号配对,每一对IPC分类号配对按照步骤S3中的公式计算得出标准分数;

S4.2:统计步骤S4.1中计算出的标准分数,计算标准分数的中值和最小值,用中值表示该项专利的典型性,用最小值表示该项专利的新颖性;

S4.3:统计数据集中所有专利的典型性和新颖性,对其进行排名。

5.如权利要求1所述的结合网络特征和标准分数的专利质量评估方法,其特征在于:步骤S5中的自变量包括专利的典型性、新颖性、IPC分类号数量、同族数量、专利标题长度,是否属于PCT申请,多重线性回归公式为:

其中,ycp表示专利的被引数,xnov表示专利的新颖性,xcon表示专利的典型性,xnum表示专利的IPC分类号数量,xf表示专利的同族数量,xtitle表示专利标题长度,xpct为分类变量,若专利属于PCT申请,则xpct=1,否则,xpct=0,α0-α6表示等待确定的各项系数。

6.如权利要求1所述的结合网络特征和标准分数的专利质量评估方法,其特征在于:用户需要输入的专利信息包括专利的IPC分类号,同族数量,专利标题,专利申请号,通过步骤S2-S4计算出专利的典型性和新颖性及对应的排名,再通过步骤S5预测未来的被引数。

7.实现权利要求1所述的结合网络特征和标准分数的专利质量评估方法的系统,其特征在于:包括数据获取与存储模块、网络构建模块、用户输入模块、专利质量评估模块、被引数预测模块;

所述数据获取与存储模块从互联网获取专利的各项信息,包括但不限于专利的IPC分类号、被引数等信息,储存在数据库中,从中筛选具有两个及以上IPC分类号的专利,形成数据集;

所述网络构建模块通过数据集中的专利信息构建IPC分类号的加权网络,并计算网络的各项指标;

所述专利质量评估模块通过网络构建模块构建的加权网络的各项指标,结合标准分数的计算公式,计算每项专利的IPC分类号配对的标准分数,从而计算专利的新颖性和典型性;

所述被引数预测模块以专利的各项指标为自变量,被引数为因变量进行多重线性回归分析,确定各项指标与被引数之间的系数,用这些系数来预测新申请专利的未来被引数;

所述用户输入模块用于接收用户想要评估的专利的各项信息;

所述的数据获取与存储模块、网络构建模块、专利质量评估模块、被引数预测、用户输入模块模块依次相连。

说明书
技术领域

本发明涉及网络科学领域以及统计学领域,尤其涉及一种专利质量评估方法及系统。

随着科学技术的发展,上至国家,下至企业,都越来越注重对自己的高新技术的保护,其中保护技术的最重要的途径之一就是为技术申请专利。技术是个体发明者单独努力或者集体合作的结果,在专利制度出现之前,技术大多数都是以实物为载体向人们展示特点,专利制度出现后,技术又多了一种向人们展示其特点的载体——专利。专利是发明的文字载体,记录了一项发明各方面的信息。这使得我们可以通过专利数据去了解发明者是如何进行发明活动的。一般认为,发明活动是一个对现有技术进行改进或者重新组合的过程,这个过程可以通过专利的IPC分类号的组合来表示。研究者在研究发明技术时,一般着重于发明技术价值的研究,而发明技术价值又与技术的典型性与新颖性紧密相连,两者共同决定了发明技术的最终价值,因此研究者在研究发明技术价值时更倾向于使用专利文件中的各个指标来衡量发明技术价值。

公开号为CN110298545A的专利公开了一种基于神经网络的专利评价方法、系统和介质。该方法首先以论文与专利之间的相似性为基础,同时将该相似性计算结果与论文的引用情况、论文发表时间、论文发表期刊、论文作者等多个因素输入神经网络进行训练,形成论文与评价专利之间的技术质量评价模型。这种方法需要的数据量非常大,同时计算过程十分复杂,计算用到的参数非常多,评估效率十分低下。

公开号为CN109902168A的专利公开了一种专利评价方法和系统,通过自然语言处理和复杂网络算法将专利以技术集方式聚合,赋予专利科学技术属性,并置于全球同行业技术中进行评价。自然语言处理和复杂网络算法需要大量的数据进行训练,为了同全球同行业技术的专利进行比对,更是需要大量的时间来进行,算法效率依然十分低下。

公开号为CN112734603A的专利公开了一种专利技术价值度评估方法与系统,从专利技术、专利质量、专利风险、专利实施价值度和专利控制力等方面综合对专利进行综合价值度评估。这种方法虽然降低了评估的主观性,但是评估过程复杂繁琐,需要用户提供的数据很多,十分不便。

本发明要克服现有技术的上述缺点,提供一种结合网络特征和标准分数的专利技术质量分级方法及系统,能更快地对专利进行分级,并对专利的被引数进行预测。

为实现上述目的,本发明提供了如下方案:

结合网络特征和标准分数的专利质量评估方法,其特征在于:包括以下步骤:

S1:从互联网获取专利的各项信息,包括但不限于专利的IPC分类号、被引数等信息,储存在数据库中,从中筛选具有两个及以上IPC分类号的专利,形成数据集;

S2:用数据库中的专利信息构建IPC分类号的加权网络;

S3:计算步骤S2中构建的加权网络的网络特征指标,用网络特征指标来计算IPC分类号配对的标准分数;

S4:通过IPC分类号配对的新颖性和典型性来计算专利的新颖性和典型性,并对新颖性和典型性进行排名;

S5:以专利的各项指标作为为自变量,被引数为因变量进行多重线性回归分析,确定各个指标与被引数之间的关系;

S6:用户输入想要评估的专利的各项信息,得到专利的典型性和新颖性、对应的排名以及预测的未来被引数。

进一步地,步骤S2中构建加权网络的具体方法如下:网络中的节点为每项专利中的IPC分类号,如果两个IPC同时出现在一个专利中,则在对应的两个节点之间形成一条连边,连边权重为连边在加权网络中出现的次数。

进一步地,步骤S3中的IPC分类号配对标准分数的计算公式如下:

式(1)中,X和Y为粗粒化到大组级别的IPC分类号,用所有属于X和Y大组的IPC分类号对应的节点和它们的连边组成的集合来表示,ZXY为计算得出的标准分数,VXY为集合内所有IPC分类号配对的实际出现次数,用对应节点之间的连边权重表示,EXY为集合内所有IPC分类号配对的期望出现次数,SXY为集合内所有IPC分类号配对出现次数的标准差;

EXY的计算公式如下:

SXY的的计算公式如下:

式(2)和式(3)中,X和Y集合内的IPC分类号以大组级别为界分为两部分,用xi和yj表示,其中x和y分别表示X和Y集合内的IPC分类号大组级别及以上的字符,i和j表示X和Y集合内的IPC分类号大组级别及以下的字符,M为数据集中的专利总数,δxy为去重变量,当x和y相同时,δxy=1,否则,δxy=0。

进一步地,步骤S4具体包括:

S4.1:先将一项专利中的IPC分类号粗粒化到大组级别,然后统计所有大组级别IPC分类号配对,每一对IPC分类号配对按照步骤S3中的公式计算得出标准分数;

S4.2:统计步骤S4.1中计算出的标准分数,计算标准分数的中值和最小值,用中值表示该项专利的典型性,用最小值表示该项专利的新颖性;

S4.3:统计数据集中所有专利的典型性和新颖性,对其进行排名。

进一步地,步骤S5中的自变量包括专利的典型性、新颖性、IPC分类号数量、同族数量、专利标题长度,是否属于PCT申请,多重线性回归公式为:

ycp=α0+α1xnov+α2xcon+α3xnum+α4xf+α5xtitle+α6xpct 4)

其中,ycp表示专利的被引数,xnov表示专利的新颖性,xcon表示专利的典型性,xnum表示专利的IPC分类号数量,xf表示专利的同族数量,xtitle表示专利标题长度,xpct为分类变量,若专利属于PCT申请,则xpct=1,否则,xpct=0,α0-α6表示等待确定的各项系数。

进一步地,用户需要输入的专利信息包括专利的IPC分类号,同族数量,专利标题,专利申请号,通过步骤S2-S4计算出专利的典型性和新颖性及对应的排名,再通过步骤S5预测未来的被引数。

实现本发明的结合网络特征和标准分数的专利质量评估方法的系统,其特征在于:包括数据获取与存储模块、网络构建模块、用户输入模块、专利质量评估模块、被引数预测模块,

所述数据获取与存储模块从互联网获取专利的各项信息,包括但不限于专利的IPC分类号、被引数等信息,储存在数据库中,从中筛选具有两个及以上IPC分类号的专利,形成数据集;

所述网络构建模块通过数据集中的专利信息构建IPC分类号的加权网络,并计算网络的各项指标;

所述专利质量评估模块通过网络构建模块构建的加权网络的各项指标,结合标准分数的计算公式,计算每项专利的IPC分类号配对的标准分数,从而计算专利的新颖性和典型性;

所述被引数预测模块以专利的各项指标为自变量,被引数为因变量进行多重线性回归分析,确定各项指标与被引数之间的系数,用这些系数来预测新申请专利的未来被引数;

所述用户输入模块用于接收用户想要评估的专利的各项信息;

所述的数据获取与存储模块、网络构建模块、专利质量评估模块、被引数预测、用户输入模块模块依次相连。

本发明的技术构思:将网络指标与标准分数相结合,并引入到专利研究领域,将IPC分类号构建成加权网络,由于这个分类号网络在构建的时候使用了专利内的IPC分类号信息,使得这个分类号网络可以反映在某个地区或国家内的技术单元使用情况,包括技术单元之间的配对。然后用网络特征指标结合标准分数的方法来量化专利的新颖性与典型性。同时使用多项式回归分析专利技术特征的新颖性和典型性与被引数之间的关系,从而达到预测新申请的专利在未来受到的被引数的目的。用户将专利的有关信息输入到系统中,系统根据输入的IPC分类号计算典型性和新颖性,给出典型性和新颖性的排名,然后通过步骤S5确定的系数,预测专利的未来被引数。

本发明的有益效果:使用IPC分类号构建网络,基于专利的技术领域角度出发分析专利技术特征的新颖性和典型性,使得计算出来的新颖性和典型性更加贴近专利实际上的新颖性和典型性,同时将标准分数与网络特征指标相结合,计算时间较之机器学习算法大大缩短。同时使用多重线性回归分析确定专利有关指标与被引数之间存在的关系,从而使得新申请的专利可以使用申请专利时就各项指标来预测专利未来可能会受到的被引数,从而为申请人对专利后续的处理提供有效的参考。

图1为本发明方法的流程图;

图2为本发明的系统结构示意图。

下面结合说明书附图对本发明的具体实施方式作进一步详细描述。

参照图1至图2,本发明公开了结合网络特征和标准分数的专利质量评估方法,其特征在于:包括以下步骤:

S1:从互联网获取专利的各项信息,包括但不限于专利的IPC分类号、被引数等信息,储存在数据库中,从中筛选具有两个及以上IPC分类号的专利,形成数据集;

S2:用数据库中的专利信息构建IPC分类号的加权网络;

S3:计算步骤S2中构建的加权网络的网络特征指标,用网络特征指标来计算IPC分类号配对的标准分数;

S4:通过IPC分类号配对的新颖性和典型性来计算专利的新颖性和典型性,并对新颖性和典型性进行排名;

S5:以专利的各项指标作为为自变量,被引数为因变量进行多重线性回归分析,确定各个指标与被引数之间的关系;

S6:用户输入想要评估的专利的各项信息,得到专利的典型性和新颖性、对应的排名以及预测的未来被引数。

进一步地,步骤S2中构建加权网络的具体方法如下:网络中的节点为每项专利中的IPC分类号,如果两个IPC同时出现在一个专利中,则在对应的两个节点之间形成一条连边,连边权重为连边在加权网络中出现的次数。

进一步地,步骤S3中的IPC分类号配对标准分数的计算公式如下:

式(1)中,X和Y为粗粒化到大组级别的IPC分类号,用所有属于X和Y大组的IPC分类号对应的节点和它们的连边组成的集合来表示,ZXY为计算得出的标准分数,VXY为集合内所有IPC分类号配对的实际出现次数,用对应节点之间的连边权重表示,EXY为集合内所有IPC分类号配对的期望出现次数,SXY为集合内所有IPC分类号配对出现次数的标准差;

EXY的计算公式如下:

SXY的的计算公式如下:

式(2)和式(3)中,X和Y集合内的IPC分类号以大组级别为界分为两部分,用xi和yj表示,其中x和y分别表示X和Y集合内的IPC分类号大组级别及以上的字符,i和j表示X和Y集合内的IPC分类号大组级别及以下的字符,M为数据集中的专利总数,δxy为去重变量,当x和y相同时,δxy=1,否则,δxy=0。

进一步地,所述步骤S4具体包括:

S4.1:先将一项专利中的IPC分类号粗粒化到大组级别,然后统计所有大组级别IPC分类号配对,每一对IPC分类号配对按照步骤S3中的公式计算得出标准分数;

S4.2:统计步骤S4.1中计算出的标准分数,计算标准分数的中值和最小值,用中值表示该项专利的典型性,用最小值表示该项专利的新颖性;

S4.3:统计数据集中所有专利的典型性和新颖性,对其进行排名。

进一步地,步骤S5中的自变量包括专利的典型性、新颖性、IPC分类号数量、同族数量、专利标题长度,是否属于PCT申请,多重线性回归公式为:

ycp=

α0+α1xnov+α2xcon+α3xnum+α4xf+α5xtitle+α6xpct 4)

其中,ycp表示专利的被引数,xnov表示专利的新颖性,xcon表示专利的典型性,xnum表示专利的IPC分类号数量,xf表示专利的同族数量,xtitle表示专利标题长度,xpct为分类变量,若专利属于PCT申请,则xpct=1,否则,xpct=0,α0-α6表示等待确定的各项系数。

进一步地,用户需要输入的专利信息包括专利的IPC分类号,同族数量,专利标题,专利申请号,通过步骤S2-S4计算出专利的典型性和新颖性及对应的排名,再通过步骤S5预测未来的被引数。

实现本发明的结合网络特征和标准分数的专利质量评估方法的系统,其特征在于:包括数据获取与存储模块、网络构建模块、用户输入模块、专利质量评估模块、被引数预测模块,

所述数据获取与存储模块从互联网获取专利的各项信息,包括但不限于专利的IPC分类号、被引数等信息,储存在数据库中,从中筛选具有两个及以上IPC分类号的专利,形成数据集;

所述网络构建模块通过数据集中的专利信息构建IPC分类号的加权网络,并计算网络的各项指标,具体方法如下:网络中的节点为每项专利中的IPC分类号,如果两个IPC同时出现在一个专利中,则在对应的两个节点之间形成一条连边,连边权重为连边在加权网络中出现的次数。计算的网络指标包括但不限于节点的出度和入度。

所述专利质量评估模块通过网络构建模块构建的加权网络的各项指标,结合标准分数的计算公式,计算每项专利的IPC分类号配对的标准分数,从而计算专利的新颖性和典型性,具体包括:IPC分类号配对标准分数的计算公式如下:

式(1)中,X和Y为粗粒化到大组级别的IPC分类号,用所有属于X和Y大组的IPC分类号对应的节点和它们的连边组成的集合来表示,ZXY为计算得出的标准分数,VXY为集合内所有IPC分类号配对的实际出现次数,用对应节点之间的连边权重表示,EXY为集合内所有IPC分类号配对的期望出现次数,SXY为集合内所有IPC分类号配对出现次数的标准差;

EXY的计算公式如下:

SXY的的计算公式如下:

式(2)和式(3)中,X和Y集合内的IPC分类号以大组级别为界分为两部分,用xi和yj表示,其中x和y分别表示X和Y集合内的IPC分类号大组级别及以上的字符,i和j表示X和Y集合内的IPC分类号大组级别及以下的字符,M为数据集中的专利总数,δxy为去重变量,当x和y相同时,δxy=1,否则,δxy=0。

针对每项专利,先将专利中的IPC分类号粗粒化到大组级别,然后统计所有大组级别IPC分类号配对,每一对IPC分类号配对按照步骤S3中的公式计算得出标准分数;统计计算出的标准分数,计算标准分数的中值和最小值,用中值表示该项专利的典型性,用最小值表示该项专利的新颖性;统计数据集中所有专利的典型性和新颖性,对其进行排名。

1.所述被引数预测模块以专利的各项指标为自变量,被引数为因变量进行多重线性回归分析,确定各项指标与被引数之间的系数,用这些系数来预测新申请专利的未来被引数,具体包括:自变量包括专利的典型性、新颖性、IPC分类号数量、同族数量、专利标题长度,是否属于PCT申请,多重线性回归公式为:

其中,ycp表示专利的被引数,xnov表示专利的新颖性,xcon表示专利的典型性,xnum表示专利的IPC分类号数量,xf表示专利的同族数量,xtitle表示专利标题长度,xpct为分类变量,若专利属于PCT申请,则xpct=1,否则,xpct=0,α0-α6表示等待确定的各项系数。

所述用户输入模块用于接收用户想要评估的专利的各项信息,具体包括:用户需要输入的专利信息包括专利的IPC分类号,同族数量,专利标题,专利申请号,通过步骤S2-S4计算出专利的典型性和新颖性及对应的排名,再通过步骤S5预测未来的被引数。

所述的数据获取与存储模块、网络构建模块、专利质量评估模块、被引数预测、用户输入模块模块依次相连。

本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

本文发布于:2024-09-22 10:24:58,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/67913.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议