一种基于价值传递的专利价值评估方法

著录项
  • CN201310036016.3
  • 20130130
  • CN103116811A
  • 20130522
  • 武汉大学
  • 彭智勇;冯岭;李展
  • G06Q10/04
  • G06Q10/04

  • 湖北省武汉市武昌区珞珈山武汉大学
  • 中国,CN,湖北(42)
  • 武汉科皓知识产权代理事务所(特殊普通合伙)
  • 鲁力
摘要
本发明公开了一种基于价值传递的专利价值评估方法,包括专利价值的静态评估过程和动态更新过程。在专利价值的评估过程中,首先根据专利之间的相似度构建专利引用网络,并初始化每一个节点的专利价值。然后根据“引用”该专利的节点的价值、“引用”节点所引用的专利数量及专利发表时间,计算“引用”专利对目标专利的价值的贡献度,并通过累加得到目标专利的价值。最后,依次计算每个专利的价值。当一个新的专利到来时,首先计算该专利与已有专利的相似度,建立“引用”关系,然后依次更新专利的价值。本发明依据PageRank算法的重要性传递思想,可以计算出专利数据库中每条专利的价值,具有较高的有效性。
权利要求

1.一种基于价值传递的专利价值评估方法,其特征在于,基于定义: 专利文档的集合D={d 1,d 2,…,d n},专利发表的时间集合T={T 1,T 2,…,T n}; 其中,d i表示专利i的文档内容;t i表示专利i的申请时间;包括由专利价 值的静态评估模块进行的专利价值的静态评估的步骤以及由动态更新模块 进行的动态更新步骤,具体包括:

由专利价值的静态评估模块进行的专利价值的静态评估的步骤:

步骤1.1,计算专利集合中两两专利文档之间的相似度;

步骤1.2,根据专利之间的相似度和发表的时间构建相似度网络;

步骤1.3,初始化所有专利的价值,根据价值传递的思想依次计算各 个专利的价值;

由专利价值的动态更新模块进行的专利价值的动态更新的步骤:

步骤2.1,当新的专利到来时,根据价值衰减因子更新各个专利文档 的当前价值;

步骤2.2,将新的专利文档加入专利相似度网络中;

步骤2.3,根据新的专利相似度网络依次更新各个专利的价值。

2.根据权利要求1所述的一种基于价值传递的专利价值评估方法,其 特征在于,所述的步骤1.1包括以下子步骤:

步骤1.11,计算专利文档的空间向量表示,具体操作方法如下:

对于专利文档集合D={d 1,d 2,…,d n}中的任意一条专利d i,利用一组关 键词的空间向量来表示;其过程为,首先对所有的专利文档进行中文分词, 然后根据自定义或公用的停用词词库去除文档中的停用词,;对于移除停用 词后词项,计算每个词项在文档中的权重,其计算公式为:

w ( t j , d i ) = tf ( t j , d i ) × log ( N / n t j + 0.01 ) Σ t j d i [ tf ( t j , d i ) × log ( N / n t j ) + 0.01 ] 2 公式一;

其中,w(t j,d i)为词项t j在文本d i中的权重,而tf(t j,d i)为词t j在 文本d i中的词频,N为专利集合D中专利的总数, 为专利集合D中出现 词项t j的专利文档数,分母为归一化因子;

最后,用各个词项对应的空间向量表示每一篇专利文档,表示为 其中w ij为词项t j在专利文档d i中的权重;

步骤1.12,根据文档的空间向量表示,计算两两专利文档之间的相似 度,具体操作方法为:

对任意两条专利文档d i和d j,使用其对应的向量之间的夹角余弦来度 量两者的相似度,其公式为:

sim ( d i , d j ) = Σ k = 1 n w k ( d i ) × w k ( d j ) ( Σ k = 1 n w k 2 ( d i ) ) × ( Σ k = 1 n w k 2 ( d j ) ) 公式二;

其中w k(d i)为第k个词项在文档d i中的权重,w k(d j)为第k个词项在文 档d j中的权重。

3.根据权利要求1所述的一种基于价值传递的专利价值评估方法,其 特征在于,其特征在于,所述的步骤1.2包括以下子步骤:

步骤1.21,将专利集合映射到相似度网络中,具体操作方法如下:

建立有向图G=(V,E),其中V对应于专利文档的集合D,E对应于专利 文档之间的联系,这里的联系为专利文档之间的相似度及专利发表时间上 的关联;

步骤3.2,构建专利网络的边,具体操作方法如下:

设定相似度阈值sim_thrd,对于任意两条专利文档d i和d j,如果两者 的相似度sim(d i,d j)>=sim_thrd,则在专利i和j之间建立一条边;如果专 利i的发表时间比专利j早,那么建立专利j到专利i的有向边;如果否 则建立专利i到j的有向边;其公式为:

e(d i,d j)=1    if sim(d i,d j)>=sim_thrd and T i>T j;

e(d i,d j)=‑1    if sim(d i,d j)>=sim_thrd and T i

e(d i,d j)=0    else

其中T i和T j分别表示专利i和专利j发表的时间,e(d i,d j)=1表示建 立节点i到节点j的有向边,‑1表示建立节点j到节点i的有向边,0表 示节点i与节点j之间不存在边。

4.根据权利要求1所述的一种基于价值传递的专利价值评估方法,其 特征在于,所述的步骤1.3包括以下子步骤:

步骤4.1,初始化所有专利的价值,具体操作方法如下:

专利的价值会随时间的变化而衰减,设定时间衰减因子为e ‑β,根据专 利发表时间和衰减因子依次初始化每一条专利的价值,对于任意一条专利 i,其初始化的专利价值R 0(i)的计算公式为:

R 0(i)=1×e ‑βt    公式四;

其中t为专利i发表到现在的时间;

t的计算公式为:

t=T i‑T 0    公式五;

其中T i为专利i发表的时间,T 0为当前时间;

步骤4.2,依次计算每个专利的价值,具体操作方法如下:

首先对专利集合中的所有专利按照其发表时间从后到前进行排序,然 后,依次计算各个专利的价值,对于任意专利i,它的价值由引用它的所有 专利对其的价值贡献度的大小决定,对于引用专利i的专利j,它传递给专 利i的专利价值的大小计算公式如下:

Contribution ( j , i ) Value ( j ) De ( j ) × sim ( d i , d j ) × e - β ( T j - T i ) 公式六;

其中Value(j)为专利j当前的价值,De(j)为专利j引用的专利的个数, 即相似度网络G中节点j的出度,

专利i的专利价值由引用i的所有专利对其的价值贡献度之和决定, 计算公式为:

公式七;

其中δ为阻尼系数,0<δ<1,由系统或用户设置。

5.根据权利要求1所述的一种基于价值传递的专利价值评估方法,其 特征在于,所述的步骤2.1包括以下子步骤:

步骤2.11,更新当前的时间 具体操作方法如下:

定义新的专利到来的时间为(t+1),前一个时间为t,更新(t+1)的时间 的当前时间 其公式为:

T 0 t + 1 = T 0 t + 1 公式八;

其中 为(t+1)时间的当前时间, 为t时间的当前时间;

步骤2.12,根据价值衰减因子计算已有专利条件下各个专利的价值, 具体的操作方法如下:在新的专利加入网络G之前,专利的价值随时间衰 减,其公式为:

Value t+1(i)=e ‑β×Value t(i)    公式九;

其中e ‑β为衰减因子,β由用户指定且0<β<1;Value t+1(i)为(t+1)时间 专利i的初始专利价值,Value t(i)为t时间专利i的专利价值。

6.根据权利要求1所述的一种基于价值传递的专利价值评估方法,其 特征在于,所述的步骤2.2包括以下子步骤:

步骤2.21,计算新的专利文档与已有专利文档的相似度,具体的操作 方法是:根据步骤1.1中的步骤,将新的文档进行分词、停用词移除处理, 并根据公式一计算词项在各个新的专利文档中的权重,利用空间向量来表 示每一条新的专利文档;之后应用公式二,计算新的专利文档于已有文档 之间的相似度;

步骤2.22,将新的专利文档加入专利相似度网络,具体的操作方法如 下:应用公式三依次判断新的专利文档于已有专利之间的关系,在相似度 网络G中建立新的专利与已有专利之间的边的关联。

7.根据权利要求1所述的一种基于价值传递的专利价值评估方法,其 特征在于,所述的步骤2.2的具体方法即依次更新各个专利的价值,具体 的操作方法是:首先对已有的专利按时间从后到前进行排序,然后对于在 网络中与新的专利存在路径的专利文档,按照顺序依次迭代地更新各个专 利的专利价值,其计算公式为:

公式十;

其中,De t+1(j)为(t+1)时间专利j在网路G中的出度。

说明书
技术领域

本发明涉及一种专利价值评估方法,尤其是涉及一种基于价值传递的 专利价值评估方法。

随着经济全球化进程的发展,知识和有用的信息呈现爆炸式的增长速 度,以知识为基础的产业在国内经济中所占的比重不断提高,知识产权已 经成为国家与国家、企业与企业之间竞争的焦点。目前知识产权已经引起 了各国广泛的重视,早在2002年日本就已经提出了建立“知识产权国”的 国家策略。

专利是世界上最大的技术信息源,是科技信息及知识的载体,是受法 律规范保护的发明创造。它是指一项发明创造向国家审批机关提出专利申 请,经依法审查合格后向专利申请人授予的在规定的时间内对该项发明创 造享有的专有权。专利权人对其拥有的专利权享有独占或排他的权利,未 经其许可或者出现法专利权律规定的特殊情况,任何人不得使用,否则即 构成侵权。非专利权人要想使用他人的专利技术,必须依法征得专利权人 的同意或许可。取得他人的专利权一般通过专利购买来实现,因此在非专 利权人的专利购买和专利权人的专利转让过程中,专利价值的评估显得格 外重要。

在美国知识产权咨询公司CHI二十世纪70年代早期提出的指标评价体 系中,引证指数,即专利被引用的次数被用来评估目标专利的影响力和价 值,专利的引证次数越高,代表该技术属于基础性或领先技术,处于核心 技术或位于技术交叉点。但这种方法只考虑了目标专利被引用的数量对专 利价值的影响,并没有考虑引用专利本身的价值以及专利的新颖性对专利 价值的影响,中文专利引证关系的缺失也给这种方法带来了困难。尽管有 文献提出从发明者的国别、专利的技术领域、专利的拥有者等因素分析专 利的价值,但并没有给出完善的分析专利价值的方案。特别地,2011年中 国技术交易所提出了“专利价值分析指标体系”,通过法律价值度、技术价 值度和经济价值度三方面来衡量专利的价值,但其中的指标完全依赖与人 工的评估,需要耗费大量的人力资源和时间资源。

本发明主要是解决现有技术所存在的技术问题;提供了一种考虑了潜 在引用关系对专利价值的影响;解决了中文专利中部分引文信息缺失造成 的影响的一种基于价值传递的专利价值评估方法。

本发明还有一目的是解决现有技术所存在的技术问题;提供了一种考 虑了专利新颖性对专利价值的影响;具有良好的价值评估效果的一种基于 价值传递的专利价值评估方法。

本发明的上述技术问题主要是通过下述技术方案得以解决的:

一种基于价值传递的专利价值评估方法,其特征在于,基于定义:专 利文档的集合D={d1,d2,…,dn},专利发表的时间集合T={T1,T2,…,Tn};其 中,di表示专利i的文档内容;ti表示专利i的申请时间;包括由专利价值 的静态评估模块进行的专利价值的静态评估的步骤以及由动态更新模块进 行的动态更新步骤,具体包括:

由专利价值的静态评估模块进行的专利价值的静态评估的步骤:

步骤1.1,计算专利集合中两两专利文档之间的相似度;

步骤1.2,根据专利之间的相似度和发表的时间构建相似度网络;

步骤1.3,初始化所有专利的价值,根据价值传递的思想依次计算各 个专利的价值;

由专利价值的动态更新模块进行的专利价值的动态更新的步骤:

步骤2.1,当新的专利到来时,根据价值衰减因子更新各个专利文档 的当前价值;

步骤2.2,将新的专利文档加入专利相似度网络中;

步骤2.3,根据新的专利相似度网络依次更新各个专利的价值。

在上述的一种基于价值传递的专利价值评估方法,所述的步骤1.1包 括以下子步骤:

步骤1.11,计算专利文档的空间向量表示,具体操作方法如下:

对于专利文档集合D={d1,d2,…,dn}中的任意一条专利di,利用一组关 键词的空间向量来表示;其过程为,首先对所有的专利文档进行中文分词, 然后根据自定义或公用的停用词词库去除文档中的停用词;对于移除停用 词后词项,计算每个词项在文档中的权重,其计算公式为:

<mrow> <mi>w</mi> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>j</mi> </msub> <mo>,</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>tf</mi> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>j</mi> </msub> <mo>,</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>&times;</mo> <mi>log</mi> <mrow> <mo>(</mo> <mi>N</mi> <mo>/</mo> <msub> <mi>n</mi> <msub> <mi>t</mi> <mi>j</mi> </msub> </msub> <mo>+</mo> <mn>0.01</mn> <mo>)</mo> </mrow> </mrow> <msqrt> <msub> <mi>&Sigma;</mi> <mrow> <msub> <mi>t</mi> <mi>j</mi> </msub> <mo>&Element;</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> </mrow> </msub> <msup> <mrow> <mo>[</mo> <mi>tf</mi> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>j</mi> </msub> <mo>,</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>&times;</mo> <mi>log</mi> <mrow> <mo>(</mo> <mi>N</mi> <mo>/</mo> <msub> <mi>n</mi> <msub> <mi>t</mi> <mi>j</mi> </msub> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mn>0.01</mn> <mo>]</mo> </mrow> <mn>2</mn> </msup> </msqrt> </mfrac> </mrow> 公式一;

其中,w(tj,di)为词项tj在文本di中的权重,而tf(tj,di)为词tj
文本di中的词频,N为专利集合D中专利的总数,为专利集合D出现词
项tj的专利文档数,分母为归一化因子;

最后,用各个词项对应的空间向量表示每一篇专利文档,表示为
其中wij为词项tj在专利文档di中的权重;

步骤1.12,根据文档的空间向量表示,计算两两专利文档之间的相似 度,具体操作方法为:

对任意两条专利文档di和dj,使用其对应的向量之间的夹角余弦来度 量两者的相似度,其公式为:

<mrow> <mi>sim</mi> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>w</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>&times;</mo> <msub> <mi>w</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> <msqrt> <mrow> <mo>(</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msubsup> <mi>w</mi> <mi>k</mi> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>)</mo> </mrow> <mo>&times;</mo> <mrow> <mo>(</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msubsup> <mi>w</mi> <mi>k</mi> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>)</mo> </mrow> </msqrt> </mfrac> </mrow> 公式二;

其中wk(di)为第k个词项在文档di中的权重,wk(dj)为第k个词项在文 档dj中的权重。

在上述的一种基于价值传递的专利价值评估方法,其特征在于,所述 的步骤1.2包括以下子步骤:

步骤1.21,将专利集合映射到相似度网络中,具体操作方法如下:

建立有向图G=(V,E),其中V对应于专利文档的集合D,E对应于专利 文档之间的联系,这里的联系为专利文档之间的相似度及专利发表时间上 的关联;

步骤3.2,构建专利网络的边,具体操作方法如下:

设定相似度阈值sim_thrd,对于任意两条专利文档di和dj,如果两者 的相似度sim(di,dj)>=sim_thrd,则在专利i和j之间建立一条边;如果专 利i的发表时间比专利j早,那么建立专利j到专利i的有向边;如果否 则建立专利i到j的有向边;其公式为:

e(di,dj)=1    if sim(di,dj)>=sim_thrd and Ti>Tj;

e(di,dj)=‑1    if sim(di,dj)>=sim_thrd and Ti

e(di,dj)=0    else

其中Ti和Tj分别表示专利i和专利j发表的时间,e(di,dj)=1表示建 立节点i到节点j的有向边,‑1表示建立节点j到节点i的有向边,0表 示节点i与节点j之间不存在边。

在上述的一种基于价值传递的专利价值评估方法,所述的步骤1.3包 括以下子步骤:

步骤4.1,初始化所有专利的价值,具体操作方法如下:

专利的价值会随时间的变化而衰减,设定时间衰减因子为e‑β,其中0< β<1,其值由用户指定。根据专利发表时间和衰减因子依次初始化每一条 专利的价值。对于任意一条专利i,其初始化的专利价值R0(i)的计算公式 为:

R0(i)=1×e‑βt    公式四;

其中t为专利i发表到现在的时间。

t的计算公式为:

t=Ti‑T0    公式五;

其中Ti为专利i发表的时间,T0为当前时间。

步骤4.2,依次计算每个专利的价值,具体操作方法如下:

首先对专利集合中的所有专利按照其发表时间从后到前进行排序。然 后,依次计算各个专利的价值。对于任意专利i,它的价值由引用它的所有 专利对其的价值贡献度的大小决定。对于引用专利i的专利j,它传递给专 利i的专利价值的大小计算公式如下:

<mrow> <mi>Contribution</mi> <mrow> <mo>(</mo> <mi>j</mi> <mo>,</mo> <mi>i</mi> <mo>)</mo> </mrow> <mfrac> <mrow> <mi>Value</mi> <mrow> <mo>(</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mi>De</mi> <mrow> <mo>(</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>&times;</mo> <mi>sim</mi> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>&times;</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>&beta;</mi> <mrow> <mo>(</mo> <msub> <mi>T</mi> <mi>j</mi> </msub> <mo>-</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </msup> </mrow> 公式六;

其中Value(j)为专利j当前的价值,De(j)为专利j引用的专利的个数, 即相似度网络G中节点j的出度。

专利i的专利价值由引用i的所有专利对其的价值贡献度之和决定, 计算公式为:

公式七;

其中δ为阻尼系数,0<δ<1,由系统或用户设置。

在上述的一种基于价值传递的专利价值评估方法,所述的步骤2.1包 括以下子步骤:

步骤2.11,更新当前的时间具体操作方法如下:

定义新的专利到来的时间为(t+1),前一个时间为t,更新(t+1)的时间
的当前时间其公式为:

<mrow> <msubsup> <mi>T</mi> <mn>0</mn> <mrow> <mi>t</mi> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> <mo>=</mo> <msubsup> <mi>T</mi> <mn>0</mn> <mi>t</mi> </msubsup> <mo>+</mo> <mn>1</mn> </mrow> 公式八;

其中为(t+1)时间的当前时间,为t时间的当前时间;

步骤2.12,根据价值衰减因子计算已有专利条件下各个专利的价值, 具体的操作方法如下:在新的专利加入网络G之前,专利的价值随时间衰 减,其公式为:

Valuet+1(i)=e‑β×Valuet(i)    公式九;

其中e‑β为衰减因子,β由用户指定且0<β<1;Valuet+1(i)为(t+1)时间 专利i的初始专利价值,Valuet(i)为t时间专利i的专利价值。

在上述的一种基于价值传递的专利价值评估方法,所述的步骤2.2包 括以下子步骤:

步骤2.21,计算新的专利文档与已有专利文档的相似度,具体的操作 方法是:根据步骤1.1中的步骤,将新的文档进行分词、停用词移除处理, 并根据公式一计算词项在各个新的专利文档中的权重,利用空间向量来表 示每一条新的专利文档;之后应用公式二,计算新的专利文档于已有文档 之间的相似度;

步骤2.22,将新的专利文档加入专利相似度网络,具体的操作方法如 下:应用公式三依次判断新的专利文档于已有专利之间的关系,在相似度 网络G中建立新的专利与已有专利之间的边的关联。

在上述的一种基于价值传递的专利价值评估方法,所述的步骤2.2的 具体方法即依次更新各个专利的价值,具体的操作方法是:首先对已有的 专利按时间从后到前进行排序,然后对于在网络中与新的专利存在路径的 专利文档,按照顺序依次迭代地更新各个专利的专利价值,其计算公式为:

公式十;

其中,Det+1(j)为(t+1)时间专利j在网路G中的出度。

因此,本发明具有如下优点:1.考虑了潜在引用关系对专利价值的影 响;2.解决了中文专利中部分引文信息缺失造成的影响;3.考虑了专利新 颖性对专利价值的影响;4.具有良好的价值评估效果。

图1为本发明中构建相似度网络的示意图。

图2为建立的相似度网络的示意图。

图3为本发明中新的专利加入网络的示意图。

图4为本发明中专利价值评估方法的流程。

下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的 说明。

实施例:

一种基于价值传递的专利价值评估方法,包括专利价值的静态评估步 骤和动态更新步骤,分别执行专利价值的静态评估和动态更新。其基于定 义:专利文档的集合D={d1,d2…,dn},专利发表的时间集合 T={T1,T2…,Tn}。其中,di表示专利i的文档内容;Ti表示专利i的申请时 间。方法具体操作如下:

所述的专利价值的静态评估步骤:

步骤1.1,计算专利集合中两两专利文档之间的相似度。

本发明拟在相似度网络中采用价值传递的方法对专利的价值进行评 估,首先需要建立专利文档集的相似度网络。传统的文档相似度方法包括 余弦相似度、Jaccard系数、基于HowNet的相似度计算方法,本发明拟以 余弦相似度为例进行专利文档的相似度计算。具体操作如下:

步骤1.1.1,计算专利文档的空间向量表示:

对于专利文档集合D={d1,d2,…,dn}中的任意一条专利di,可以用一组 关键词的空间向量来表示。其过程为,首先采用现有的中文分词软件,如 中科院分词软件ICTCLAS对所有的专利文档进行中文分词,然后根据自定 义或公用的停用词词库去除文档中的停用词,其中停用词为没有什么实际 含义的功能词,如语气助词、副词、介词、连接词等。对于移除停用词后 词项,计算每个词项在文档中的权重,其计算公式为:

<mrow> <mi>w</mi> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>j</mi> </msub> <mo>,</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>tf</mi> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>j</mi> </msub> <mo>,</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>&times;</mo> <mi>log</mi> <mrow> <mo>(</mo> <mi>N</mi> <mo>/</mo> <msub> <mi>n</mi> <msub> <mi>t</mi> <mi>j</mi> </msub> </msub> <mo>+</mo> <mn>0.01</mn> <mo>)</mo> </mrow> </mrow> <msqrt> <msub> <mi>&Sigma;</mi> <mrow> <msub> <mi>t</mi> <mi>j</mi> </msub> <mo>&Element;</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> </mrow> </msub> <msup> <mrow> <mo>[</mo> <mi>tf</mi> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>j</mi> </msub> <mo>,</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>&times;</mo> <mi>log</mi> <mrow> <mo>(</mo> <mi>N</mi> <mo>/</mo> <msub> <mi>n</mi> <msub> <mi>t</mi> <mi>j</mi> </msub> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mn>0.01</mn> <mo>]</mo> </mrow> <mn>2</mn> </msup> </msqrt> </mfrac> </mrow> 公式1

其中,w(tj,di)为词项tj在文本di中的权重,也记作wij,而tf(tj,di)为
词tj在文本di中的词频,N为专利集合D中专利的总数,为专利集合D
出现词项tj的专利文档数,分母为归一化因子。

最后,用各个词项对应的空间向量表示每一篇专利文档,表示为
其中wij为词项tj在专利文档di中的权重。

步骤1.1.2,根据文档的空间向量表示,计算两两专利文档之间的相 似度:

对任意两条专利文档di和dj,使用其对应的向量之间的夹角余弦来度 量两者的相似度,其公式为:

<mrow> <mi>sim</mi> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>w</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>&times;</mo> <msub> <mi>w</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> <msqrt> <mrow> <mo>(</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msubsup> <mi>w</mi> <mi>k</mi> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>)</mo> </mrow> <mo>&times;</mo> <mrow> <mo>(</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msubsup> <mi>w</mi> <mi>k</mi> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>)</mo> </mrow> </msqrt> </mfrac> </mrow> 公式2

其中wk(di)为第k个词项在文档di中的权重,wk(dj)为第k个词项在文档dj 中的权重。

步骤1.2,根据步骤1.1所得的专利文档间的相似度,结合专利的发 表时间,构建相似度网络。

由于中文专利间缺少引文信息,因此本发明拟采用专利之间的相似度 关联和发表时间的关联模拟出专利之间的潜在引用关系,即认为两个专利 文档的内容相似,则发表时间较晚的专利对发表时间较早的专利具有潜在 的引用关系。本发明拟构建的相似度网络是包含专利文档集合中所有专利 的有向图,它根据专利间的相似度大小确定两两之间是否存在链接,根据 专利发表时间的先后,确定链接的方向。具体的操作方法如下:

步骤1.2.1,将专利集合映射到相似度网络中,具体操作方法如下:

建立有向图G=(V,E),其中V对应于专利文档的集合D,E对应于专利 文档之间的联系,这里的联系为专利文档之间的相似度及专利发表时间上 的关联。

步骤1.2.2,构建专利网络中的链接:

设定相似度阈值sim_thrd,对于任意两条专利文档di和dj,如果两者 的相似度sim(di,dj)>=sim_thrd,则考虑在专利i和j之间建立一条边。如 果专利i的发表时间比专利j早,那么建立专利j到专利i的有向边;如 果否则建立专利i到j的有向边。其公式为:

e(di,dj)=1    if sim(di,dj)>=sim_thrd and Ti>Tj;

e(di,dj)=‑1    if sim(di,dj)>=sim_thrd and Ti

e(di,dj)=0    else

其中Ti和Tj分别表示专利i和专利j发表的时间,e(di,dj)=1表示建 立节点i到节点j的有向边,‑1表示建立节点j到节点i的有向边,0表 示节点i与节点j之间不存在边。

步骤1.3,初始化所有专利的价值,根据价值传递的思想按序依次计 算专利的价值。

本发明拟采用PageRank算法中的重要性传递思想来对专利的价值进行 评估,即如果专利A引用了专利B,则A对B贡献一定的专利价值。B被“引 用”的次数越多,则B的价值相对较大。这里的“引用”指的是相似度网 络中建立的链接关系,包括直接“引用”和间接“引用”。另外,本发明还 考虑了专利的新颖性对专利价值的影响,专利的价值会随时间而衰减,即 专利发表的时间越长,则专利的价值相对较低。具体操作如下:

步骤1.3.1,初始化所有专利的价值:

专利的价值会随时间的变化而衰减,设定价值衰减因子为e‑β,其中0< β<1,根据专利发表时间和衰减因子依次初始化每一条专利的价值。对于任 意一条专利i,其初始化的专利价值R0(i)的计算公式为:

R0(i)=1×e‑βt    公 式4

其中t为专利i发表到现在的时间。

t的计算公式为:

t=Ti‑T0    公 式5

其中Ti为专利i发表的时间,T0为当前时间。

步骤1.3.2,依次计算每个专利的价值:

初始化专利的价值之后,根据PageRank思想对各个专利的价值进行评 估。首先,对专利集合中的所有专利按照其发表时间从后到前进行排序。 然后,依次计算各个专利的价值。对于任意专利i,它的价值由引用它的所 有专利对其的价值贡献度的大小决定。对于引用专利i的专利j,它传递给 专利i的专利价值的大小计算公式如下:

<mrow> <mi>Contribution</mi> <mrow> <mo>(</mo> <mi>j</mi> <mo>,</mo> <mi>i</mi> <mo>)</mo> </mrow> <mfrac> <mrow> <mi>Value</mi> <mrow> <mo>(</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mi>De</mi> <mrow> <mo>(</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>&times;</mo> <mi>sim</mi> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>&times;</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>&beta;</mi> <mrow> <mo>(</mo> <msub> <mi>T</mi> <mi>j</mi> </msub> <mo>-</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </msup> </mrow>
式6

其中Value(j)为专利j当前的价值,De(j)为专利j引用的专利的个数, 即相似度网络G中节点j的出度。

专利i的专利价值由引用i的所有专利对其的价值贡献度之和决定, 计算公式为:

公式7

其中δ为阻尼系数,0<δ<1,可由系统设定默认值,也可由用户自行 设定。

所述的专利价值的动态更新步骤:

步骤2.1,当新的专利到来时,根据衰减因子更新各个专利文档的当 前价值。

专利价值的静态评估步骤可以对静态网络中的所有专利的价值进行评 估。然而随着时间的演化,专利的价值也会发生变化。当新的专利文档到 来时,必须对所有专利的价值进行更新。首先要将T0更新为新专利到来的 时间,并根据价值衰减因子将新专利加入网络G之前的已有专利的价值进 行更新。具体操作如下:

步骤2.1.1,更新当前的时间

假设新的专利到来的时间为(t+1),前一个时间为t,更新(t+1)的时间
的当前时间其公式为:

<mrow> <msubsup> <mi>T</mi> <mn>0</mn> <mrow> <mi>t</mi> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> <mo>=</mo> <msubsup> <mi>T</mi> <mn>0</mn> <mi>t</mi> </msubsup> <mo>+</mo> <mn>1</mn> </mrow>

公式8

其中为(t+1)时间的当前时间,为t时间的当前时间。

步骤2.1.2,根据价值随价值衰减因子计算在已有专利的条件下各个专 利的价值:

专利的价值是随时间的演化逐渐衰减的。在新的专利加入前,专利的 价值随时间衰减,其公式为:

Valuet+1(i)=e‑β×Valuet(i) 公式9

其中Valuet+1(i)为(t+1)时间新的专利加入网络G之前专利i的价值, Valuet(i)为t时间专利i的价值。

步骤2.2,将新的专利文档加入专利相似度网络中。

在进行下一步的专利价值更新之前,需要先将已有专利加入到相似度网 络G中。新的专利文档加入网络的方法与步骤1.1和步骤1.2相同,即首 先用空间向量模型表示每一条新的专利文档,之后采用余弦定理度量专利 之间的相似度,然后根据新的专利与已有专利之间的关联,包括相似度和 发表时间上的关联,建立相应的边,将新的专利加入到网络G中。具体操 作如下:

步骤2.2.1,计算新的专利文档与已有专利文档的相似度:

根据步骤1.1中的步骤,将新的文档进行分词、停用词移除处理,并 根据公式1计算词项在各个新的专利文档中的权重,利用空间向量来表示 每一条新的专利文档。之后应用公式2,计算新的专利文档于已有文档之间 的相似度。

步骤2.2.2,将新的专利文档加入专利相似度网络:

应用公式3依次判断新的专利文档于已有专利之间的关系,在相似度 网络G中建立新的专利与已有专利之间的边的关联。

步骤2.3,根据新的专利相似度网络依次更新各个专利的价值。

当新的专利到来时,当前专利的价值会发生一定的变化。对于被新的专 利引用的专利文档,它的价值会因为新的专利的引用而增大。具体操作如 下:

步骤2.3.1,依次更新各个专利的价值,具体的操作方法如下:

首先对已有的专利按时间从后到前进行排序,然后对于在网络中与新的 专利连通的专利文档,按照顺序依次迭代地更新各个专利的专利价值,其 计算公式为:

公式10

其中Det+1(j)为(t+1)时间专利j在网路G中的出度。

应当具体说明的是:本发明具有以下主要有益效果:

第一.本发明中提出的专利价值评估方法具有很好的有效性,具体说 明如下:

(1)本发明基于专利之间的“引用关系“,根据用与标识网页的等级 和重要性的PageRank算法的重要性传递思想提出了评估专利价值的算法, 并根据专利新颖性的需要加入了时间因素,考虑专利的价值随时间的演化 逐渐降低的特点,对算法进行了改进,有效地结合了影响专利价值的多种 因素,具有很高的可靠性和有效性。

本文依据专利之间的相似度和专利发表时间上的关联模拟了专利之间 的潜在引用关系,解决了中文专利中引文缺失给专利价值评估带来的影响。

第二.本发明中提出的算法具有良好的时效性,具体说明如下:

在专利价值的静态评估步骤和动态更新步骤中,算法的时间复杂度均 为多项式时间,能够较快地对所有专利的价值进行评估,具有良好的时效 性和可扩展性。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明 所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或 补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权 利要求书所定义的范围。

本文发布于:2024-09-23 02:30:08,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/67563.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议