一种专利组合生成方法及平台

著录项
  • CN201910004140.9
  • 20190103
  • CN109726401A
  • 20190507
  • 中国联合网络通信集团有限公司
  • 茹丽洁;康飞;李素粉;范云杰
  • G06F17/27
  • G06F17/27 G06F16/35 G06Q50/18

  • 北京市西城区金融大街21号
  • 北京(11)
  • 北京天昊联合知识产权代理有限公司
  • 彭瑞欣;刘悦晗
摘要
本发明涉及计算机技术领域,具体公开了一种专利组合生成方法及平台,该方法包括:计算待分组专利集合中每个专利与其他专利间的文本相似度;根据所述文本相似度对所述待分组专利集进行分组并生成多个专利子集,每个专利子集包括多个专利;计算每个所述专利子集的网络相关性密度和互补性指标;若判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的互补性指标范围内,根据所述专利子集生成专利组合,所述专利组合为技术关联专利组合或产品关联专利组合。本发明能够以非人工的方式挖掘专利技术之间的深层次关联关系并生成专利组合,从而提升专利组合的识别效率及企业专利的专利转移和转化率。
权利要求

1.一种专利组合生成方法,其特征在于,包括:

计算待分组专利集合中每个专利与其他专利间的文本相似度;

根据所述文本相似度对所述待分组专利集进行分组并生成多个专利子集,每个专利子集包括多个专利;

计算每个所述专利子集的网络相关性密度和互补性指标;

若判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的互补性指标范围内,根据所述专利子集生成专利组合,所述专利组合为技术关联专利组合或产品关联专利组合。

2.根据权利要求1所述的专利组合生成方法,其特征在于,所述计算待分组专利集合中每个专利与其他专利间的文本相似度具体包括:

采用LDA模型生成与待分组专利集合中每个专利分别对应的主题特征向量;

根据所述主题特征向量和余弦相似性算法生成待分组专利集合中每个专利与其他专利间的文本相似度。

3.根据权利要求1所述的专利组合生成方法,其特征在于,在所述计算每个所述专利子集的网络相关性密度和互补性指标之前包括:

获取多个专利组合样本,所述专利组合样本包括技术关联专利组合样本和产品关联专利组合样本;

计算每个所述专利组合样本的网络相关性密度和互补性指标;

根据多个所述专利组合样本的网络相关性密度和互补性指标生成密度阈值和互补性指标范围,所述互补性指标范围包括技术关联专利组合的互补性指标范围和产品关联专利组合的互补性指标范围。

4.根据权利要求3所述的专利组合生成方法,其特征在于,根据多个所述专利组合样本的网络相关性密度和互补性指标生成密度阈值和互补性指标范围具体包括:

对多个所述专利组合样本的网络相关性密度取平均值或取最小值以生成密度阈值;

根据技术关联专利组合样本的互补性指标生成技术关联专利组合的互补性指标范围;

根据产品关联专利组合样本的互补性指标生成产品关联专利组合的互补性指标范围;

所述若判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的互补性指标范围内,根据所述专利子集生成专利组合具体包括:

若判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的技术关联专利组合的互补性指标范围内,根据所述专利子集生成技术关联专利组合;

若判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的产品关联专利组合的互补性指标范围内,根据所述专利子集生成产品关联专利组合。

5.根据权利要求1-4任一所述的专利组合生成方法,其特征在于,

通过公式计算得出网络相关性密度,其中,D为专利子集或专利组合样本的网络相关性密度,Rij为专利子集或专利组合样本内专利i和专利j间的文本相似度,N为专利子集或专利组合样本所包括的专利总数目。

6.根据权利要求1-4任一所述的专利组合生成方法,其特征在于,所述互补性指标根据交叉性指标、聚合性指标和差异性指标生成;

所述交叉性指标通过公式计算得出,其中,RS为专利子集或专利组合样本的交叉性指标,pi为专利类别i在该专利子集或专利组合样本的所有专利类别中的概率分布值,pj为专利类别j在该专利子集或专利组合样本的所有专利类别中的概率分布值,dij为专利子集或专利组合样本中不同专利类别间的距离值,α与β为计量参数;

所述聚合性指标通过公式计算得出,其中,CC为专利子集或专利组合样本的聚合性指标,0≤CC≤1,NΔ为专利子集或专利组合样本中三元闭包的数量,N3为专利子集或专利组合样本中连通三元组的数量;

所述差异性指标通过公式计算得出,其中,S为专利子集或专利组合样本的差异性指标,N为专利子集或专利组合样本所包含的专利总数目,Rij为专利子集或专利组合样本中专利i和专利j之间的共被引强度,Cij为专利子集或专利组合样本中专利i和专利j之间的共被引频次,Ci为专利i的总被引频次,Cj为专利j的总被引频次。

7.一种专利组合生成平台,其特征在于,包括预测模块,所述预测模块包括:

第一计算单元,用于计算待分组专利集合中每个专利与其他专利间的文本相似度,计算每个所述专利子集的网络相关性密度和互补性指标;

判断单元,用于判断所述专利子集的网络相关性密度是否大于预设密度阈值且所述专利子集的互补性指标是否位于预设的互补性指标范围内;

第一生成单元,用于根据所述文本相似度对所述待分组专利集进行分组并生成多个专利子集,每个专利子集包括多个专利,当判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的互补性指标范围内时,根据所述专利子集生成专利组合,所述专利组合为技术关联专利组合或产品关联专利组合。

8.根据权利要求7所述的专利组合生成平台,其特征在于,所述第一计算单元具体用于采用LDA模型生成与待分组专利集合中每个专利分别对应的主题特征向量,根据所述主题特征向量和余弦相似性算法生成待分组专利集合中每个专利与其他专利间的文本相似度。

9.根据权利要求7所述的专利组合生成平台,其特征在于,该平台还包括训练模块,所述训练模块包括:

获取单元,用于获取多个专利组合样本,所述专利组合样本包括技术关联专利组合样本和产品关联专利组合样本;

第二计算单元,用于计算每个所述专利组合样本的网络相关性密度和互补性指标;

第二生成单元,根据多个所述专利组合样本的网络相关性密度和互补性指标生成密度阈值和互补性指标范围,所述互补性指标范围包括技术关联专利组合的互补性指标范围和产品关联专利组合的互补性指标范围。

10.根据权利要求9所述的专利组合生成平台,其特征在于,

所述第二生成单元具体用于对多个所述专利组合样本的网络相关性密度取平均值或取最小值以生成密度阈值,根据技术关联专利组合样本的互补性指标生成技术关联专利组合的互补性指标范围,根据产品关联专利组合样本的互补性指标生成产品关联专利组合的互补性指标范围;

所述第一生成单元具体用于当判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的技术关联专利组合的互补性指标范围内时,根据所述专利子集生成技术关联专利组合,当判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的产品关联专利组合的互补性指标范围内时,根据所述专利子集生成产品关联专利组合。

说明书
技术领域

本发明涉及计算机技术领域,特别涉及一种专利组合生成方法及平台。

随着知识经济时代的到来,我国企业的专利申请量逐年增加,企业专利池不断丰富。但另一方面,企业专利的专利技术转移和转化率极低,相当多的专利未被实施使用,实验室成果与技术市场化应用间存在着巨大的差距。为促进专利技术转移和转化,需首先进行专利价值评估。

专利价值并不体现在单件专利上,而是体现在一组具有内部关联的专利组合上,专利组合的价值远大于专利组合内部所有单件专利的价值总和。因此,专利技术转移和转化过程往往不是针对单件或随意几件专利,而是将一系列具有内部关联的专利打包形成专利组合进行整体转让,以获得最大的经济收益。识别专利组合对提升企业专利的总体价值和转移效率具有重大的意义。当前,专利组合的识别工作主要依靠专家经验判断,这种方式耗时耗力,且难以挖掘专利技术之间的深层次关联关系,不利于提高专利技术的专利转移和转化率。

应该注意,上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本发明的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。

本发明所要解决的技术问题是针对现有技术中上述不足,提供了一种专利组合生成方法及平台,能够以非人工的方式挖掘专利技术之间的深层次关联关系并生成专利组合,从而提升专利组合的识别效率及企业专利的专利转移和转化率。

为实现上述目的,本发明提供了一种专利组合生成方法,包括:

计算待分组专利集合中每个专利与其他专利间的文本相似度;

根据所述文本相似度对所述待分组专利集进行分组并生成多个专利子集,每个专利子集包括多个专利;

计算每个所述专利子集的网络相关性密度和互补性指标;

若判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的互补性指标范围内,根据所述专利子集生成专利组合,所述专利组合为技术关联专利组合或产品关联专利组合。

可选地,所述计算待分组专利集合中每个专利与其他专利间的文本相似度具体包括:

采用LDA模型生成与待分组专利集合中每个专利分别对应的主题特征向量;

根据所述主题特征向量和余弦相似性算法生成待分组专利集合中每个专利与其他专利间的文本相似度。

可选地,在所述计算每个所述专利子集的网络相关性密度和互补性指标之前包括:

获取多个专利组合样本,所述专利组合样本包括技术关联专利组合样本和产品关联专利组合样本;

计算每个所述专利组合样本的网络相关性密度和互补性指标;

根据多个所述专利组合样本的网络相关性密度和互补性指标生成密度阈值和互补性指标范围,所述互补性指标范围包括技术关联专利组合的互补性指标范围和产品关联专利组合的互补性指标范围。

可选地,根据多个所述专利组合样本的网络相关性密度和互补性指标生成密度阈值和互补性指标范围具体包括:

对多个所述专利组合样本的网络相关性密度取平均值或取最小值以生成密度阈值;

根据技术关联专利组合样本的互补性指标生成技术关联专利组合的互补性指标范围;

根据产品关联专利组合样本的互补性指标生成产品关联专利组合的互补性指标范围;

所述若判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的互补性指标范围内,根据所述专利子集生成专利组合具体包括:

若判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的技术关联专利组合的互补性指标范围内,根据所述专利子集生成技术关联专利组合;

若判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的产品关联专利组合的互补性指标范围内,根据所述专利子集生成产品关联专利组合。

可选地,通过公式计算得出网络相关性密度,其中,D为专利子集或专利组合样本的网络相关性密度,Rij为专利子集或专利组合样本内专利i和专利j间的文本相似度,N为专利子集或专利组合样本所包括的专利总数目。

可选地,所述互补性指标根据交叉性指标、聚合性指标和差异性指标生成;

所述交叉性指标通过公式计算得出,其中,RS为专利子集或专利组合样本的交叉性指标,pi为专利类别i在该专利子集或专利组合样本的所有专利类别中的概率分布值,pj为专利类别j在该专利子集或专利组合样本的所有专利类别中的概率分布值,dij为专利子集或专利组合样本中不同专利类别间的距离值,α与β为计量参数;

所述聚合性指标通过公式计算得出,其中,CC为专利子集或专利组合样本的聚合性指标,0≤CC≤1,NΔ为专利子集或专利组合样本中三元闭包的数量,N3为专利子集或专利组合样本中连通三元组的数量;

所述差异性指标通过公式计算得出,其中,S为专利子集或专利组合样本的差异性指标,N为专利子集或专利组合样本所包含的专利总数目,Rij为专利子集或专利组合样本中专利i和专利j之间的共被引强度,Cij为专利子集或专利组合样本中专利i和专利j之间的共被引频次,Ci为专利i的总被引频次,Cj为专利j的总被引频次。

为实现上述目的,本发明还提供了一种专利组合生成平台,包括预测模块,所述预测模块包括:

第一计算单元,用于计算待分组专利集合中每个专利与其他专利间的文本相似度,计算每个所述专利子集的网络相关性密度和互补性指标;

判断单元,用于判断所述专利子集的网络相关性密度是否大于预设密度阈值且所述专利子集的互补性指标是否位于预设的互补性指标范围内;

第一生成单元,用于根据所述文本相似度对所述待分组专利集进行分组并生成多个专利子集,每个专利子集包括多个专利,当判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的互补性指标范围内时,根据所述专利子集生成专利组合,所述专利组合为技术关联专利组合或产品关联专利组合。

可选地,所述第一计算单元具体用于采用LDA模型生成与待分组专利集合中每个专利分别对应的主题特征向量,根据所述主题特征向量和余弦相似性算法生成待分组专利集合中每个专利与其他专利间的文本相似度。

可选地,该平台还包括训练模块,所述训练模块包括:

获取单元,用于获取多个专利组合样本,所述专利组合样本包括技术关联专利组合样本和产品关联专利组合样本;

第二计算单元,用于计算每个所述专利组合样本的网络相关性密度和互补性指标;

第二生成单元,根据多个所述专利组合样本的网络相关性密度和互补性指标生成密度阈值和互补性指标范围,所述互补性指标范围包括技术关联专利组合的互补性指标范围和产品关联专利组合的互补性指标范围。

可选地,所述第二生成单元具体用于对多个所述专利组合样本的网络相关性密度取平均值或取最小值以生成密度阈值,根据技术关联专利组合样本的互补性指标生成技术关联专利组合的互补性指标范围,根据产品关联专利组合样本的互补性指标生成产品关联专利组合的互补性指标范围;

所述第一生成单元具体用于当判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的技术关联专利组合的互补性指标范围内时,根据所述专利子集生成技术关联专利组合,当判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的产品关联专利组合的互补性指标范围内时,根据所述专利子集生成产品关联专利组合。

本发明具有以下有益效果:

本发明提供的专利组合生成方法,根据文本相似度对待分组专利集进行分组并生成多个专利子集,当判断出专利子集的网络相关性密度大于预设密度阈值且专利子集的互补性指标位于预设的互补性指标范围内时,根据所述专利子集生成专利组合,能够以非人工的方式挖掘专利技术之间的深层次关联关系并生成专利组合,从而提升专利组合的识别效率及企业专利的专利转移和转化率。

参照后文的说明和附图,详细公开了本发明的特定实施方式,指明了本发明的原理可以被采用的方式。应该理解,本发明的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内,本发明的实施方式包括许多改变、修改和等同。

针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。

应该强调,术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在,但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。

图1是本发明实施例一提供的一种专利组合生成方法的流程示意图;

图2是本发明实施例二提供的一种专利组合生成方法的流程示意图;

图3为本发明实施例二提供的一种专利组合生成方法的示例流程示意图;

图4是本发明实施例三提供的一种专利组合生成平台的结构示意图;

图5是本发明实施例四提供的一种专利组合生成平台的结构示意图。

为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图对本发明中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

本实施例中所述的专利组合是指处于同一权利人控制下的相关专利的集合,专利组合的重要特征为技术关联性。专利组合包括:基于技术相似性的技术关联专利组合,技术关联专利组合可以形成专利壁垒,技术关联专利组合内各专利技术之间的相似性程度较高,互补性较低;基于同一产品不同技术的组合的产品关联专利组合,产品关联专利组合内各专利技术的互补性较高。在企业专利的专利技术转移和转化中,以上两种专利组合均具有重要的价值,通过将具有相似技术或互补技术的多种技术方案进行打包形成专利组合,一方面可以盘活专利存量,另一方面能够提高专利技术的整体价值和转移转化率。

技术关联专利组合和产品关联专利组合的技术互补性存在较大差异,技术关联专利组合中的各专利围绕相似的技术展开,其在专利分类或专利引证关系上表现出较强的集中趋势和继承性,因而技术关联专利组合中各专利的互补性较小;产品关联专利组合中各专利间的互补性相对较大,产品关联专利组合内的各专利有可能分布于不同的专利分类中或各专利技术之间的引证关系(如引文耦合)并不密切。

实施例一

图1是本发明实施例一提供的一种专利组合生成方法的流程示意图,如图1所示,该方法包括:

步骤101、计算待分组专利集合中每个专利与其他专利间的文本相似度。

步骤102、根据所述文本相似度对所述待分组专利集进行分组并生成多个专利子集,每个专利子集包括多个专利。

步骤103、计算每个所述专利子集的网络相关性密度和互补性指标。

步骤104、判断所述专利子集的网络相关性密度是否大于预设密度阈值且所述专利子集的互补性指标是否位于预设的互补性指标范围内,若是,执行步骤105;若否,流程结束。

步骤105、根据所述专利子集生成专利组合,所述专利组合为技术关联专利组合或产品关联专利组合。

本实施例提供的专利组合生成方法,根据文本相似度对待分组专利集进行分组并生成多个专利子集,当判断出专利子集的网络相关性密度大于预设密度阈值且专利子集的互补性指标位于预设的互补性指标范围内时,根据所述专利子集生成专利组合,能够以非人工的方式挖掘专利技术之间的深层次关联关系并生成专利组合,从而提升专利组合的识别效率及企业专利的专利转移和转化率。

实施例二

图2是本发明实施例二提供的一种专利组合生成方法的流程示意图,如图2所示,该方法包括以下步骤:

步骤201、获取多个专利组合样本,所述专利组合样本包括技术关联专利组合样本和产品关联专利组合样本。

优选地,本实施例中的各步骤由专利组合生成平台生成。

专利组合样本为经本领域技术专家认可的专利组合,专利组合样本中包括多个专利。如:专利组合样本可以为A企业在技术领域T内的若干专利PP1、PP2、…PPn。

步骤202、计算每个所述专利组合样本的网络相关性密度和互补性指标。

专利组合样本的网络相关性密度用于表示专利组合样本中专利间的相似度。专利组合样本内的各专利相互关联,其专利文本内容呈现一定的相似度。如:专利组合样本内的多个专利的技术内容、功效内容和用途内容相似或相同,或部分专利中包括二次标引内容(如德温特数据库的USE字段)。

具体地,首先采用LDA主题模型(Latent Dirichlet Allocation,文档主题生成模型)生成与专利组合样本中每个专利分别对应的主题特征向量,再根据专利组合样本内所有专利的主题特征向量和余弦相似性算法生成专利组合样本中每个专利与其他专利间的文本相似度。最后,通过公式计算专利组合样本的网络相关性密度,其中,D为专利组合样本的网络相关性密度,Rij为该专利组合样本内专利i和专利j间的文本相似度,N为该专利组合样本所包括的专利总数目。主题特征向量用于构建文本相关性网络,文本相似度和网络相关性密度基于文本相关性网络和社会网络理论生成,网络相关性密度表示专利组合样本中专利间文本相似度之和与最大文本相似度之和的比值。

可选地,采用Python的Gensim开源工具包生成与专利组合样本中每个专利分别对应的主题特征向量:从每个专利中提取出8个主题并采用Gibbs抽样算法对专利组合样本中的全部专利进行参数估计,经过1500次迭代后求解出整个专利组合样本的主题-特征词概率分布情况,以最终生成每个专利对应主题特征向量。将专利表示为主题特征向量的方式,能够在实现专利大幅降维的同时保证专利组合生成的准确率。

本实施例选取网络相关性密度以表征专利组合样本内专利间的技术相关性,其遵循了整体性原则、适用性原则和简易性原则,网络相关性密度能够更加直观地反映专利组合样本内各专利间的技术相关性特征。

专利组合样本的互补性指标用于表示专利组合样本中专利间的技术差异度。专利组合样本的互补性指标根据交叉性指标、聚合性指标和差异性指标生成。交叉性指标、聚合性指标和差异性指标分别采用共类分析法、社会网络分析法和引文分析法生成。

所述交叉性指标通过公式计算得出,其中,RS为专利组合样本的交叉性指标,pi为专利类别i在该专利组合样本的所有专利类别中的概率分布值,pj为专利类别j在该专利组合样本的所有专利类别中的概率分布值,dij为专利组合样本中不同专利类别间的距离值,dij采用余弦相似度算法生成,α与β为计量参数。交叉性指标中的各参数具体通过专利组合样本构建的文本相关性网络生成。

具体地,专利组合样本中的专利可能具有多个专利分类号,不同的专利分类号即对应不同的专利类别,专利组合样本的所有专利类别为其所包括的所有专利具有的所有不同专利分类号的总个数。交叉性指标为一种综合性的测度指标,其能够用于衡量专利组合样本内各专利的分布特点、专利类别间的距离和差异性。本实施例中,可选地,将专利组合样本中的所有专利表示为类别向量的形式以统计生成pi和pj,具体生成的专利类别统计表格可如下表一所示:

表一

某专利组合样本 C1 C2 … CN Z1 1 0 … 0 Z2 1 1 … 0 … … … … 1 ZM 0 1 … 0

其中,其中Ci为专利组合样本中的第i个专利类别,Zj为专利组合样本中的第j件专利,1表示该专利属于某一专利类别,0表示该专利不属于某一专利类别。

聚合性指标通过公式计算得出,其中,CC为专利组合样本的聚合性指标,0≤CC≤1,NΔ为专利组合样本中三元闭包的数量,N3为专利组合样本中连通三元组的数量。具体地,专利组合样本中的三元闭包是指该专利组合样本所构建的文本相关性网络中的三元闭包,每个三元闭包可视为三个不同的连通三元组。聚合性指标通过计量文本相关性网络中三元闭包的数量来描述专利组合样本中各专利的聚合性特征。聚合性指标中NΔ的因数为3可以保证0≤CC≤1。

差异性指标通过公式计算得出,其中,S为专利组合样本的差异性指标,N为专利组合样本所包含的专利总数目,Rij为专利组合样本中专利i和专利j之间的共被引强度,Cij为专利组合样本中专利i和专利j之间的共被引频次,Ci为专利i的总被引频次,Cj为专利j的总被引频次。共被引频次越大,表示专利间的引证关系越紧密。差异性指标为与相似度具有相反属性的指标,差异性指标越大表示专利组合样本内专利之间的相似度越大且差异性越小,差异性指标越小表示专利组合样本内专利之间的相似度越小且差异性越大。

步骤203、根据多个所述专利组合样本的网络相关性密度和互补性指标生成密度阈值和互补性指标范围,所述互补性指标范围包括技术关联专利组合的互补性指标范围和产品关联专利组合的互补性指标范围。

具体地,步骤203包括:对多个所述专利组合样本的网络相关性密度取平均值或取最小值以生成密度阈值;根据技术关联专利组合样本的互补性指标生成技术关联专利组合的互补性指标范围;根据产品关联专利组合样本的互补性指标生成产品关联专利组合的互补性指标范围。

步骤201-步骤203用于实现对专利组合样本的训练,以建立专利组合生成模型。本实施例中,专利组合生成模型可以理解为根据密度阈值和互补性指标范围预测出专利组合。可选地,专利组合生成模型还可进行测试,也即对密度阈值和互补性指标范围进行测试并根据测试结果进行调整,以获得最优的密度阈值和互补性指标范围。如:专利组合生成模型的测试样本可以为A企业在技术领域T内的除上述专利组合样本中专利外的其他若干专利。

密度阈值和互补性指标范围用于从待分组专利集合中生成专利组合,其可根据待分组专利的实际情况进行设定。互补性指标范围包括技术关联专利组合的互补性指标范围和产品关联专利组合的互补性指标范围。互补性指标范围根据多个专利组合样本加权后的交叉性指标、聚合性指标和差异性指标生成,本实施例采用变异系数加权的方式确定各指标的权重,权重的大小可用于表示对应指标在区分技术关联专利组合和产品关联专利组合时的影响力。对技术关联专利组合样本的交叉性指标、聚合性指标和差异性指标采取加权后确定出技术关联专利组合的互补性指标范围,对产品关联专利组合样本的交叉性指标、聚合性指标和差异性指标采取加权后确定出产品关联专利组合的互补性指标范围。

可选地,交叉性指标、聚合性指标和差异性指标的权重生成方式包括:首先通过公式计算得出各指标的变异系数vi,其中,Si为第i个指标的标准差,为第i个指标在所有专利组合样本中的平均值。再通过公式对指标的变异系数进行归一化处理以生成各指标的权重wi。

步骤204、计算待分组专利集合中每个专利与其他专利间的文本相似度。

待分组专利集合中包括多个专利,本实施例的该方法具体用于从待分组专利集合中生成一个或多个专利组合。如:待分组专利集合为A企业在技术领域T内的除上述专利组合样本中专利外的其他所有专利。

步骤204具体包括以下步骤:采用LDA模型生成与待分组专利集合中每个专利分别对应的主题特征向量。根据所述主题特征向量和余弦相似性算法生成待分组专利集合中每个专利与其他专利间的文本相似度。

步骤204的具体方法过程可参见步骤202中专利组合样本中专利间的文本相似度生成方式描述,此处不再赘述。

步骤205、根据所述文本相似度对所述待分组专利集进行分组并生成多个专利子集,每个专利子集包括多个专利。

具体地,将文本相似度接近的多个专利划分生成为一个专利子集。专利子集内的多个专利属于同一专利子类。

步骤206、计算每个所述专利子集的网络相关性密度和互补性指标。

步骤206中专利子集的网络相关性密度和互补性指标生成方式可参见步骤202中专利组合样本的网络相关性密度和互补性指标生成方式描述,此处不再赘述。

步骤207、判断所述专利子集的网络相关性密度是否大于预设密度阈值,若是,执行步骤208;若否,流程结束。

专利子集的网络相关性密度大于预设密度阈值,表示该专利子集内各专利的相似度较大,其可作为专利组合的候选。

步骤208、判断所述专利子集的互补性指标是否位于预设的技术关联专利组合的互补性指标范围内,若是,执行步骤209;若否,执行步骤210。

步骤209、根据所述专利子集生成技术关联专利组合,流程结束。

步骤210、判断所述专利子集的互补性指标是否位于预设的产品关联专利组合的互补性指标范围内,若是,执行步骤211;流程结束。

步骤211、根据所述专利子集生成产品关联专利组合,流程结束。

产品关联专利组合的互补性指标多大于技术关联专利组合的互补性指标。

以下具体举例说明下本实施例的专利组合生成方法:

在专利数据库中检索得出A机构在T领域的全部5452篇在华专利,经该技术领域专家对以上专利内容进行人工判读,得到该企业的14个专利组合作为本实施例中所述的专利组合样本。分别计算14个专利组合样本的网络相关性密度和互补性指标,根据14个专利组合样本的网络相关性密度和互补性指标得出:密度阈值为0.6,技术关联专利组合的互补性指标范围为0.15

本实施例的提供的专利组合生成方法,根据文本相似度对待分组专利集进行分组并生成多个专利子集,当判断出专利子集的网络相关性密度大于预设密度阈值且专利子集的互补性指标位于预设的互补性指标范围内时,根据所述专利子集生成专利组合,能够以非人工的方式及计算机辅助的方式挖掘专利技术之间的深层次关联关系并生成专利组合,从而提升企业专利的专利组合识别效率,及企业专利的专利转移和转化率,同时能够有效节约人力成本。

应当注意,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。

实施例三

图4是本发明实施例三提供的一种专利组合生成平台的结构示意图,如图4所示,该平台包括预测模块1,所述预测模块1包括第一计算单元11、判断单元12和第一生成单元13。

第一计算单元11用于计算待分组专利集合中每个专利与其他专利间的文本相似度,计算每个所述专利子集的网络相关性密度和互补性指标。判断单元12用于判断所述专利子集的网络相关性密度是否大于预设密度阈值且所述专利子集的互补性指标是否位于预设的互补性指标范围内。第一生成单元13用于根据所述文本相似度对所述待分组专利集进行分组并生成多个专利子集,每个专利子集包括多个专利,当判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的互补性指标范围内时,根据所述专利子集生成专利组合,所述专利组合为技术关联专利组合或产品关联专利组合。

本实施例三提供的专利组合生成平台可用于实现上述实施例一提供的专利组合生成方法。

本实施例提供的专利组合生成平台,预测模块的第一生成单元用于根据文本相似度对待分组专利集进行分组并生成多个专利子集,当判断出专利子集的网络相关性密度大于预设密度阈值且专利子集的互补性指标位于预设的互补性指标范围内时,根据所述专利子集生成专利组合,能够以非人工的方式挖掘专利技术之间的深层次关联关系并生成专利组合,从而提升专利组合的识别效率及企业专利的专利转移和转化率。

实施例四

图5是本发明实施例四提供的一种专利组合生成平台的结构示意图,如图5所示,该平台包括预测模块1,所述预测模块1包括第一计算单元11、判断单元12和第一生成单元13。

第一计算单元11用于计算待分组专利集合中每个专利与其他专利间的文本相似度,计算每个所述专利子集的网络相关性密度和互补性指标。判断单元12用于判断所述专利子集的网络相关性密度是否大于预设密度阈值且所述专利子集的互补性指标是否位于预设的互补性指标范围内。第一生成单元13用于根据所述文本相似度对所述待分组专利集进行分组并生成多个专利子集,每个专利子集包括多个专利,当判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的互补性指标范围内时,根据所述专利子集生成专利组合,所述专利组合为技术关联专利组合或产品关联专利组合。

进一步地,所述第一计算单元11具体用于采用LDA模型生成与待分组专利集合中每个专利分别对应的主题特征向量,根据所述主题特征向量和余弦相似性算法生成待分组专利集合中每个专利与其他专利间的文本相似度。

进一步地,该平台还包括训练模块2,所述训练模块2包括:获取单元21、第二计算单元22和第二生成单元23。

获取单元21用于获取多个专利组合样本,所述专利组合样本包括技术关联专利组合样本和产品关联专利组合样本。第二计算单元22用于计算每个所述专利组合样本的网络相关性密度和互补性指标。第二生成单元23根据多个所述专利组合样本的网络相关性密度和互补性指标生成密度阈值和互补性指标范围,所述互补性指标范围包括技术关联专利组合的互补性指标范围和产品关联专利组合的互补性指标范围。

进一步地,所述第二生成单元23具体用于对多个所述专利组合样本的网络相关性密度取平均值或取最小值以生成密度阈值,根据技术关联专利组合样本的互补性指标生成技术关联专利组合的互补性指标范围,根据产品关联专利组合样本的互补性指标生成产品关联专利组合的互补性指标范围。所述第一生成单元13具体用于当判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的技术关联专利组合的互补性指标范围内时,根据所述专利子集生成技术关联专利组合,当判断出所述专利子集的网络相关性密度大于预设密度阈值且所述专利子集的互补性指标位于预设的产品关联专利组合的互补性指标范围内时,根据所述专利子集生成产品关联专利组合。

本实施例四提供的专利组合生成平台可用于实现上述实施例二提供的专利组合生成方法。

本实施例提供的专利组合生成平台,预测模块的第一生成单元用于根据文本相似度对待分组专利集进行分组并生成多个专利子集,当判断出专利子集的网络相关性密度大于预设密度阈值且专利子集的互补性指标位于预设的互补性指标范围内时,根据所述专利子集生成专利组合,能够以非人工的方式挖掘专利技术之间的深层次关联关系并生成专利组合,从而提升专利组合的识别效率及企业专利的专利转移和转化率。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,本说明书内容不应理解为对本发明的限制。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。

本文发布于:2024-09-23 11:11:35,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/67928.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议