一种基于技术图谱的关键点识别方法[发明专利]

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 202010559077.8
(22)申请日 2020.06.18
(71)申请人 国网上海市电力公司
地址 200122 上海市浦东新区自由贸易试
验区源深路1122号
(72)发明人 华斌 宋平 陆启宇 张琪祁 
赵三珊 
(74)专利代理机构 上海科盛知识产权代理有限
公司 31225
代理人 王怀瑜
(51)Int.Cl.
G06F  16/36(2019.01)
G06Q  10/06(2012.01)
G06Q  50/26(2012.01)
(54)发明名称一种基于技术图谱的关键点识别方法(57)摘要本发明涉及一种基于技术图谱的关键点识别方法,包括:构建技术图谱;对所述技术图谱中的节点数据,进行中心度计算,得到关键节点;采用主成分分析法,对所述的节点数据的多个维度的技术指标进行简化;分析所述的关键节点与技术指标之间
的关系,得到不同维度下的关键节点。与现有技术相比,本发明综合考虑了网络中心度指标和科技资源的文献计量,解决了识别技术图谱中关键节点指标的单一性和脱离实际等缺点,基于复杂网络技术的相关理论,对技术图谱的相关指标进行量化计算,有利于更加准确地识别关键节点,发现技术研究的走向或技术趋势性线索,
为科技创新提供决策支持。权利要求书1页  说明书3页  附图2页CN 111813951 A 2020.10.23
C N  111813951
A
1.一种基于技术图谱的关键点识别方法,其特征在于,包括:
构建技术图谱;
对所述技术图谱中的节点数据,进行中心度计算,得到关键节点;
采用主成分分析法,对所述的节点数据的多个维度的技术指标进行简化;
分析所述的关键节点与技术指标之间的关系,得到不同维度下的关键节点。
2.根据权利要求1所述的一种基于技术图谱的关键点识别方法,其特征在于,所述的技术图谱根据多个网站和数据库的科技成果,采用实体、关系和属性的抽取方法,通过知识融合后构建。
3.根据权利要求2所述的一种基于技术图谱的关键点识别方法,其特征在于,所述的网站和数据库包括同方知网、国研网、自建资源库、研发机构数据、政策法规数据、行业动态数据、专利数据库、行业标准数据库中的至少一个。
4.根据权利要求1所述的一种基于技术图谱的关键点识别方法,其特征在于,所述的中心度包括度中心度、接近中心度和介数中心度。
5.根据权利要求1所述的一种基于技术图谱的关键点识别方法,其特征在于,所述的技术指标的维度包括项目水平维度、人才水平维度、科研成果水平维度。
6.根据权利要求5所述的一种基于技术图谱的关键点识别方法,其特征在于,所述的项目水平维度的技术指标包括项目总数、基金项目类别和科研经费投入。
7.根据权利要求5所述的一种基于技术图谱的关键点识别方法,其特征在于,所述的人才水平维度的技术指标包括人才平均年龄、人才平均学历和人才数量。
8.根据权利要求5所述的一种基于技术图谱的关键点识别方法,其特征在于,所述的科研成果水平维度中,
科研成果包括论文、专利、和其他成果。
9.根据权利要求8所述的一种基于技术图谱的关键点识别方法,其特征在于,所述的论文相关的技术指标包括论文总数、被引总频次、核心期刊论文数、核心期刊被引总频次、基金论文数、基金被引总频次、核心期刊论文占比、核心期刊论文占比、总篇均被引频次、核心期刊篇均被引频次、基金篇均被引频次和H指数,专利相关的技术指标包括专利总数目和发明专利数目,其他成果相关的技术指标包括成果获奖、成果鉴定结果、标准数目、主编或副主编著作。
10.根据权利要求1所述的一种基于技术图谱的关键点识别方法,其特征在于,采用线性回归法分析所述的关键节点与技术指标之间的关系。
权 利 要 求 书1/1页CN 111813951 A
一种基于技术图谱的关键点识别方法
技术领域
[0001]本发明涉及一种数据处理方法,尤其是涉及一种基于技术图谱的关键点识别方法。
背景技术
[0002]在技术图谱网络种,识别出网络中的关键节点,也即关键技术和热点技术,对于科创布局工作的展开有很大的辅助作用。传统的对于网络中的关键节点的讨论常存在于复杂网络的中心化问题和节点重要度评估上,通过实证方法度量网络的统计性质。单一运用上述某种测度指标或方法识别关键节点具有很强的片面性,每种测度指标或方法都只能从某一侧面反映节点在网络中的地位,不符合实际情况。在互联网飞速发展的时代,简单的测度指标组合无法满足现实需求,对识别关键点的准确性提出了更高的要求。
[0003]特别是现在网络的应用更加广泛,网络的应用具有更多的现实意义,单从理论角度的测量度指标不贴合实际,降低了识别关键节点的准确性。
发明内容
[0004]本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于技术图谱的关键点识别方法,解决识别技术图谱中关键节点指标的单一性和脱离实际等问题。[0005]本发明的目的可以通过以下技术方案来实现:
[0006]一种基于技术图谱的关键点识别方法,包括:
[0007]构建技术图谱;
[0008]对所述技术图谱中的节点数据,进行中心度计算,得到关键节点;
[0009]采用主成分分析法,对所述的节点数据的多个维度的技术指标进行简化;[0010]分析所述的关键节点与技术指标之间的关系,得到不同维度下的关键节点。[0011]所述的技术图谱根据多个网站和数据库的科技成果,采用实体、关系和属性的抽取方法,通过知识融合后构建。
[0012]所述的网站和数据库包括同方知网、国研网、自建资源库、研发机构数据、政策法规数据、行业动态数据、专利数据库、行业标准数据库中的至少一个。
[0013]所述的中心度包括度中心度、接近中心度和介数中心度。
[0014]所述的技术指标的维度包括项目水平维度、人才水平维度、科研成果水平维度。[0015]所述的项目水平维度的技术指标包括项目总数、基金项目类别和科研经费投入。[0016]所述的人才水平维度的技术指标包括人才平均年龄、人才平均学历和人才数量。[0017]所述的科研成果水平维度中,科研成果包括论文、专利、和其他成果。
[0018]所述的论文相关的技术指标包括论文总数、被引总频次、核心期刊论文数、核心期刊被引总频次、基金论文数、基金被引总频次、核心期刊论文占比、核心期刊论文占比、总篇均被引频次、核心期刊篇均被引频次、基金篇均被引频次和H指数,专利相关的技术指标包括专利总数目和发明专利数目,其他成果相关的技术指标包括成果获奖、成果鉴定结果、标
准数目、主编或副主编著作。
[0019]采用线性回归法分析所述的关键节点与技术指标之间的关系。
[0020]与现有技术相比,本发明综合考虑了网络中心度指标和科技资源的文献计量,解决了识别技术图谱中关键节点指标的单一性和脱离实际等缺点,基于复杂网络技术的相关理论,对技术图谱的相关指标进行量化计算,有利于更加准确地识别关键节点,发现技术研究的走向或技术趋势性线索,为科技创新提供决策支持。
附图说明
[0021]图1为本实施例基于技术图谱的关键点识别方法流程图;
[0022]图2为本实施例构建的技术图谱;
[0023]图3为本实施例各评价指标的累积贡献率曲线图。
具体实施方式
[0024]下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
[0025]实施例
[0026]如图1所示,一种基于技术图谱的关键点识别方法,包括以下步骤:
[0027]1)构建技术图谱
[0028]从同方知网、国研网、自建资源库、外部专家及研发机构数据,内部项目及科技成果数据,添加政策法规数据、行业动态数据、专利数据及行业标准数据中获取元数据,进行实体、关系和属性的抽取,对抽取的信息进行实体消歧和共指消解,抽取本体,构建技术图谱,如图2所示。
[0029]2)从复杂网络的统计指标角度考虑,基于度中心度、接近中心度、介数中心度等指标的大小来定位关键节点,具备高中介中心性和高频特性的节点,就是本领域内的关键技术,代表着这段时期的研究热点主题;
[0030]度中心度是一个节点与其他节点直接连接的总和。由于技术图谱的连接是有方向的,则可分为点入中心度和点出中心度。结合点入中心度和点出中心度综合考虑,节点的度中心度的计算公式为:其中u是一个节点,n是图中节点的个数,X vu表示节点v与u之间之间是否直接相连。中心度是网络分析中刻画节点中心性的最直接度量指标,它反映了一个节点的凝聚力。一个节点的度中心性越高,该节点在网络中就越重要;
[0031]接近中心度是一个节点到所有其他节点的最短路径距离之和的倒数。它反映网络中某一节点与其他节点之间的接近程度。节点的接近中心度标准化计算公式为:
其中u是一个节点,n是图中节点的个数,d(u,v)是另一个节点v与u
之间最短的路径距离。由于技术图谱的连接是有方向的,则可分为入接近中心度和出接近中心度。入接近中心度反映节点的整合力,出接近中心度反映节点的辐射力;
[0032]介数中心度是经过一个节点的最短路径的数目。即一个结点担任其它任意两个结
点之间最短路径的桥梁的次数。节点介数中心度计算公式为:其中,u
是一个节点,p是节点s和t之间最短路径的总数,p(u)是节点s和t之间通过节点u的最短路径数。一个结点充当“中介”的次数越高,它的介数中心度就越大,它在网络中起到“交通枢纽”的作用。
[0033]3)基于科技资源的文献计量,从科研投入、科研成果两个方面入手;
[0034]科研投入又分为科研项目和人才梯队,科研项目包括项目总数、基金项目和科研经费投入,人才梯队又包括人才平均年龄、人才平均学历和人才数量;
[0035]科研成果包括论文、专利、标准、专著和成果,其中,论文需要考虑的因素是论文总数、被引总频次、核心期刊论文数、核心期刊被引总频次、基金论文数、基金被引总频次、核心期刊论文占比、核心期刊论文占比、总篇均被引频次、核心期刊篇均被引频次、基金篇均被引频次和H指数,专利包括专利总数目和发明专利数目,成果包括成果获奖和成果鉴定,还有标准数目、主编或者副主编著作等;
[0036]4)通过主成分分析将2)和3)中定义的多维度的评估指标转化为相互独立的综合评估指标,消除评估指标间的相关性,简化评估节点关键性的指标数。
[0037]本发明对200项技术在科技资料中的共现关系构建了技术图谱,从网络拓扑结构、项目水平、人才水平和科研成果这几个维度来评估节点的关键性。分别计算每项技术对应的27项评估指标,构成一个200*27的矩阵,对该矩阵进行主成分分析,得到特征根、贡献率和累积贡献率,其累积贡献率如图3所示:
[0038]从图中可以看出,前5个主成分的累计贡献率达到90.79%。因此只选取前5个主成分可以充分代表27个评估指标所含的信息。通过计算前5个主成分对应的原指标权重值矩阵与评估指标矩阵的乘积,可以将评价矩阵约简为200*5。
[0039]5)利用线性回归表达式,以前5个主成分的贡献率作为主成分的权重,可以得到节点关键性的综合数值。基于4)的结果,得到评价节点关键性的综合函数:
[0040]Z=0.3284*y1+0.1531*y2+0.2157*y3+0.1196*y4+0.0911*y5
[0041]通过函数计算,对得到的数值进行排序,可以得到关键节点,在网络以醒目的颜加以标记,便于识别。另外对于研究领域、作者、研究机构等主体构成的网络也可以采用这种方法来识别网络中的关键节点节点。

本文发布于:2024-09-20 15:33:22,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/774175.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:节点   技术   中心   指标   图谱   包括   关键
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议