情报杂志
JOURNAL OF INTELLIGENCE
第40卷第2期2021 年 2 月
Vol. 40 No. 2Feb. 2021
构建及实证研究
杨大飞1,2杨武3田雪姣4张小红1,2
(1.北京石油化工学院经济管理学院北京102617;
2.北京石油化工学院企业发展研究中心北京102617;
3.北京科技大学经济管理学院北京100083;
4.北京联合大学应用科技学院北京100012)
摘要:[目的/意义]掌握核心技术可以为经济高质量发展提供有力支撑,如何利用专利数据识别核心技术是值得
关注的问题。[方法/过程]构建核心技术“三力”模型,构建核心技术识别指标体系和识别模型,利用最优组合赋权 法确定权重,划分核心技术区间,基于OLED 平板显示产业1997-2016年世界专利数据进行实证研究。[结果/结
论]识别得到11项核心专利,均集中在材料制备、元件制造、驱动电路设计三个产业链上游领域。研究结果符合目 前技术国际分布格局,说明提出的核心技术识别模型具有科学性和实用性,能够准确识别产业核心技术。
关键词:专利数据;核心技术;识别模型;OLED 平板显示产业中图分类号:G353.1
文献标识码:A 文章编号:1002-1965 (2021)02-0047-08
引用格式:杨大飞,杨武,田雪姣.基于专利数据的核心技术识别模型构建及实证研究[J ].情报杂志,2021,40(2): 47-54.
DOI:10. 3969/j. issn. 1002-1965.2021.02.008
Research on Construction and Empirical Study of Core Technology
Identification Model Based on Patent Data
Yang Dafei 1,2
Yang Wu 3 Tian Xuejiao 4
Zhang Xiaohong 1,2
(1. School of Economics and Management ,Beijing Institute of Petrochemical Technology ,Beijing 102617 ;
2. Enterprise Development Research Center ,Beijing Institute of Petrochemical Technology ,Beijing 102617;
3. School of Economics and Management ,University of Science and Technology Beijing ,Beijing 100083 ;
4. School of Applied Science and Technology ,Beijing Union University ,Beijing 100012)
Abstract : [ Purpose/Significance ] Mastering core technology can provide strong support for high-quality economic development. How to
use patent data to identify core technology is a problem worthy of attention. [ Method/Process ] This paper constructed the three - force model of core technology ,core technology identification index system ,and core technology identification model ,determined the weight u sing the optimal combination weighting method ,divided the core technology interval ,and did an empirical research based on world patent data of OLED panel display industry from 1997 to 2016. [ Result/Conclusion ] 11 core patents have been identified ,all of which are fo
cused on the preparation of materials ,component manufacturing and driving circuit design. The results are in line with the current interna tional distribution pattern of technology ,and indicates that the model is scientific and operable and can accurately identify industrial core
technology.
Key words :patent data ;core technology ;identification model ;OLED flat panel display industry
收稿日期:2020-09-21 修回日期:2020-12-09
作者简介:杨大飞(ORCID : 0000-0002-5890-5430),男,1986年生,博士,讲师,研究方向:技术创新管理;杨 武(ORCID :0000-0003-3524
-9183),男,1961年生,博士,教授,博士生导师,研究方向:技术创新管理;田雪姣(ORCID : 0000-0002-5090-1160),女,1990年生,博士,讲 师,研究方向:创新与创业管理、知识产权管理;张小红(ORCID :0000-0001-9059-2545),男,1970年生,博士,教授,硕士生导师,研究方向: 信息管理、知识管理。
-48-情报杂志第40卷
核心技术是在某一技术领域中处于关键地位、对技术发展具有突出贡献、对其他技术具有重大影响和重要经济价值的一类技术[1]0掌握核心技术对于推动经济高质量发展和保障国家安全具有重要意义。专利是技术的重要产出形式,90%~95%的发明能在专利文献中查到,并且许多发明只能在专利文献中查到[2]0在海量专利中,能对技术体系发展起到关键作用的核心技术数量极少,如何有效识别核心技术是掌握核心技术的首要问题,因此基于专利数据准确识别核心技术有助于掌握技术发展规律和发展趋势,对合理配置创新资源,破解国外技术锁定,获得国际竞争优势具有重要意义。
1文献回顾
1.1核心技术定义的研究国外学者没有明确给出核心技术的定义,但是通过开展对专利质量和专利价值的评估,识别和评价高质量[3]和高经济价值专利[4-5]0
国内学者从不同角度对核心技术进行定义,首先,核心技术具有“技术上的核心”,核心技术具有首创性,对技术发展具有突出贡献[1];其次,核心技术具有“经济上的核心”,具有巨大的经济价值[6];再次,核心技术具有“地位上的核心”。核心技术在技术领域中处于关键地位,具有不可替代性[7]0
1.2核心技术识别方法研究
1.2.1基于专家经验识别法利用专家丰富经验和业务能力识别核心技术是最为传统的方法。梁军认为,对于重要专利的筛选应该由相应技术领域的专家对专利技术进行逐一阅读后作出判断[8]0这类方法适用于专利技术较少的领域,准确率较高。但是对具有海量专利的技术领域无法实施,并且会受个人主观经验影响而存在偏差。
1-2.2单一指标识别法
a.基于专利被引频次的识别。专利被引频次是识别核心专利的有效指标,一件专利被后续专利引用的次数越多,说明该专利的质量越高,对后续专利的影响越大。自Trajtenberg得出专利被引指标可以有
效反映专利经济价值后[9],很多学者利用该指标对专利质量和经济价值进行评估和对核心技术进行识别。Yong-GilL认为,专利被引频次影响专利的技术价值并且体现经济价值[10]0国内学者中,栾春娟等通过专利引文分析方法识别世界航空航天领域核心技术[11]0孙涛涛利用专利文献耦合和专利引证关系识别DVD激光头技术中的关键技术[12]0栾春娟等采用专利引证指标识别出了全球学术机构的核心专利[13]0
b.基于同族专利数量的识别。同族专利数量可以在一定程度上反映技术重要性,同族专利数量越多,专利价值越高,从而成为核心专利的可能性越大。Har-hoff D.等指出同族专利指标可以有效评价专利价值[14]0Criscuolo P.指出三方专利簇是有效评价高价值专利的计量指标[15]0尤其是Deng的研究表明,具有欧洲专利族的专利质量和经济价值较高[16]0Schettino等通过研究也得到同族专利数量可以有效反映技术的重要性的结论[17]0因此,部分学者利用同族专利数量指标识别核心专利,如,Su等、罗立国和林文广分别利用同族专利数量构建专利家族优先权网络来寻求关键专利[18-19]0
c.基于专利权利要求数量指标识别0专利法律制度对专利的保护是基于专利权利要求内容确定保护范围,因此,专利权利要求越多,保护范围就越大,专利经济价值就越高,成为核心专利的可能性越大。Tong研究表明,专利权利要求数量越多,专利技术价值越高[20]0Miyazawa T和Osada H认为,专利权利要求对应的从属权利要求数量较多,可以从多个层次保护领先技术,打击竞争对手[21
],另外,Pottelsberghe Van和Franois D的研究表明权利要求多的专利,经济成本高,因此专利具有较高的市场价值[22]0Saiki T.实证研究日本制药公司中,所申请的专利权利要求保护范围越广,技术越领先,同时具有较强的技术竞争力[23]0部分学者利用同族专利数量指标评价专利质量,如Lanjouw J.O.等通过专利权利要求数评价专利质量[24]0
1.2.3指标体系识别法随着研究的深入,学者发现单一指标具有一定的片面性,无法准确识别核心专利,应该构建综合性指标体系对核心专利进行全面识别0
诸多学者基于不同视角构建指标体系,如,韩志华构建核心专利识别指标体系,其中包括技术规模、专利质量和专利商用化三个维度[1]0张娴等构建了包含专利技术、市场和法律特征的三级指标体系评价专利质量,通过德尔菲法对三级指标进行赋权,利用组决策运算得到各专利分值排序,进而确定核心专利[25]0霍翠婷在专利的技术、经济和法律特征基础上增加了企业内外部环境评估因素,构建了包含四个维度的核心专利识别指标体系,计算指标得分结果来识别核心专利[26]0罗天雨直接在专利技术、商业和法律特征中选取具体指标进行判定,利用专家打分法进行赋权,并识别出核心技术[7]0
1.2.4专利共类分析法专利共被引分析是以不同专利共同被其他专利引用的次数作为基础,利用因子分析、聚类分析和多维尺度分析等统计分析方法,将专利按照相似性进行分类,利用数据可视化技术进
第2期杨大飞,等:基于专利数据的核心技术识别模型构建及实证研究•49・
行直观显示[27]0诸多学者利用专利共被引分析对特定领域技术演进和核心技术进行分析。如李姝影等探讨基于引文网络的核心专利集筛选策略对技术主题识别所产生的影响:28:0王健美等:29:、刘云等:27:分别基于专利引文对电动汽车关键技术演进和核心技术领域进行分析。李伟和刘红光[30]、黄鲁成等[31]、杨中楷和刘佳[32]分别基于专利引证分析方法对国外混合动力汽车、太阳能电池技术、太阳能光伏技术轨道演进进行研究。黄晓斌和梁辰基于专利引用网络对4G通信技术竞争态势进行研究[33]。李蓓和陈向东基于专利引文网络方法,识别出大陆当前核心技术及重要新兴技术领域,并与台湾的分析结果进行对比[34]。
黎欢和彭爱东对基于专利引文分析的关键路径方法、岛方法和高被引三种方法进行比较研究,得到这三种方法在挖掘关键技术中的作用和局限性[35]。
部分学者,如侯剑华和范二宝基于专利家族分析视角对核心技术演进路径进行分析[36],袁润和钱过利用专利地图和文本聚类图,结合专利引文分析、专利族大小分析、专利权利要求数量分析、专利诉讼,构建了核心专利识别框架图,对风能产业核心专利和核心技术领域进行了识别:37:0
网络分析方法适用简单且说服力强,很多学者将社会网络中的中心性指标和专利数据结合测度特定产业技术领域中的核心技术[38],张杰等将“m-核”分析方法引入技术领域共现网络分析中,筛选出技
术领域共现网络中拥有强连接的若干节点,以此确定核心技术[39]。
上述研究成果对本文具有借鉴意义,但仍然存在进一步研究的必要。单一指标识别法容易受指标片面性影响而使结果产生偏差,如专利被引频次不适合分析近1〜2年授权的专利,专利权利要求数量会因为专利申请者基于对自身利益的保护而使得数值比真实值偏大,同族专利数量指标容易受到专利审核授权时间滞后的影响。专利共类分析法主要利用专利共被引和共现词两项信息,对其他专利信息利用不足。
当前利用指标体系识别核心技术的全面性和准确性尚有不足。首先,目前对指标赋权仅采用单一主观赋权或客观赋权法,客观赋权法会受到各指标数据特征差异较大的影响,造成低估指标实际重要性。单一主观赋权法会忽视专利信息数据自身规律,并且容易受个人主观经验的影响而产生偏差。因此,应该将主客观赋权法相结合,减少单一方法的不足。
其次,当前对核心技术法律属性的指标集中在专利诉讼、专利转让和专利授权状况,这些指标不能准确反映核心技术“地位上的核心”特性,尤其是无法反映核心技术对于整个技术体系和后续技术发展方向的引导和控制作用。
最后,选取的部分指标在实用性上略有不足,并且个别指标,如专利类型、专利寿命、专利合作申请人数量等无法准确反映专利的核心特性。
因此,本文基于核心技术的性质,构建包含“创新力-发展力-控制力”的核心技术三力模型,全面准确地选择各类指标构建核心技术识别指标体系,采用最优组合赋权法对指标进行赋权,减少单一方法的不足,构建核心技术识别模型,建立核心技术划分区间,以OLED平板显示产业技术为实证对象进行研究,识别出该产业的核心技术,为决策者提供技术研发重点和制定技术发展策略提供一定的依据。
2研究设计
本文对核心技术进行识别的基本思路是构建核心技术“三力”模型,构建核心技术识别指标体系,利用最优组合赋权法对指标进行赋权,并且构建核心技术强度衡量专利重要程度,对专利进行分类,筛选出核心专利。
2.1核心技术识别“三力模型冶的构建目前对核心技术识别的研究主要集中于技术核心和经济核心两个属性视角,但是核心技术作为技术体系中具有重要影响的一类技术,还具有地位核心属性。即核心技术具有“技术-经济-控制”三维属性。
核心技术的技术性表现为核心技术具有高质量的创新性,包含重大的科学发现,对技术发展具有突出贡献。核心技术的经济性表现为核心技术具有巨大的经济价值,可以显著提高产品质量水平,促进产品的更新换代,有效推动专利权人和产业经济的发展。核心技术控制性表现为当核心技术形成专利后,专利持有人获得了独占产权和垄断空间,核心技术在技术轨道中占据重要位置,后续技术无法绕
过核心技术而独立发展,在申请专利时必须将核心技术权利要求嵌入其中,因此核心技术就取得控制地位,控制后续技术的发展,并且专利持有人在不同国家申请专利形成垄断范围,抢占其他国家的技术发展轨道和压缩技术发展的空间,提前占据技术发展路径,以此对其他国家技术发展进行控制。
因此,本文基于核心
技术的三个“核心”属
性,构建包含核心技术创
新力、发展力、控制力的
核心技术识别“三力”模
型(见图1)。
2.1.1核心技术创图1核心技术“三力”模型关系新力核心技术创新力表现为核心技术的高质量特
•50•情报杂志第40卷
性,核心技术具有高度原创性,具备原理设计科学优化、实施过程巧妙新颖,技术范围涵盖广泛等优点[40],并且包含理论基础的重要突破和最新科技成果,对整个技术体系发展具有重要影响。
2.1.2核心技术控制力核心技术控制力表现为对产业技术体系发展方向的纵向控制和对其他国家发展类似技术的横向控制。核心技术对整个技术体系发展方向具有引领作用,后续技术无法绕开核心技术而独立发展,因此对后续技术发展具有重要控制作用;同时,核心技术持有人在其他国家申请专利后形成垄断范围,压缩其他国家技术发展空间,维护自身垄断空间,因此对其他国家发展类似技术具有横向控制作用。
2.1.3核心技术发展力核心技术发展力表现为核心技术具有较高的经济价值,能够有效提高企业效益和促进经济发展。这种高经济价值表现为垄断价值。法律制度对专利文本中的权利要求进行保护,专利受保护范围形成了专利垄断范围,核心技术高质量特性决定了专利受保护范围更为宽广,因此具有较高的垄断收益。
由此可以看出,三者具有密切关系,核心技术创新力是基础,核心技术控制力是保障,核心技术发展力是根本目的。核心技术创新力推动着核心技术控制力发展,核心技术控制力又推动产业技术发展力发展,而核心技术发展力反作用于核心技术创新力发展,三者形
表1成良性发展趋势。
2.2核心技术识别指标体系构建本文基于核心技术“三力”模型构建核心技术识别指标体系。
在产业技术创新力中,专利被引频次虽然能够反映专利质量,但是容易受专利年限的影响,因此本文选择专利年平均被引用频次。其次,科技论文代表了最新的科技成果,引用科技论文数量多的专利质量较高,科学关联性指标表征了专利技术与前沿科学研究关系的紧密程度,因此可以有效反映技术创新性。
在产业技术控制力中,专利引证指数反映了专利对后续技术发展的控制力和影响力,专利被后续专利引用频次越高,说明对后续专利的影响越强。同族专利数量表示一项技术在不同国家申请专利的数量,反映了对于其他国家技术发展的控制能力。
在产业技术发展力中,技术覆盖范围表示一项专利在技术领域应用的范围,应用范围决定了专利的受保护范围,进而决定专利的经济价值,核心技术的应用范围较为广泛,因此经济价值较高。其次,专利制度通过专利权利要求对专利进行保护,因此,专利权利要求数量可以有效反映专利的垄断范围和经济价值。
本文根据以上分析结果并借鉴诸多学者[41-42]的研究成果,兼顾科学性和数据可获得性,构建核心技术识别指标体系,具体见表1。
核心技术识别指标体系一级指标二级指标三级指标
核心技术创新力
专利年平均被引用频次(A1)
心科学关联性(A2)
技
术评价指
专利被引指数(A3)核心技术控制力
同族专利数量(A4)
标
体技术覆盖范围(A5)
系核心技术发展力
专利权利要求数量(A6)
含义
专利平均每年被后续专利引用频次越高,说明专利技术创新性越强
专利引用科学类论文的数量越多,专利技术创新性越强
专利被后续专利引用频次越高,说明专利对后续技术发展控制能力越强
同族专利数量越多,说明专利对其他国家技术发展控制能力越强
技术覆盖范围越大,专利经济价值越高
权利要求数量越多,说明技术保护范围越大,专利的经济价值越高
度之比r的理想赋值,则第k个指标的G.法权重为:”*=(1+移
n r j)'(1)
d.由权重”k得到第k-1,…3,2个指标的权重为:
”.-1=們(j=k,k-】,…3,2)(2)
2.3基于最优组合赋权法的指标权重的确定本文采用最优组合赋权法确定指标权重,将主观赋权和客观赋权相结合,减少单一赋权法产生的不足。
2.3.1指标的规范化处理为避免统计量纲的
差异对结果造成影响,先将原始数据进行标准化处理,本文选择使用级差标准化法,过程不再赘述。
2.3.2单一评价方法赋权
第一种,G1法。
G.法通过专家依据主观判断对指标依据重要程度排序,重要指标赋予较大权重。
a.确定评价指标的序关系;
b.专家给出相邻评价指标-1与重要性程度之比r.的理想赋值;
c.若专家给出相邻评价指标x-1与x重要性程
第二种,G2法。
G2法通过专家依据主观判断对指标依据重要程度排序,重要指标赋予较大权重[43]。
a.通过专家得出最不重要的一个指标x k;
b.确定其余指标X.与X k之比的重要程度值r;
c.确定准则层下第j个指标对该准则层的G2法权重:
w j=/(3)移r.
j=1
第2期杨大飞,等:基于专利数据的核心技术识别模型构建及实证研究•51•
第三种,熵值法。
在熵值法中,如果指标的信息熵越小,该指标提供的信息量越大,在综合评价中所起作用越大,权重就应该越高,因此本研究用熵值法来确定各指标的权重,由于受篇幅限制,具体步骤不再赘述。
第四种,离差最大化法确定权重。
指标离散程度越大,该指标对评价结果的影响越大,则该指标的权重就越大。具体步骤不再赘述。
2.3.3基于多种因素的组合赋权
首先,多种因素组合权重的计算。
分别运用G1法、Q法、熵值法和离差最大化法求权重w c(c=1,2,3,4),组合权重为:
w=移a c w c(4)
式中;为组合系数。
其次,最优组合赋权系数的确定。
①各评价对象加权得分与理想点广义距离最小:
n m n s
移厶二移移移琢c w;(1-钉)(5)
i=1j=1i=1c=1
其中,l i为各评价对象加权得分与理想点的广义距离;w j为第c种赋权方法第j个指标的权重,©为第i个对象第j个指标规范化后的值。
②引入Jaynes最大熵原理反映各赋权结果之间的一致性程度,基于各赋权结果差异最小的思想建立目标函数
max z=-移«c ln琢c
c=1
引入Jaynes最大熵原理充分体现了各赋权结果间的一致性程度,基于各赋权结果一致性最大的原则确定组合权系数,避免出现选取的赋权法对组合赋权结果贡献太小的问题。构建目标函数min兹移££琢c w;(1-X j)+(1-兹)移a c l n a c j=1i=1c=1c=1
<移«c=1,叫逸0
c=1
其中,参数兹为两个目标之间的平衡系数,0臆兹臆1,给出兹=0.5。
构建拉格朗日函数求解组合权系数琢c,得到:
琢c=
exp{-[1+兹移移w;(1-X i7)/(1-兹)]}
----------------------------------------------------------------(6)
S n m
移exp{-[1+兹移移
w;(1―x ij)/(1一兹)]}
C=1i=1j=1
2.4核心技术识别模型构建本文通过构建核心技术强度(Core Technology Intensity,CTI)来反映各个专利的重要程度,即:
CTI i=移w x X j(7)
式中CTI,为专利i的核心技术强度;些为各指标的组合权重;x为规范化的指标值。
2.5核心技术区间划分在得到每个专利的CTI i 后,以CTI i的最大值为基准,将所有专利分为三种类型,CTI i值大于70%CTI i(max)专利为核心专利,大于30%CTI i(max)且小于70%CTI i(max)的为重要
专利,小于30%CTI i(max)值的为普通专利[44],具体分类区间见表2。
表2专利分类区间
3实证分析
核心技术强度专利类型
[70%,100%]核心专利
[30%,70%]重要专利
[0%,30%]普通专利
3.1数据来源及范围本研究的数据来源于大为Innojoy商业专利数据库,作为一款专利情报综合应用平台,大为Innojoy专利库提供方便快捷的全球数据获取通道,高度整合全球专利文献资源,收录来自104个国家和地区的超过1亿篇专利信息,包含题录信息、专利说明书、同族专利、法律状态信息以及代码化全文。专利检索策略由“主题关键词+IPC分类号”组成,关键词包括“OLED”“electroluminescen”“organic light e-mit”“electro luminescen”"organic el”,IPC分类号包括H01L21、H01L27、H01L31、H01L33、H01L51、H05B33、G02F1、G09F9、G09G3、C09K11、
C23C14。检索期限为专利公开日自1997年1月1日至2016年12月31日,共得到相关专利25226件。2017年后的专利由于公布时间短,对技术发展的影响尚未完全体现,因此将检索时间窗口限定在1997-2016年。
3.2数据描述性统计产业专利数量极其庞大,而大多数专利价值极小,为了减少计算量,对专利进行初步筛选,将不具备核心专利条件的专利排除在外。本研究初步选择各指标中排序前100名专利作为研究样本,去除重复专利,共获得了349项专利。首先对样本进行描述性统计分析,具体见表3。
表3变量的描述性统计
变量
专利年
平均被
引用频次
科学
关联性
专利被
引指数
同族专
利数量
技术覆
盖范围
专利权
利要求
数量最小值000010
最大值2471823735755311
算术平均数 6.076710.444144.43557.2350 6.782231.1375标准差15.479022.351771.29087.2465 5.
901637.9801 3.3指标权重的确定专家意见对指标权重的确定具有重要影响,为保证赋权的客观性和准确性,本文在选择专家组时,全面选择从事专利分析、技术评价、