基于RFM模型和随机行动者导向模型的技术机会识别

情报学报2021年1月第40卷第1期
Journal of the China Society for Scientific and Technical Information,Jan.2021,40(1):53-61
DOI:10.3772/j.issn.1000-0135.2021.01.006
基于RFM模型和随机行动者导向模型的
技术机会识别
张振刚1,2,3,罗泰晔1
tbase
(1.华南理工大学工商管理学院,广州510640;2.广州数字创新研究中心,广州510640;
3.广东省科技革命与技术预见智库,广州510640)
摘要技术机会识别对于研发组织的创新管理具有重要意义,本文以人工智能领域2013—2015年的专利数据为例,提出了一种识别领域内技术机会的新方法。借鉴RFM(recency,frequency,monetary)模型的思路,使用K均值聚类法基于平均出现时间长度、出现频率和组合能力三个指标对知识元素进行聚类,进而发现了能够反映领域内技术发展方向的四个趋势性知识元素。使用随机行动者导向模型对知识
网络的演化进行分析,在此基础上提出了发现知识元素的新技术机会的公式,并使用该公式识别出了趋势性知识元素潜在的技术机会。本研究利用人工智能领域2016—2018年的专利数据验证了所提出的方法的有效性,应用3D打印领域2014—2018年的专利数据验证了所提方法的稳健性。
关键词RFM模型;技术机会识别;聚类;知识网络;随机行动者导向模型
Technology Opportunity Identification Based on RFM Model
and Stochastic Actor-oriented Model
Zhang Zhengang1,2,3and Luo Taiye1
(1.School of Business Administration,South China University of Technology,Guangzhou510640;
2.Guangzhou Digital Innovation Research Center,Guangzhou510640;
3.Science and Technology Revolution and Technology Forecasting Think Tank of Guangdong Province,Guangzhou510640)
Abstract:Technology opportunity identification is very significant to the innovation management of R&D organizations.
Taking the patent data from2013to2015in the field of artificial intelligence as an example,this study proposes a novel method to identify technological opportunities.Using the idea of RFM(recency,frequency,monetary)model,we em‐ployed the K-means algorithm to cluster knowledge elements based on three ,length of the average occur‐rence time,frequency of occurrence,and combination capacity)and yielded four knowledge elements that could reflect the direction of technology development in the field.The stochastic actor-oriented model was used to analyze the evolution of knowledge networks,and a formula was proposed to discover new technology opportunities for knowledge elements.Us‐ing this formula,we predicted the potential technology opportunities for the four yielded knowledge elements.The validity of the proposed method was tested by using the patent data of2016-2018in the field.The robustness of the proposed method was also tested by using the patent data from2014to2018in the field of3D printing.
Key words:RFM model;technology opportunity identification;clustering;knowledge network;stochastic actor-oriented models
收稿日期:2019-11-04;修回日期:2020-03-29
基金项目:国家社科基金重大项目“数据赋能激励制造业企业创新驱动发展及其对策研究”(18ZDA062)。
作者简介:张振刚,男,1963年生,博士,教授,博士生导师,主要研究领域为区域创新系统,技术创新管理;罗泰晔,男,1984年生,博士研究生,主要研究领域为技术创新管理,E-mail:***************。
第40卷情报学报
1引言
技术机会识别,是发现特定技术领域内具有潜在价值的技术应用机会的过程。在科技发展日新月异的背景下,准确识别领域内的技术机会,对于研发组织的可持续发展具有重要的意义。识别技术机会的方法分为定性分析和定量分析两类。在定性分析方法方面,德尔菲法和情景分析法是两种主要的方法[1]。定性分析方法主要依靠专家的意见,存在程序复杂、耗时长、社会成本高、专家意见的差异性不易处理等问题[2]。因此,大多数研究者都采用定量的方法来识别技术机会。在进行定量分析时,专利数据是常用的素材。专利是创新成果的一种表现形式,其本质在于包含在其中的知识,一个专利所含有的知识可以看成是若干知识元素的集合[3-4]。根据知识基础观(knowledge-based view),知识是创新投入和价值创造的主要来源[5]。因此,有学者提出了知识组合理论,其认为创新在本质上是研发或实验中对知识元素进行组合的过程[6-8]。这个过程既包括探索新的知识元素组合,又包括对已有知识元素组合的重用(reuse)[6]。在对知识元素进行组合的过程中,不同的知识元素出现的时间、频
率及组合能力各不相同。因此,本研究利用知识元素的这些特征来识别特定领域的技术机会,提出一种基于专利分析的技术机会识别新方法。
2相关研究
2.1技术机会识别
目前,技术机会识别主要有三个研究方向。第一个研究方向是研究技术融合。技术融合是指两个或多个技术领域实现知识的共享和交叉应用[9]。例如,Park等[10]以生物和信息领域的专利为分析对象,基于专利引用网络来预测两个领域间的知识流动,进而发现技术融合的机会。Han等[11]通过关联规则对专利分类号进行分析,发现了信息通信领域与其他技术领域的技术融合机会。第二个研究方向是研究技术空缺,即识别能够满足某领域技术需求的机会[12]。例如,Choi等[13]使用贝叶斯模型对专利进行聚类,进而发现领域内的技术空缺。Son等[14]以光刻技术的专利为例,利用生成式拓扑映射(GTM)来开发专利地图,并发现地图中的空白区域,通过空白区域与原始关键词向量的逆映射来解释每个空白的含义,最终发现了空缺的技术机会。第三个研究方向是研究新兴技术,即具有高增速、高新颖度、高不确定性以及高市场潜力的技术[15]。例如,Joung等[16]构建了专利关键词矩阵,使用层次聚类的方法来发现葡萄糖生物传感器领域的新兴技术。Moehrle等[17]以影像技术的专利为素材,通过专利语义分析来识别领域内的新兴技术。
2.2RFM模型
RFM模型是市场营销领域识别客户价值的经典模型,用于在观测点对观测期(观测点之前的一段时间)内顾客消费的情况进行分析,从而识别出重要价值客户[18]。R(recency)是指顾客消费的临近性,常用最近一次消费距离观测点的时间长度来衡量;F(frequency)是指观测期内顾客消费的频率;M(monetary)是指顾客的消费能力,常用观测期内顾客消费的金额来衡量。基于RFM模型,Cheng 等[18]分析了一家台湾电子产业公司的顾客的忠诚度;Yan等[19]通过分析财产保险公司的客户的终身价值来评估客户风险;Seymen[20]研究了英国连锁超市顾客流失的情况,并进行顾客细分;马宝龙等[21]提出了一种对未来顾客价值进行识别的方法,并用一家购物中心的顾客交易数据进行了实证分析。
2.3随机行动者导向模型
随机行动者导向模型(stochastic actor-oriented models,SAO模型)是基于纵向数据来分析网络动态演化的模型,可同时分析网络的演化和网络节点行为的变化,是近年来社会网络分析领域兴起的从动态视角分析社会网络的有力工具。在SAO模型中,网络演化的过程被称作社会选择(social selec‐tion),而网络节点行为变化则是社会影响(social influence)的过程。SAO模型把网络的演化视为网络中的节点建立、维持或终止与其他节点之间连接的过程。网络节点的连边选择受如下目标函数控制[22]:
f net
i
(β,x)=∑kβnet k s net ki(x)(1)其中,s net表示影响节点连边选择的各种效应;βnet 表示效应的参数估计。
类似地,网络节点在不同时期的行为变化受如下目标函数控制:
f beh
i
(β,x)=∑kβbeh k s beh ki(x)(2)其中,s beh表示影响节点行为变化的各种效应;βbeh 表示效应的参数估计。
基于SAO模型,Cao等[23]分析了基于建筑信息
54
第1期张振刚等:基于RFM模型和随机行动者导向模型的技术机会识别
鸡蛋托盘建模的工程中合作网络的演化。吴江等[24]研究了在线医疗社区用户关系网络的动态演化。Finger等[25]探讨了驱动银行间货币市场网络形成的因素。在分析网络成员行为的演化方面,Mohrenberg[26]分析了贸易开放政策在不同国家间的扩散情况。Kavaler 等[27]研究了开源软件社区软件开发者的代码所有权和开发效率的变化。
2.4述评
在技术机会识别方面,现有基于专利数据的定量分析方法大多停留在专利的外部指标层面,如专利关键词分析、引用情况分析等,对专利的知识本质还缺乏充分利用。RFM模型主要用于客户关系管理领域,但其通过关键指标聚类来识别重要价值对象的思想可以为其他领域的研究提供借鉴。在SAO 模型的使用上,现有研究主要集中在分析社会网络的演化和网络节点行为的变化,而鲜有用于知识网络的分析。本文基于专利的知识本质和知识组合理论,借鉴RFM模型的思想来评价特定领域的知识元素,使用SAO模型来分析知识网络的演化和知识元素的组合特征,并在此基础上提出识别特定领域技术机会的新方法。
3研究设计
由于一个技术领域内的知识元素众多,不同知识元素的利用价值各有不同,本研究需要识别能反映领域内技术发展趋势的知识元素,并探索这些知识元素进行组合的新机会。因此,本文采用三个步骤进
行分析:第一步,提出识别趋势性知识元素的方法;第二步,分析知识元素的组合规律,并提出识别技术机会的方法;第三步,根据所提出的方法,预测趋势性知识元素的组合机会,并检验预测的准确性。其中,第二步要以特定技术领域的专利数据为素材,本研究以人工智能领域为例,在分析前进行数据的收集。选择人工智能作为目标分析对象的原因有三方面:第一,从领域知识特性上看,人工智能领域的知识具有多学科交叉性,覆盖了电子、计算机、生物医学等多个知识领域。分析人工
智能领域的技术创新,实质上是分析多个领域的技术创新。因此,与单一领域相比,选择人工智能领域作为分析对象更具普遍性和代表性。第二,从统计学特性上看,人工智能领域的专利成果较多,能够提供大样本的分析素材,使分析结果更具可靠性。第三,从实践性上看,目前,世界上许多国家和地区都把人工智能作为战略性新兴产业。因此,挖掘人工智能领域的技术机会,具有重要的实践参考价值。
3.1数据收集
本研究借鉴文献[28]使用的检索式,用从德温特专利数据库检索了2013—2018年人工智能领域的专利数据,共12579条记录。参考已有研究的做法[4,29],本文用专利的国际分类号(IPC)来表示专利所含有的知识元素。专利的国际分类号采用等级形式,分为部—大类—小类—大组—小组等五个等级。已有的大部分研究都是采用分类号的前四位(即小类级)来代表知识元素。但小类级的代码包含的技
术范围过于宽泛,不能准确描述专利所具有的知识元素。而分类号到大组级能够较好地反映专利所代表的产品、技术过程和机制[30]。因此,本文用大组级的分类号来代表专利所具有的知识元素。
3.2技术机会识别方法
根据知识组合理论的观点,专利发明是对相关知识元素进行组合的结果,不同的知识元素的组合能力不尽相同[31]。在一个观测期内,不同的知识元素出现的频率和出现的时间也存在差异。知识元素的这些特征与市场营销领域顾客的消费行为特征存在相似性。因此,借鉴RFM模型的思路,本研究使用三个指标对知识元素进行评价,识别出领域内的重要知识元素。其中,R代表知识元素出现的时间特征,F表示知识元素出现的频率,M则代表知识元素的组合能力。根据相关研究,一个知识元素的组合能力越强,则该元素与其他知识元素的相关性越强,能够与之进行组合的知识元素越多,其应用越具有多样性,其应用潜力和应用价值也就越大[7,29,31]。本文对三个指标的计算方法如表1所示。
表1知识元素评价指标
指标
R(recency)
F(frequency) M(monetary)
公式
R=∑i=1N Date i N
F=N
M
i
=degree
i
描述
Date
i
表示知识元素第i次出现的距离观测点的时长,以天为单位;N表示观测期内知识元素出现的总次数[12]知识元素在观测期内出现的频率
知识元素的组合能力,用知识元素在知识网络中的中心度来表示,中心度越大,组合能力越强[31]
55
第40卷情报学报
表1中提到的知识网络由知识元素组成,知识网络中的节点代表知识元素,两个知识元素在同一个专利中出现,代表了一种组合,在网络中将代表这两个元素的节点相连。基于上述三个指标,本研究通过聚类的方法来发现领域内的重要知识元素。这类知识元素具有三个特点:一是出现的时间离观测点较近,具有一定的时效性,代表了新近的应用方向;二是出现频率高,代表了领域内的热门技术应用;三是与较多的知识元素进行过组合,具有较强的组合能力。对具有这三个特征的知识元素进行研究和应用,在一定程度上代表了未来领域内技术的发展趋势[12]。因此,本文把这类知识元素称为领域内的趋势性知识元素。
在识别出趋势性知识元素后,本研究需要对这些知识元素未来的组合机会进行预测。为得出知识元素间进行组合的特征和规律,使用SAO模型来分析知识网络的演化。本研究以2013—2015年每年都出现的知识元素为对象,以一年作为一个观测期,共三期,相应地构建三个知识网络,用于SAO模型的分析。SAO模型的参数估计和模型检验使用R语言中的RSiena程序包编写代码,采用马尔科夫链-蒙特卡洛估计法(MCMC)来进行研究。表2中列出了影响知识元素间进行组合的常见效应及其参数估计
的情况。
从表2可以看出,模型的总体最大收敛率(over‐all maximum convergence ratio)为0.0623,小于0.25,这说明模型整体收敛度较好,各种效应检验可靠。Rate parameter period1表示从第一个观测期(2013年)到第二个观测期(2014年)之间知识网络中节点的连边改变的平均程度;Rate parameter period2表示从第二个观测期(2014年)到第三个观测期(2015年)之间知识网络中的连接改变的平均程度。degree(density)的系数为负,说明所构建的网络密度较低。transitive triads的系数为正且效应显著,表明知识网络在演化过程中存在明显的传递性效应,即具有共同邻近节点的知识元素间有建立连接的趋势。degree act+pop效应反映的是程度中心度高的节点在网络演化过程中建立更多连接的趋势,该效应的系数为正且显著,说明知识网络中程度中心度高的知识元素在网络演化过程中能够与更多的知识元素进行组合。
因此,一个知识元素的中心度、与焦点知识元素的共同好友数可以作为判断这个知识元素与焦点知识元素进行组合的可能性的指标。这两个变量及其交互作用能在一定程度上反映两个知识元素间的组合趋势。此外,两个知识元素在知识网络中的距离也会在一定程度上影响两者进行组合的可能性[32]。基于上述分析,本文提出组合值的概念,用来衡量知识元素间的新组合机会,焦点知识元素i 与知识元素j的组合值用如下公式计算:
Combination
ij
=
degree
j
+mf
ij
+degree焦化废水
j
×mf
ij
distance
ij
(3)其中,degree j表示知识元素j在知识网络中的程度中心度,即网络中与j直接相连的节点数;mf ij表示知识元素i和j在网络中的共同邻居节点数;distan‐
ce
ij
表示知识元素i与j在知识网络中的距离。两个知识元素的组合值越大,意味着两者间进行组合的可能性越大。
4数据分析
本研究将检索到的专利数据分为两段:2013—2015年为一个时间段,2016—2018年为另一个时间段。基于2013—2015年的数据,利用本研究提出的方法来识别趋势性知识元素,并预测趋势性知识元素可能出现的新组合,即新的技术机会,然后利用2016—2018年的专利数据来检验预测的准确性。4.1知识网络构建
由于第3.2节中的公式(3)包含了知识元素在知识网络中的中心度,本研究根据2013—2015年间的所有
知识元素在专利中的共现情况构建一个整体知识网络,如图1所示。图1中各节点旁边的代码为IPC分类号,代表知识元素的名称,整个网络中有696个节点。
4.2趋势性知识元素识别
为识别出人工智能领域的趋势性知识元素,本文采用K均值聚类的方法,基于RFM模型的3个指
表2SAO模型检验
效应
Rate parameter period1
Rate parameter period2
degree(density)
transitive triads
degree act+pop
Overall maximum convergence ratio 参数估计
15.8129
17.9856
-2.3241*
文具盒生产过程0.1574*
0.0124*
0.0623
标准误差
1.6684
1.9183
0.0454
0.0086
0.0012
收敛t-ratio
-0.0469
-0.0219
-0.0413
注:*表示收敛t-ratio的绝对值小于0.1,意味着效应显著[24]。56
第1期张振刚等:基于RFM 模型和随机行动者导向模型的技术机会识别标,将696个知识元素划分到不同类别。由于指标数为3,理论上最多可以把知识元素分为8类。本研究首先采用轮廓系数来确定最合适的类数[2]。图2显示了不同聚类数对应的轮廓系数。
从图2可以看出,聚类数为4时,轮廓系数最大,故本文把知识元素聚为4类。由于部分聚类指标有较
大的方差,在聚类前先对各指标数据进行了标准化处理。聚类结果如图3所示。
从图3中可以看出,696个知识元素被划分为了4类,知识元素数量分别为439、53、200、4。各类的聚类指标均值如表3所示。
从表3可以看出,第4类的4个知识元素平均出
现时间短、频率高、组合能力强,故本研究认为这
图1
知识网络
电视定制图2
防鼠网
轮廓系数
图3聚类结果
(彩图请见qbxb.istic.ac/CN/volumn/home.shtml )
表3
聚类指标均值
类别1234
平均出现时间(R )
-0.58121-0.044811.29594
-0.41519出现频率(F )-0.11174
0.56507-0.12321
10.93748组合能力(M )-0.209722.10978
-
0.26528
8.32584
57

本文发布于:2024-09-24 05:29:16,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/308621.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:知识   元素   领域   网络   技术   分析   研究   组合
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议