国内外专利法律信息挖掘研究综述

   本文系国家社科基金重点项目“面向企业技术创新的专利大数据挖掘与分析研究”(16ATQ008)、中南大学研究生科研创新项目“面向企业技术创新的专利法律信息挖掘研究”(502211918)、湖南省社科联智库项目“湖南社科大数据平台建设对策研究(ZK2019026)”、湖南省社科基金智库重点项目“湖南省大数据产业发展研究(19ZWB16)”研究成果之一。
【理论·探索】
国内外专利法律信息挖掘研究综述
●廖花林 (湖南图书馆 长沙 410011)
 文庭孝 (中南大学 长沙 410083) 
[摘 要]专利法律信息是专利信息的重要组成部分,一般可分为法律状态信息、权利要求信息、专利诉讼信息和其他法律信息四种,其他法律信息包括同族专利信息等。文章从这四种专利法律信息的概念出发,针对每种法律信息的挖掘方法和内容进行综述研究。目前专利法律信息挖掘领域的研究人员局限在几个体,且他们分别研究专利法律信息的某一部分,研究比较分散,彼此关联不紧密,没有形成完整的规模和体系。[关键词]专利法律信息 专利信息挖掘 法律状态 权利要求 专利诉讼 同族专利
[中图法分类号]G254    [文献标识码]A    [文章编号]1003-7845(2021)02-
0028-08[引用本文格式]廖花林,文庭孝.国内外专利法律信息挖掘研究综述[J].高校图书馆工作,2021(2):28-35
  专利文献作为反映发明创造的技术特征及法律状态的信息载体,集法律信息、经济信息、技术信息
和战略信息于一体[1]
,是专利信息分析与挖掘的基
础。专利法律信息作为专利信息的重要组成部分,对其进行挖掘分析有助于专利技术保护、专利价值评估、专利侵权纠纷解决以及专利技术研发、专利技术引进等
[2]
。国内外已经对专利法律信息挖掘进
行了大量研究,取得了较为丰富的研究成果,主要体现在专利法律状态信息挖掘、专利权利要求信息挖掘、专利诉讼信息挖掘及其他相关法律信息挖掘等方面。
1 专利法律信息及其挖掘1.1 专利法律信息
专利法律信息又称专利权信息,是指有关构成专利技术的法律内容信息,包含于专利文献权利要求书和专利文献扉页以及依据专利文献编制的各类
检索工具、数据库之中[3]
。权利要求书是有关专利
保护范围的信息,扉页包含了各类专利法律特征信息,比如申请人、发明人、专利权人、专利申请号、申请日期等,专利公报及专利登记簿等专利文献中记载了与权利保护和权利有效性有关的信息,数据库中包含各类经过处理的、结构化的专利法律信息。专利法律信息一般可分为法律状态信息、权利要求
信息、专利诉讼信息和其他法律信息四种。1.2 专利法律信息挖掘
专利法律信息挖掘是指在专利法律信息检索的基础上,利用定量统计和定性分析相结合的方法以及文本挖掘、数据挖掘、专利地图、社会网络分析等方法从中提炼、演绎和挖掘出有用的情报信息的
过程[4]
专利法律信息挖掘在国家、产业和企业等主体的技术研发、产品开发、进出口贸易、市场竞争、专利诉讼等活动中具有十分重要的作用,常常被用于以下方面:第一,专利价值评估。专利法律信息是影响专利价值的重要因素之一,通过法律价值指标对法律信息进行挖掘可以确定其价值,专利价值的高低
将影响专利技术研发和引进。法律价值指标[5,6]
括专利有效期、专利维持时间、权利要求数量以及宽度、同族专利数、专利诉讼情况等。第二,专利侵权判断。专利侵权分为防止侵权和被动侵权,专利侵权判断需要利用法律状态挖掘确定专利权是否有效以及专利权利要求文本挖掘来进行专利相似度检
测[7]344-364。第三,防止产品出口侵犯专利权。在产
品出口中,需要首先检索产品同族专利,确认同族专利的法律状态信息,然后判断产品是否可以出
口[8]。第四,制定专利诉讼策略。企业利用专利诉
讼信息挖掘整体专利诉讼情况,通过专利诉讼风险评估判断公司遭遇诉讼的可能性,以及结合社会网络分析定位公司市场角,在信息挖掘的基础上制定公司的专利诉讼策略。
2 专利法律状态信息挖掘研究
结合专利的时间性和地域性特征,专利法律状态是指在某一特定时间,某项专利申请或授权专利在某一国家的权利维持、权利范围、权利类型、权利归属等状态[9],主要有授权、终止、公开、实质审查生效、专利申请的视为撤回和专利权的无效宣告等[10]。法律状态很大程度上决定了专利权的价值,它直接影响专利权的价值存在、价值体现以及价值度量[11]。对专利法律状态及其相关信息的研究,能够揭示专利的申请、授权、维持时间、失效原因、转移和许可等要素,并在此基础上进行挖掘分析。2.1 专利法律状态的类型
我国专利法律状态类型繁多,且存在交叉和重复,尚未形成完整统一的分类体系。蒋君等认为专利法律状态包括在审、有效、失效、技术转化和其他等类型[12]。吴鹏等根据时序关系将专利法律状态分为公开、审查、驳撤、授权、失效、技术转化、质押保全、权利恢复、更改、文告等,全面覆盖法律状态的生命过程[13]。而国内外常用的专利数据库,包括各国专利机构公开免费的专利数据库和Innography、智慧芽等商业专利数据库,都包含有丰富的法律状态信息。如智慧芽提供简单法律状态和法律状态,前者包括审中、有效、无效和未确认,后者包括公开、实质审查、授权、未缴年费、撤回、驳回、期限届满、放弃、避重放弃和全部无效。尽管研究者们对法律状态的认识和分类不同,但在审、授权、失效是最重要的专利法律状态信息。
2.2 专利法律状态信息检索
专利法律状态信息检索是专利法律信息挖掘的重要方式。它是指对专利或专利申请自申请日起的各阶段及其产生的法律状态信息的检索,目的是为了确认专利的法律状态,应用于产品上市或出口、侵权诉讼、失效专利确认、专利法律权利确认等[14]368-372。专利法律状态检索是专利有效性分析和专利权属分析的基础。利用各国专利机构的在线法律状态数据库可以直接检索专利或专利申请的法律状态[15],检索入口包括申请(专利)号、法律状态公告日、法律状态,美国细分为多个查询系统,欧洲提供两种法律状态检索途径[16],也可以通过DII、Innography、智慧芽等商业数据库检索专利法律状态信息。
专利法律状态处于动态变化之中,一般以该国法律状态登记簿的记载为准[17],而且在专利法律状态检索过程中还需要重点关注专利期限的计算、专利维持费的缴纳和专利权属的变更等[18]。
2.3 专利法律状态信息分析
在专利全生命周期过程中,法律状态是动态变化的。专利法律状态分析主要是为了确定某件专利是否授权、授权专利是否有效、相关著录信息是否变更等,可以帮助规避侵权[14]8、衡量技术实力、研发差距和专利质量等[19]。
我国法律状态分析研究起步较晚,刘志远、张路最早采用定量分析方法对高校专利法律状态进行初步分析[20]。之后专利法律状态分析受到我国众多学者的关注,分别利用不同的指标对专利法律状态展
开研究。赖院根等较早建立了专利法律状态信息分析框架,奠定了法律状态信息分析的基础[10]。郭颖等提出将授权与失效、失效与专利寿命进行组合的专利法律状态分析方法,用于衡量专利质量[19]。王学昭等综合利用授权率、授权专利有效率、有效专利维持时间三个指标构建了专利法律状态组合分析模型,用于揭示竞争态势和技术研发[21]。蒋君等利用授权时间差、存活率、终止时间、技术转化率等指标进行专利法律状态信息细化分析[22]。
此外,部分学者使用统计分析方法对专利申请、授权、失效等法律状态信息进行了定量分析,如失效专利统计分析[23-25]、专利法律状态统计分析[26,27]等。也有学者仅对专利法律状态某一特征进行统计分析,如专利维持时间[28,29]、技术转化[30,31]、有效专利统计分析[32]等。
3 专利权利要求信息挖掘研究
专利权利要求是专利保护的核心,决定了专利保护的范围[33],它源于专利申请公开书或者专利说明书中的权利要求书,使用简洁、准确的文字概括出发明的技术方案,部分数据库提供针对专利权利要求的检索功能[7]175。目前主要采用定量分析、文本挖掘、专利地图等方法对专利权利要求进行挖掘与分析,专利权利要求信息挖掘在专利信息分析和专利侵权判断中具有极为重要的作用。
3.1 专利权利要求数分析
专利权利要求数与专利价值密切相关。专利权利要求数反映了技术创新程度[34],是判定核心专利的重要指标之一[35],也是影响专利价值的重要指标
之一[36]。张克等使用相关分析、T检验、Logistic回归分析方法验证权利要求数对专利价值有正向影响[37]。BessenJ发现,专利权利要求数越多,受保护的范围越大,专利的价值越高[38]。RudiBekkers通过研究证明,权利要求数在判别专利价值和核心专利中起着必不可少的关键作用[39]。
权利要求数与专利维持时间也高度相关。乔永忠、肖冰发现,中国、美国、德国、法国授权专利的权利要求数对专利维持时间有正向影响[40]。乔永忠、谭婉琳再次验证,不同国家授权的、不同权属的专利,其权利要求数对专利维持时间的影响程度不同[41]。
现有研究一般将权利要求数与其他相关指标联合进行分析,以判断专利权利价值、是否为核心专利,以及权利要求数与其他指标的关系。
3.2 专利权利要求的文本挖掘
专利权利要求书具有特定的格式要求,属于半结构化文本[42]。专利权利要求的文本挖掘以自然语言处理技术为基础对专利权利要求书进行识别抽取,并利用数据挖掘技术对权利要求内容进行深层次的
抽取和挖掘,主要应用于专利相似度检测,为后续的专利侵权判定或专利无效分析奠定基础。判别专利相似性包括基于引文和基于专利文本内容两种计算方法。基于引文分析的专利相似度研究起步较早,但受时间、数据量、数据源等诸多局限。随着文本挖掘技术的出现,专利文本相似度计算焕发生机,专利标题、摘要、权利要求和说明书都是文本挖掘的对象。专利权利要求的文本挖掘在专利侵权判断中起关键性作用,是判断专利相似度的有效方法之一。Indukuri利用语法与语义相结合的方法来确定两个专利权利要求书之间的相似度[43]。C.Lee等使用层次关键词向量表示权利要求项之间的依赖关系,提出一种树匹配算法得到权利要求项之间的相似性[44]。马文珊等提出利用专利权利要求书必要技术特征概念集合的覆盖度计算方法来判断专利相似性[45],张海超、赵良伟利用Doc2Vec深度神经网络算法计算权利要求书文本之间的相似度[46]。
信息抽取是专利文本挖掘的关键技术,而分词是信息抽取的基础。张桂平等提出一种统计与规则相结合的多策略分词方法[47]。宋立峰分别比较了基于词类的错误驱动学习方法、条件随机场方法、期望最大值方法在专利文献中的分词效果[48]。岳金媛等提出一种领域词典与统计相结合的分词方法,大大提高了专利文献的分词精度[49]。翟东升、马文珊提出基于领域知识和规则相结合的面向中文专利权利要求书的分词算法[50]。张杰等基于其研究,在ICTCLAS系统初分词的基础上,构建分词规则和领域词典进行再分词,改善了权利要求书这一特定文本的分词效果[51]。
技术特征关键词的选取及相似度测量机制的设定是专利信息抽取的关键。武玉英等采用TextRan
k算法从权利要求中抽取专利文档关键词,采用基于SOM算法的模糊聚类对专利侵权进行判定,但关键词无法准确表达专利的技术结构特征[52]。金健等将专利权利要求书中描述技术特征的句子抽取为技术要素三元组形式,使用三元组特征集合覆盖度算法来计算专利间的侵权程度,提高了侵权检测效率,但检测速度待改进[53]。SAO结构相比单个概念更能准确表达专利的内容[54],以及清晰表征专利成分之间的关系[55],张杰等提出基于权利要求书SAO结构的中文专利相似算法,利用多维尺度分析和聚类分析识别出相似专利[56]。翟东升等利用SAO技术从专利权利要求书中抽取技术特征,将SAO三元组绘制成图的形式,再将图用邻接矩阵图表示,通过对比矩阵的相似度来判断是否侵权[57]。
3.3 专利权利地图
专利地图是对专利分析结果的可视化表达,包括专利技术地图、专利管理地图和专利权利地图[58]。权利地图是将专利权利要求作为主要分析指标,揭示权利要求范围、权利转让、侵权可能性、权利状态等信息[7]75,其内容包括对专利权利要求的解释和对特定技术类似专利权利要求范围的差异对比[59],分为关键专利权利要求及其关系图、权利范围矩阵分析和专利范围构成要件图等,主要用于专利权利范围界定[60],有助于侵权比对或者回避设计。权利要求要件及其关系图可以客观直接地展示各组专利保护客体内容的组成[61]。
专利权利地图是进行专利法律信息挖掘的重要工具。选取的专利文献对象一般数量有限且针对性强,关键文献是权利地图制作的基础。专利信息分析的科学性、准确性,信息图形化的简洁性、可读性,都是影响权利地图制作水平的重要因素[62]。YoonB提出基于自组织特征图的专利地图绘制方法,通过权利要求点图判断侵权可能性[63]。刘玉琴采用双曲树算法进行专利权利要求结构解析,应用微软WPF框架进行了专利权利可视化图形绘制研究[64]。国内外不少免费和商业专利数据库,如德温特、Innography等都可以制作特定的专利权利地图,
揭示专利权利要求信息。
4 专利诉讼信息挖掘研究
专利诉讼是指当事人和其他诉讼参与人在法院进行的涉及与专利权及相关权益有关的各种诉讼的总称[65],是企业保持技术实力、运用专利权进行竞争的有效方式。专利诉讼信息包括原告、被告、受理日期、审结日期、是否提出专利无效、赔偿类型等。专利诉讼信息容易获取,即使案件很少,也蕴藏着大量丰富的内容。专利诉讼信息挖掘能够识别核心专利和高价值专利,可以辨别公司的诉讼目的和专利战略,是产品进入市场前风险预警和评估的重要手段。
4.1 专利诉讼信息检索
专利诉讼信息蕴含在专利诉讼案例中,专利诉讼案例是指各国同专利相关的司法决定和行政决定[14]204。检索专利诉讼案例可以利用搜索引擎,也可以借助各国,如最高法院,还可以选择商业数据库,如TI(ThomsonInnovation)、Innogra phy、知产宝等,TI收集了美国联邦地方法院的专利诉讼案例,能便利地导出专利诉讼信息[65],Innogra phy提供来自美国法院电子数据库系统的专利诉讼案件、美国国际贸易委员会337调查以及美国PTAB的专利无效复审案件,并提供专利诉讼分析[66]。4.2 专利诉讼信息分析
专利诉讼信息分析是指利用定量、定性或者两者相结合的方法对专利诉讼信息进行深入分析,包括专利诉讼分析、专利诉讼特点分析和专利诉讼风险评估分析等。
(1)专利诉讼分析。专利诉讼分析是专利分析中不可或缺的利器[67]。国内学者早期主要针对国外的专利诉讼进行分析,以为中国企业制定战略提供借鉴,杨宇静基于通用电气与三菱重工之间的专利诉讼大战,定性分析美国清洁能源专利诉讼的特点和发展趋势[68];王晓燕、寿步定性分析美国云计算专利诉讼案件,发现云计算技术热点和发展趋势[69];卢章平、黄晋从诉讼案件量、诉讼专利量、涉诉专利的时效性、核心专利性等几个指标出发,研究美国涉诉专利的总体特征[70]。近几年不少学者开始挖掘专利诉讼信息的更多价值,翟东升等分析了主动诉讼程度较高企业的起诉对象、被侵权专利以及所涉及侵权的技术和产品,帮助企业制定专利诉讼与防御策略[71];袁晓东、张浩就输入法专利诉讼频发的原因进行分析,了解中文输入法专利竞争态势[72];张谦、张文明对美国的磷
酸铁锂领域的诉讼案件进行实证研究,证实专利诉讼分析可以明确某技术领域真正的领头企业[67];郭伟、包逸萍统计分析了中药提取物领域的历年诉讼数量和原告公司情况[66];苏聃等统计和分析了孟山都在美国涉诉专利,发现草甘膦抗性是孟山都的核心技术之一[73];Kim等从原告整体胜诉率、败诉案件主要理由、当事人类型等方面分析了韩国审判法院审理的656起专利侵权诉讼案件[74]。还有部分学者针对多次涉诉专利和专利诉讼倾向进行分析,如毛昊等考察多次诉讼专利与专利诉讼信息的关系[75];袁晓东、谢伟峰量化专利诉讼倾向,发现专利诉讼倾向与产品类型、公司所在国家和诉讼持续时间等都有相关性[76]。
(2)专利诉讼特点分析。我国专利诉讼呈现“审判时间长、举证难、成本高、赔偿低”的特点,部分学者针对此情况进行专利诉讼信息分析。通过2011—2015年度样本法院的专利侵权案件分析发现约25%的案件不存在审判时间长的问题,但是也不否认剩余75%的样本中存在因周期较长而未记载受案日期的可能[77]。此外,我国的损害赔偿实际判赔额远远低于发达国家的赔偿水平,不利于创新生态的健康和知识经济的增长[78],研究表明在原告采用非法定赔偿额类型的案件中能够获得相对更高的赔偿额[79],但我国由于专利权人举证不力,导致专利权人的请求赔偿额对实际判决的结果影响有限,最终造成了“法定赔偿”的大规模适用[80],此后果是部分权利人主动选择、被控侵权人消极默认和部分法官倾向法定赔偿三方共同博弈的结果[81]。
(3)专利诉讼风险评估分析。专利申请与专利诉讼之间存在显著的相互促进作用[82],随着专利
申请数量的增加,专利侵权诉讼也逐年增长,企业技术创新过程中存在专利侵权诉讼风险。虽然专利侵权诉讼对原被告双方的企业创新都有激励作用[83],但是专利诉讼可能会造成巨大的经济损失、时间以及精力消耗。评估企业专利侵权诉讼风险,有助于企业规避专利侵权诉讼或者决定诉讼策略。专利诉讼概率越大,该专利的价值越高[84]。同时,专利价值是企业实施专利诉讼行为的重要影响因素[85],潜在价值高的专利往往更有可能涉及到诉讼[86]。张米尔等发现独立权利要求数多易引发诉讼[87]。张杰等以权利要求数和独立权利要求数等作为诉讼专利特征指标,利用Logistic回归模型构建了高诉讼风险专利识别模型[88]。国伟通过对涉及诉讼专利的关键申请特征的研究发现独立权利要求数、引用专利
数、技术宽度与专利诉讼发生概率有显著的正向关系[89]。贺宁馨等发现专利类型、权利要求数、原告的类别、案件的审级等变量对侵权人败诉率有显著影响,以及专利类型、侵权行为数量、请求赔偿额、诉讼地区、诉讼年份对赔偿额有显著影响[90]。赖流滨、张运生研究发现权利要求数、专利维持时间等对专利诉讼具有正向影响[91]。
4.3 专利诉讼社会网络分析
定量统计和定性分析无法反映诉讼主体间复杂的诉讼关系,社会网络分析与专利诉讼信息的联合研究受到重视。对专利诉讼关系的社会网络分析有助于了解行业内竞争者的相互制约关系,明确企业在市场所
处的位置,同时对未来可能发生的诉讼做好预警准备,以及为制定专利诉讼策略提供信息。Kim等提出了一种分析企业间专利侵权诉讼的方法,通过构建公司专利侵权诉讼关系图,然后计算网络中心度将企业分为关键企业、专利钓鱼者、受害者和旁观者4种角[92]。Kim等的研究启发了我国学者新的研究思路。张杰等在此基础上结合可视化分析工具UCINET针对LED企业做了实证研究[93];潘颖等则是以IT领域发生专利侵权诉讼关系的21家企业为实证对象,揭示企业的市场地位[94];张米尔等在社会网络分析方法的基础上,采用层次聚类分析方法,比较分析诉讼主体的差异,并对诉讼主体进行类型划分[95];刘瑞荣、赖奎魁通过网络中心性统计量分析,多变量分析以及角分析三步骤建构了一套完整的识别企业诉讼网络位置与角的方法,此方法的创新在于科学决定分数目和检验分效度[96]。
5 其他专利法律信息挖掘研究
专利文献中的法律信息是表示专利权的各种标志,可以从技术信息、时间信息、空间信息,权利信息,人员信息,专利族信息等中提炼并分析挖掘出相关的法律信息[2]。其他专利法律信息是指除法律状态信息、权利要求信息、专利诉讼信息之外,包括同族专利信息在内的反映专利法律特征的专利信息。
5.1 同族专利信息挖掘
同族专利或专利族是指根据同一发明创造,在多个国家或者地区进行的专利申请或者专利授权而形成的
专利组合,往往以优先权申请、PCT申请、地区专利申请为基础[97]。同族专利挖掘和分析可以防止产品出口侵犯专利权,解决专利文献的阅读障碍,了解竞争对手实力[8],有助于发现技术保护内容的变迁和评估专利的价值,了解潜在市场布局等[98]。
(1)同族专利信息检索。同族专利检索是指对与被检索的专利或专利申请具有共同优先权的其他专利或专利申请及其公布情况进行的检索[15]。通常可以利用德温特分配的入藏号、专利说明书中的著录信息、国家或地区的官方专利网站和智慧芽等商业数据库,其中欧洲专利局的国际专利文献中心数据库(INPADOC)是目前最完整的扩展专利家族数据库,可以快速获取某一专利的专利族信息[99]。同族专利检索一般利用关键词与申请人、优先权的逻辑AND组配或者通过优先权项检索[100]。同族专利检索经常与专利法律状态检索结合起来应用[101]。
(2)同族专利信息分析。同族专利信息分析以同族专利数为分析对象,而同族专利数可以反映发明技术的重要性[102]。汪满荣等分析了大数据技术同族专利数分布,用于了解潜在市场布局[98]。吴红等通过对比中美日具有同族专利的申请数量、同族专利平均大小和平均跨国数量,推定美日的燃料电池技术的竞争力比较强[103]。苑朋彬等对比分析了中美碳捕集与封存技术同族专利的研发活跃度,发现两国都很重视印度市场的开发[104]。李蓓等通过同族专利数排名发现国外来华申请者掌握了中国肿瘤基因诊断核心专利技术[105]。Akinsolu等分析了非传染性热带疾病相关专利的专利族申请模式[106]。
同族专利可视化分析工具有助于高效地进行同族专利信息挖掘和分析[107],利用专利族图谱便捷区分专利族并揭示专利族内部同族专利的关系[108]。
5.2 其他相关研究
除法律状态信息、权利要求信息、专利诉讼信息、同族专利信息之外,发明人、申请人、专利权人等信息也能反映专利的法律特征。魏来、高霏霏采用社会网络分析方法挖掘专利发明人与申请人之间的合作关系[109],付雅宁等研究发明人合作网络对企业探索式创新的影响[110]。梁子豪等分析专利权人之间的竞争合作关系[111]。
6 结语
专利法律状态信息挖掘是专利法律信息挖掘的基础,法律状态检索及分析为专利信息挖掘不可缺少的一部分;专利权利要求信息是专利法律信息挖掘的重要来源,特别是文本挖掘方法的应用为专利相似度检测、专利无效分析、专利侵权判断等提供了

本文发布于:2024-09-23 06:34:08,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/436097.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:专利   信息   诉讼   法律   权利   要求   分析
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议