国外常用专利分析工具比较分析

国外常用专利分析工具比较分析
将重点列举国外常用的专利分析工具,并依据专利分析工具可分析的数据源,将其分为非结构化数据分析工具、结构化数据分析工具和混合型数据分析工具三大类。
1.1 非结构化数据分析工具
非结构化数据分析工具是指擅长分析专利全文、期刊论文、网页内容等非结构化数据的软件,主要包括ClearForest, Goldfire Innovator, OminiVizTEMIS
1.1.1 ClearForest
铁道部
ClearForest是美国Thomoson Reuters公司开发的具有强大功能的文本分析解决方案,包括先进的文本标记抽取平台、分析平台以及开发环境。ClearForest最具特的功能是可以将非结构化数据库转化为结构化数据,如从论文、网页等非结构化文本中抽取相关词语生成结构化数据,进而利用其分析功能对结构化数据进行文本挖掘,如分类、聚类,生成列表、共现矩阵、聚类图等。此外该工具还提供了文本分析可视化功能,用于挖掘类间隐含关系和发现新知识。
1.1.2 Goldfire Innovator
Goldfire Innovator是由美国Invention Machine公司开发的一款文本挖掘分析工具,由创新工作平台(Innovator's Workbench)研究者Researcher)和 Goldfire 智囊库(Goldfire Intelligence)三部分组成。创新工作平台提供了一个解决问题的环境,可以利用多种分析工具、方法辅助对问题的理解;研究者是其知识搜取和创新趋势分析模块,利用复杂的语义分析技术将非结构化数据转化为可检索的语义索引进行专利分析,帮助用户发现核心技术、发明人及其合作伙伴和竞争对手;Goldfire 智囊库(Goldfire Intelligence)涵盖全球1500多万件专利、3000个专业技术网站和8000多种科技期刊,用于辅助其专利分析决策。以上三大功能模块构筑了Goldfire Innovator敢上九天揽月强大的分析功能。
1.1.3 OminiViz
OminiViz是英国BioWisdom公司开发的一款先进的可视化单机版数据分析软件。该软件有两大特:一是分析数据类型广泛,可以对数值数据、分类数据、基因序列、化学结构以及专利、论文等多种数据类型进行分析;二是整合复杂的统计算法、文本算法对大规模数据进行分析生成强大的可视化图谱辅助用户对数据的理解,可视化图谱主要有Galaxy图、
CoMet图、ThemeMap和聚类图等。
路径依赖理论
1.1.4 TEMIS
TEMIS是美国TEMIS公司开发的一款用于商业智能的文本挖掘工具。郑州轻工业学院图书馆TEMIS依靠其强大的数据算法、语言学算法,将多种文本类型的非结构化数据转化为结构化数据,并对结构化数据进行分析,生成列表、聚类图等。但是TEMIS在结果可视化展示方面还存在较大不足,因此限制了其应用范围。
1.2 结构化数据分析工具
结构化数据分析软件主要用于对数据库中的专利信息、文献题录信息进行分析,主要包括Thomson Data Analyzer,VantagePoint,Quosa, RefViz, STN AnaVistVxinsight
1.2.1 Thomson Data Analyzer
Thomson Data Analyzer美国Thomson Reuters公司与Search Technology公司联合推出的数据挖掘和可视化分析工具。由美国Search Technology公司的VantagePoint引擎提供技术
支持,具有VantagePoint的大部分功能。TDA除支持德温特世界专利索引、Web of SciencePubmed等常用数据库外,还支持MS Excel数据的导入。TDA软件提供强大的数据清洗功能保证了数据分析的准确性,在分析功能方面支持基本统计、共现分析、聚类分析,但不支持专利引文分析功能,结果显示方面可自动生成列表、矩阵、聚类图、报告等功能。
VantagePoint软件与Thomson Data Analyzer软件功能基本类似,在此不再赘述。
1.2.2 Quosa
Quosa是美国Quosa公司开发的一款集文献检索、全文下载、文献管理及文献分析于一体的单机版文本挖掘工具。该软件支持 OvidPubMedGoogle ScholarUSPTO 等的直接搜索,并将PDF全文下载到本地进行组织管理,并可对文献进行概念提取和聚类。其文献全文自动下载、最新进展追踪、PDF 文献信息自动识别以及全文分析功能是同类文献管理软件所不具备的,但其分析功能与专业类文献分析软件相比功能还较少。
m110 sass1.2.3 RefViz
RefViz 是美国Thomson Reuters公司开发的用于文献信息分析可视化的单机版软件。该软件主要特是其统计、语义分析功能,但是RefViz只能分析结构化数据,如来自文献数据库或文献管理软件的文献题名、摘要、主题词等信息,不能分析非结构化数。此外,在数据分析时可利用其词库工具(thesaurus tools)对数据进行清洗以确保数据分析的准确性。文献分析结果显示可生成Galaxy视图和二维矩阵视图。
1.2.4 STN AnaVist
STN AnaVist是美国化学协会 (ACS) 分支机构化学文摘服务社 (CAS) FIZ Karlsruhe共同开发的一款科技文献、专利文献文本分析可视化软件。支持化学文摘、德温特世界专利索引、欧洲专利数据库和美国全文专利数据库等多个数据库的内容。此外,STN AnaVist可利用CAS词表对机构、技术术语进行数据规范以提高数据分析的质量。文献分析结果显示可生在图表,以及采用聚类技术生在成的研究景观图。
1.2.5 Vxinsight
Vxinsight是由美国能源部桑地亚(Sandia)国家实验室开发的一款单机版免费的文本分析可
视化软件。该软件的主要特是采用三维虚拟地图的形式来模拟聚类信息,以揭示科技文献、专利、蛋白、基因间的相关性。
1.3 混合型数据分析工具
混合型数据分析软件是一类即可以分析结构化数据又可以分析非结构化数据的软件,主要包括:Aureka, M-CAM Doors, WisdomainPatAnalyst,这些工具都整合了专利数据库检索功能。
1.3.1 Aureka
Aureka是美国Thomson Reuters公司开发的一个在线的知识产权管理和分析平台,提供强大的专利检索、管理、分析(包括专利引证分析,专利地图分析等)预警等功能。在专利分析方面,通过ThemeScape提供聚类分析生成专利地图,通过Aureka Citation Tree提供引文分析生成引证树,揭示专利信息间的相互关联,为用户技术研发与自主创新、专利评价与评估、专利权保护、企业联营与合作或兼并等的生产经营决策活动提供帮助。Aureka软件在数据清洗方面功能较弱是该软件的主要不足。
1.3.2 Wisdomain
Wisdomain是美国Wisdomain公司开发的一个专利分析解决方案,整合FOCUSTPatentMagnetPatentFamilyTreePatentLab-II四个工具,支持美国、欧洲、中国、日本、韩国和世界PCT专利检索,提供基本统计、共现分析和引证分析功能,分析结果可以列表、聚类图、引文图形式显示。
1.3.3 Delphion专利信息平台
Delphion是美国Thomson Reuters公司开发的专利信息服务平台,集成 SnapshotCorporate TreePatentLab-IIText ClusteringCitation Link五个工具,分别提供在线分析、公司名称规范、列表和直方图等图表生成、文档聚类、引文分析功能。Delphion专利信息平台收录专利范围广、整合分析工具多是其主要特,但其按服务项目、专利下载数量收费的服务模式,使得一般用户难以承受其高昂的费用。
3.4 专利分析工具比较
以上对国外常用的非结构化数据分析工具、结构化数据分析工具、混合型数据分析工具进
行了简单介绍,下面将从分析工具类型、分析数据源、主要功能、结果呈现、用户五个方面,对13个分析软件进行比较。
非结构化数据分析工具,主要基于其强大的语义分析技术,将非结构化数据转化为结构化数据,进而利用其强大的分析功能对其进行分析。这四个软件中,ClearForestGoldfire InnovatorTEMIS价格昂贵,限制了其在国内的应用;Ominiviz为单机版软件,除具有文本挖掘功能外还具有强大可视化功能,其可视化功能在众多软件中尤为出众。
结构化数据分析工具,目前国内在科技文献、专利文献分析应用较多的主要是Thomson Data Analyzer,该软件支持20多种文献数据源(期刊文献和专利文献),是目前已知文献信息分析工具中支持数据最为广泛的软件,且支持MS Excel文件(含中文)的导入;此外该软件还具有强大的数据清洗功能、自动生成专利报告的功能,这些功能是其软件无法与之媲美的;但是Thomson Data Analyzer在专利地图制作、文献结果可视化方面还存在不足,限制了其在专利分析中的应用。QuosaRefviz主要用于期刊文献的管理和分析,支持数据源较少;STN AnaVist自带技术术语、机构分析词表可用于专利文献数据清洗,但对大规模数据库的清洗仍是该软件面临的巨大挑战。Vxinsight是本文介绍的分析工具中唯
一一款免费的软件,主要特是可以生成二维、三维聚类地图用于揭示专利、文献间的关系,但该软件在专利分析应用方面功能较弱。
混合型数据分析工具,除提供专利分析功能外,还提供专利文献检索、数据下载功能,文中提到的三个分析工具分析功能完备,均具有数据清洗功能,提供基本统计、共现分析、聚类分析、引文分析(仅对US专利进行分析),并可对分析结果进行可视化显示。但这三个工具在专利分析方面各有其优势与不足,如中央7台每日农经Aureka可采用聚类分析生成主题(词汇)地形图,用于专利技术主题分布研究,而在专利国家、机构分析分析方面由于缺乏数据清洗功能,分析结果准确性不足;Wisdomain仅能分析自带数据库检索结果,不具有数据导入功能;Delphion主要用于专利数据检索,在数据分析方面相比AurekaWisdomain功能较弱。

本文发布于:2024-09-21 23:34:23,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/332142.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:分析   专利   功能   文献   数据   工具   结构化   软件
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议