图书馆数据治理成熟度评价体系构建

•理论研究•锖赧科嗲
第39卷第1期 2021年1月图书馆数据治理成熟度评价体系构建
吴锦池,余维杰
(中山大学信息管理学院,广东广州510006)
摘要:【目的/意义】图书馆数据治理成熟度评价旨在衡量图书馆数据治理能力强弱程度,对促进图书馆数据治 理实施进程和改善图书馆数据治理中存在缺陷有着指导性作用..【方法/过程】本文通过分析现有的数据治理构成 要素的相关研究,提出了图书馆数据治理的构成要素模型。基于此,本文结合图书馆数据治理的行业特殊性和能 力成熟度模型,从数据处理流程与图书馆数据治理构成要素两个宏观维度出发,构建图书馆数据治理能力成熟度 模型,并确立了图书馆数据治理评价体系。【结果/结论】本文所构建的图书馆数据治理成熟度评价模型提供了判断 图书馆数据治理能力成熟度等级的有效工具,可以反映图书馆数据治理的具体实施效果,快速定位其薄弱环节,并 据此提出有针对性的提升策略。【创新/局限】本文基于CM M模型,结合数据处理流程和图书馆数据治理构成要素 构建了图书馆数据治理成熟度评价体系然而由于当前实际进行数据治理的图书馆数量较少,因而未能较为全面 地对比不同图书馆之间数据治理能力差异。
关键字:图书馆;数据治理;数据治理要素;成熟度评价;数据处理流程
中图分类号:G251; G250.2 DOI:10.13833/j.issn.1007-7634.2021.01.009
1引言
大数据时代,数据已成为重要的基础性战略资源[^,数 据治理则是人们规范、整合和运用数据的有效手段。近年 来,无论是咨询、保险、电商等以数据为核心业务的行业,还 是汽车、服装、地产等实物型行业都高度关注数据治理实际 方法实施和应用。图书馆作为知识传播、文化传承和教学科 研的信息中心和服务中心,是典型的“数据集中”、“以数据为 核心资产和业务”的大数据行业[21。阁书馆发展和使用数据 治理相关技术,是图书馆提升数据管理能力和数据服务水平 的重要途径之一。其中数据治理成熟度评价是判断评价对 象数据治理能力强弱的重要依据,目前已有的数据治理成熟 度评价体系主要集中于商业企业和政府机构,如IBM数据治 理委员会的成熟度模型151、DataFlUX数据治理成熟度模型141,以及GBD-GMIS政府大数据治理成熟度评测指标体系[51等,而专门针对图书馆数据治理成熟度评价体系构建的研究尚 属空白。图书馆的职能和性质不同于商业企业和政府机构,即商业企业和政府机构相关的数据治理成熟度评价指标并 不能完全适用于图书馆。因此,构建合理、适用和具有针对 性的数据治理成熟度评价体系是图书馆当前开展数据治理 工作以及成果验收的重要一步。
基于此,本文尝试总结归纳企业、政府机构中数据治理 成熟度评价体系构建的基本要素和一般规律,并基于图书馆 的功能定位和实际运作流程等要素,提出适用于图书馆的数 据治理成熟度评价体系。
2研究综述
就目前而言,数据治理是一个较为前沿的研究领域,该 概念最初起源于数据仓库管理|<0。由于其本身的复杂性和 巨大的现实意义,数据治理快速得到了国内外学者的关注,涉及计算机科学、信息学、情报学、管理学等多个科学领域,且相关论文数量逐年上升。然而肖前对数据治理的定义尚 未有统一定论。其中较有代表性的定义包括由国际数据治 理研究所(The Data Governance Institute,DGI)所提出:“数据治 理指的是对数据相关事宜的决策制定与权利控制”和由国际 数据管理协会(The Da丨a Management Association,DAMA)所提 出:“数据治理是指对数据资产管理行使权力和控制的活动 集合”。
通过对国内外相关文献的广泛调研,本文将目前的数据 治理研究概括为以下几个方面:①数据治理概念辨析。明确 数据治理的内涵和外延对数据治理的理论探究和技术实现 都有着重要的作用。当前不同学者对数据治理的概念界定
收稿日期:2020-12-01
基金项目:中山大学中央高校基本科研业务费专项资金资助(19wkpyl49)
作者简介:吴錦池(1995-),男,广东揭阳人,硕士研究生,主要从事数据挖掘与数据治理研究;余维杰(1986-),男,广东汕 头,副教授,博士研究生,主要从事智能信息处理研究.
• Theory Research •INFORMATION SCIENCE
Vol.39,No. 1January,2021
不尽相同,已分别有学者从数据资产171,数据管理l81、数据质 量管理w、数据策略管理[u)l等方面对数据治理进行描述。大 多数学者认为数据治理、数据管理、信息治理之间是存在差 异的,如刘桂锋等人〜4人为数据治理、数据管理和数据质量 管理之间相互存在交集,但是不完全相同;安小米等人则
认为数据治理可以被看作广义信息治理计划的一部分。② 领域数据治理理论框架。数据治理理论框架是数据治理工 作的行动指南,发挥着提纲挈领的作用。从构成要素角度出 发,不同学者对数据治理构成要素的侧重不同,所侧重内容 包括有数据服务1〜、数据分析处理过程%、数据安全[〜等。从运用领域角度出发,有学者和研究者们根据其应用领域特 点提出了相关的数据治理理论框架。其中,DAMA^框架和 DGIh”框架等认可度较高且运用范围最广。此外,安小米1"11等人以政府机构为对象,提出政府数据治理规则体系;包冬 梅%等人则提出基于图书馆的数据治理框架——CALib;司莉咖等人总结了机构科研数据知识库(Institutional Research Data Repository,IRDR)在数据治理实践中的关键问题,提出 了 IRDR联盟数据治理框架。可以看出,数据治理理论框架 的发展呈内容多元化、指标多维化和应用对象多样化的现象。③领域数据治理应用及技术。数据治理理论的实际应 用是研究数据治
理理论框架的直接目的,数据仓库、网络安 全和软件工程等技术是数据治理的技术支撑17'2’_22]。国外机 构和国内外学者多从系统实现的角度探究数据治理所需技 术手段13〜251;也有学者从技术应用角度出发,探究该技术在 数据治理中应用的潜能l25d。④数据治理成熟度评价。成 熟度评价起源于SE1组织开发的容量成熟度模型(Capability Maturity Model.CMM),是一种用于开发和完善组织的软件开 发流程方法。数据治理领域学者学习和参考该方法,进行了 数据治理领域的成熟度评价模型探讨。IBM数据治理成熟 度模型在CMM基础上,划分了 11个数据治理成熟度类别来 度量数据治理能力w;张宇杰w等人提出的政府大数据治理 成熟度评测指标体系——GBD-GMIS,该指标体系将成熟度 划分为7个等级,并总结出战略规划、制度保障、组织保障、技术架构、数据管理和治理能力六个方面的成熟度要素。
综上所述,虽然数据治理研究涉及学科众多、研究对象 多样,但主要集中于理论框架构建和技术应用两个方面,专 门针对成熟度的研究相对较少,且多数是基于企业和政府机 构所构建的。而另一方面,图书馆数据治理的相关研究日益 增多,这表明图书馆数据治理是值得研究且有研究空间的对 象。因此,本研究将从图书馆性质出发,收集国内外图书馆 评价体系中的评价要素,结合现有数据治理成熟度评测指标,构建基于图书馆数据治理的成熟度评价指标体系。
3数据治理构成要素
一方面,数据治理的目标都是为提供对重要的数据资产 和信息进行正规统一的管理方式;另一方面,在不同领域中 数据治理的手段、方法和流程并不完全相同。因此,梳理和
-66 -总结不同领域的数据治理的手段、方法和流程对图书馆数据 治理具有较高的借鉴作用。数据治理能力的构成要素是评 价数据治理能力的子集,也是评定数据治理成熟度的重要组 成部分。通过了解和总结不同领域的专家学者所总结的数 据治理能构成要素,为接下来提出图书馆数据治理成熟度评 价体系提供参考和思路。
3.1现有数据治理构成要素描述
数据是系统交互操作、业务规则和流程以及应用设计的 基础,所以数据的治理应被给予足够的重视,同时治理要素 应围绕着提高数据整体质量展开lnl。目前,已有学者和组织 从不同角度对数据治理构成要素进行了总结和解释,如表I 所示。
G.Marinos是最早对数据治理构成要素进行总结的学 者,他全面性地总结了数据治理的10个构成要素,按照要素 作用范围,可将其概括为管理层、实践层和基础保障层3个 层次。S.StaocWale则是将数据治理要素概括性的总结为表 中所述的5个要素。其中治理结构是对数据治理的整体框 架的构建,对数据治理流程具有指引性意义;角和职责是 治理任务的细分;数据分类是数据治理流程中数据预处理阶 段,增加数据的可操作性;政策(包括标准和指南)是数据治 理具体实施过程中行动准则和保
障」P.Sonia则从数据治理 实施过程的角度总结了数据治理六个要素,P.Sonia认为大 多数企业和组织在最初成立之时并未考虑到要进行企业或 组织内部的数据治理,所以在企业或组织中利益相关者并不 了解数据治理的运作模式和实施范围。因此,在数据治理实 施之前,对数据利益相关者进行与数据相关的教育很有必 要,并与其进行充分的交流,了解他们对数据治理效果的期 望。此外.P.Sonia还指出,通过解决实际问题来展示数据治 理的作用,能让大众更好地理解数据治理的重要性和必要 性。张宇杰、吴志刚则是以政务领域为研究对象,分别总结 了政府部门数据治理中的关键要素。
图1D A M A数据治理构成要素
Figure 1DAM A data governance components
此外,数据治理的相关组织机构也深人研究了数据治理 构成要素。其中,DAMA将上述治理的构成要素总结为目标 和原则、技术、组织与文化、活动、主要交付物、角与职责、实践与方法7个方面,并将目标和原则作为核心的组成要 素,如图1所示。DG丨这根据其数据治理流程框架总结提炼 出10个数据治理构成要素,
并以流程图方式展示要素之间
.理论研究.婧報科#
第39卷第1期2021年1月
基金经理面对面
表1数据治理构成要素描述
Table 1Description o f data governance components
学者/机构数据治理构成要素描述
G.M arinos'281 S,Staockdale l w, P.Sonia1301张宇杰等^ 吴志刚等M
DAM A"61
DGI"71提出数据治理的要累有:职责与战略责任、标准、管理盲点、迎接复杂性、跨部门问题、计量,合作,战略控制点的 选择、合规监测、意识与培训。
提出数据治理的5个要素:治理结构、角和职责、数据分类、政策(包括标准和指南)、实施。
提出数据治理的6个关键要素:强劲启动、快速致胜、领导支持、设置资助、效果度量、坚持。
探索政府大数据治理,总结其中要素包括:战略规划、制度保障、组织保障、技术架构、数据管理、治理能力等7 个方面。
总结数据治理5个要素:数据质量、实施能力、组织建设、技术支撑和制度流程。
将数据治理的构成要素总结为:目标和原则、技术、组织与文化、活动、主要交付物、角与职责、实践与方法7 个方面。
提出数据治理的10个基本要素:使命、关注域、数据规则与定义、决策、职责分工、控制、数据利益相关人、数据 治理办公宰、数据管理员.数据治理讨程___________________________________________________________表2数据治理构成要素层次关系
Table 2 Hierarchical relationship o f data governance components
学者/机构目标指引层技术支撑层内容保障层
G.M arinos1281职责与战略责任、战略控制点的
选择合规监测、管理盲点、迎接复杂性、跨部门问题、计
量、合作
标准、意识与培训
S.Staockdale1291治理结构、角和职责数据分类、实施政策(包括标准和指南)P.Sonia1301领导支持强劲启动、快速致胜坚持、设置资助、效果度量张宇杰等^战略规划技术架构、数据管理、治理能力制度保障、组织保障
吴志刚等M制度流程数据质量、实施能力、技术支撑组织建设
DAMA1161目标和原则、角与职责技术、活动、主要交付物、实践组织与文化
西华大学图书馆
DGI1'71使命关注域、数据规则与定义、决策、职责分工、控制、数
据利益相关人、数据管理员、数据治理过程
数据治理办公室
的内在联系,具体如图2所示。
以上数据治理构成要素的描述均是从某一特定角度出 发,具有较为鲜明的领域适用性,无法直接运用于其他领域。为总结数据治理构成要素的一般规律,我们可将以上所 涉及的数据治理构成要素描述划分为3个宏观层次,分别是 目标指引层、技术支撑层和内容保障层。具体划分如表2所 示。通过此三层要素结构,可以将数据治理构成要素研究推 广至更一般情况,在特定领域中结合领域特点,可准确快速 地探究该领域的数据治理构成要素内容。
f t据利益相关人
数据洽理办公室数捶苕埋员
图2 D G丨数据治理构成要素关系1171
Figure  2 Relationship between DGI data gover­nance components117
3.2图书馆数据治理构成要素
图书馆数据治理构成要素是图书馆数据治理成熟度评价的重要依据。文本通过综合考虑图书馆数据处理、数据服 务、数据驱动的特殊性,提炼出针对图书馆特有的数据治理 构成要素及其内在关系。基于上文所述数据治理三层要素 结构,本文综合学者和机构等提出的现有数据治理构成要素 和图书馆的行业特征,总结了图书馆数据治理的11个构成 要素,具体如图3所示。
图3图书馆数据治理构成要素及其关系 Figure 3 The elements o f library data governance and their relationships
其中,目标指引层要素包括目标、战略、框架和责任,它 属于图书馆数据治理的顶层设计部分,即对图书馆数据治理 的技术实现和实施过程具有指引性的作用。目标指引层中 的要素决定了图书馆数据治理将提供怎样的服务,并在图书 馆数据服务中承担何种责任。同时,
目标指引层的内容也具
• Theory Research •IN FO R M A TIO N SCIEN CE区域文化
Vol.39,No. 1January,2021
成熟度等级
优化级會以拽测级
會初始级!
S书据
I治理要《
内咨
技术
〇衫》引《«***
数据处a s s
有明确图书馆数据治理战略和框架的作用技术支撑层要素包括分r.、实施、控制和决策,技术支撑层要素属于图书馆 数据治理数据实现流程,一方面对接目标指引层内容,另一 方面受内容保障层要素影响,起到承上启下的作用。内容保 障层要素包括政策、标准、组织与文化,这些要素数保障图书 馆数据治理正常运行的制度保障和文化影响,决定着图书馆 数据治理的内容范m和行为边界,同时也是驱动图书馆数字 化发展的重要内容。
4图书馆数据治理成熟度评价体系
4.1 C M M模型引入
由美国软件工程研究所(Software Kngineering Institute, SE1)在丨984年开发,容量成熟度模型(Capability Maturity Model.CMM)是--种用于开发和完善组织的软件开发流程的 方法起初,CMM模型主要用于评价软件承包能力及成熟度的标准和改善软件质量。由于其有效的持续过程改进 理念,目前CMM模型已经在项目管理1521、产品开发1〜、人力 资源管理和知识管理M等领域得到广泛研究与应用。阁书馆数据治理本质上是一种打通各部门之间数据障碍,对多 元、异构、海f t的数据进行整合,并为阁书馆的数据服务、数 据管理提供有效的帮助,数据治理构成要素在数据治理过 程中发挥作用,因此从过程角度进行数据治理能力的评价更 为合适..CMM模型同样是从过程的角度评判对象成熟度,这与图书馆数据治理成熟度评价的过程特征相一致因此可以借鉴CMM模型对图书馆数据治理的
发展阶段进行科学 划分.以把握1?1书馆数据治理发展的动态图书馆数据治理 成熟度评价模型的构建,一方面,可以作为图书馆自身数据 治理能力i f价的框架,确定其成熟度发展水平,综合评价阍 书馆数据治理各方面组成要素的成熟度;另一方面,可以为 图书馆数据治理提供改善的路径,指出影响当前数据治理的 关键问题,并确定数据治理的改进方向和提升策略。
4.2图书馆数据治理成熟度模型的构建
(1 )图书馆数据治理成熟度评价模型整体框架
将图书馆数据治理构成要素与CMM成熟度评价模塑相 结合构建图书馆数据治理成熟度模型。图书馆数据治理的 构成要素之间是动态内联发展的.即是数据治理流程中的t 下流关系,乂是共同影响和促进图书馆数据治理成熟度发展 的协助艾系根据L文,图书馆数据治理构成要素按照数据 实施流程分为4个展次,即目标指引层、技术支撑层和内容 保障层,其各层次中的图书馆数据治理要素即为图书馆数据 治理成熟度的过程域从数据处理流程角度出发,数据从数 据收集到决策支持,可划分为数据源、数据仓库、数据应用和 数据展示4个层次。数据源层表示从组织内部各个系统中 获取的多元异构的基础数据;数据仓库层表示将数据源进行 规范化整合,形成可操作数据;数据应用层表示利用•定的数据处理手段对数据进行处理.并获得所需结论;数据展示 是将数据应用层结果进行可视化等操作,以达到决策支持的 效果3借鉴CMM经典的5个成熟度等级:初始级、重复级、已定义级、可预测级和优
化级,分別描述不同等级应达到的 数据治理水平,每一等级逐步发展与提高。结合以1〔阁书馆 数据治理要素、数据处理流程和CMM成熟度等级划分,图书 馆数据治理成熟度整体构建思路如图4所示。
图4图书馆教据治理成熟度整体框架
Figure 4 The overall framework o f library data gov­ernance maturity
丨冬丨书馆数据处理流程数据是图书馆数据服务产出过程,在该过程的每一阶段,对应的图书馆数据治理要素不同,其 成熟度也不同。通过判別每一阶段中不同要素的成熟度, 出图书馆数据治理当前的薄弱环节和可完善之处。
(2)丨¥1书馆数据治理成熟度等级总体描述
①初始级:这一级别中,数据处理流程通常是临时的,环境也不稳定。实践活动中更加反映组织内个人的能力,而 不具备有成熟的流程,组织内即使生成有效的产品或服务, 通常情况下容易超出成本预算和时间期限总体而言,这一 级别可概括为是无意识的数据服务,没有明确的知识服务目 标、服务规范和服务流程。②重复级这一级别中,数据服 务的成功案例是可以重现的,但该案例成功的数据服务流程 无法为阁书馆内部所有项目的数据服务而重复。当项目实 践开始之后,项目就会依据它的计划进行运作和管理。但 是,依然存在容易超出成本预算和时间期限的风险。处于这 一级别的图书馆
已经具备了开展初级数据治理和相关服务 的条件和环境,通过执行经过实践检验的服务流程或惯有的 服务方式可以开展数据治理工作并取得一定的服务效果。
③已定义级这一级别中,组织的数据服务标准流程集将用 于在整个组织:,组织将对标准流程中的项目标准、流程描述 和规程进行调整,以适合特定的项目和部门。处于这一级别 图书馆,能够有效地识別、定义和执行持续提升数据治理能 力④已预测级、这一级别的组织将可以有效的设置流程 和维护的数据质量目标,且系统中能够科学有效的设置子流 程,并为整体的数据治理提供较为重要的帮助3同时,组织 中将使用量化技术来控制数据治理流程和效果。处于这一 级别的阁书馆,有明确的数据治理目标指引,坚实的技术支
._
•理珍研究•
撑和有效的内容保障。⑤优化级,.这是成熟度等级中的最 高级别。这一级别中的组织将运用可量化的流程手段对数 据治理目标进行动态改进,组织中数据治理的目标、流程和 管理手段设置准确得当。处于这一级别的图书馆,各数据源 之间可以达到良好的协作关系,具有优秀的数据处理能力,在数据服务方面能够自我优化,能够灵活应对数据治理发展 过程中的问题。
(3)图书馆数据治理成熟度评价指标框架
从成熟度评价角度来说,成熟度评价指标是构成评价体 系的直接组成部分。图书馆数据治理是以数据服务产出为 最终目的。根据上文描述,图书馆数据产出可分为数据源、数据仓库、数据应用和数据展示4个阶段。每一阶段的效果 都受该阶段中的数据治理要素的影响,即当每一数据治理要 素成熟度越
高,则整体数据治理成熟度越高。因此,根据图 书馆数据治理成熟度整体框架,提出图书馆数据治理成熟度 评价指标框架,如图5所示。
如图5所示,图书馆数据治理的构成要素共同对应着图 书馆数据处理流程的各个阶段。由于数据处理流程的各个 阶段对数据的处理的方式和目标不同,因此数据处理流程的 各个阶段对整体数据处理质量的影响程度不同M。同样地,图书馆数据处理流程的每个阶段对图书馆数据治理整体影 响的程度不同,每一阶段中的各要素对图书馆数据治理整体 影响程度也不尽相同。因此,需要对每一个数据处理流程和 数据治理要素赋予相应权重。
为对应上述图书馆数据治理成熟度等级划分,采用五分 量表对每一个数据处理流程中的数据治理要素进行打分。打分示例如表3所示。
图5图书馆教据治理成熟度指标框架
F ig u re  5 T h e fra m e w o rk o f lib ra ry d ata g o v e rn a n c e
m a tu rity in d ic a to rs
表3数据治理打分示例
T a b le  3 E x a m p le o f d a ta g o v e rn a n c e sc o rin g
目标指引层 技术支撑层内容保障层目标战略框架责任分工实施控制决策政策标准
数据源 A I.I A l J A l.3A l.4A I.5A I.6A I.7A I.数据仓库Au
数据应用A,,……
数据展示A4.,8A|,9A|,|〇A|.||
锖報科勞
第39卷第1期2021年1月
根据实际得分结果,计算图书馆数据治理成熟度水平,
计算公式为:
I I
其中a,表示第i个数据处理流程的权重,尽表示第j个
图书馆数据治理要素权重表示第i个数据处理流程的
第j个要素的得分。
基于上述图书馆数据治理成熟度评价体系,本文采用专
家打分法,邀请领域专家分别为图书馆数据处理流程和图书
馆数据治理要素确定权重,其中处于同一层级的图书馆数据
治理要素权重相同,而不同层级间的图书馆数据治理要素权
重不同。通过计算各图书馆数据处理流程和对应的各图书
馆数据治理要素的权重乘积,结果如表4所示。
表4图书馆数据处理流程和数据治理要素权重
T a b le  4 L ib ra ry d a ta p ro c e ss flo w a n d d a ta g o v e r­
n a n c e e le m e n t w e ig h ts
数据处理流程目标指引层技术支撑层内容保障层
数据源0.080.070.08
数据仓库0.110.080.11
数据应用0.110.080.11
数据展示0.060.050.06
4.3实践调研与分析
图书馆数据治理成熟度评价的一般过程为:首先,通过
专家打分法确定图书馆数据处理流程和图书馆数据治理构
成要素的权重;其次,采用资料收集、访谈法或问卷调查法等
方法,了解图书馆各数据处理流程中各数据治理要素的实际
水平;最终,根据图书馆数据治理成熟度计算公式,计算图书
馆数据治理成熟度。
本文采用问卷调查的方式,向某图书馆工作人员发放问
卷,调查该图书馆数据治理水平。通过对调查结果进行整
理,结果如表5所示。
表5某图书馆数据治理各要素得分表
T a b le  5 S c o re ta b le o f e a c h e le m e n t o f    a l ib r a r y's
d ata g o v
e rn a n c e
数据处理流程目标指引层技术支撑层内容保障层
数据源处理  2.50  2.80  2.07
数据仓库  3.05  3.20  2.67
标准球数据应用  3.20  3.55  2.93
数据展示  2.70  3.15  2.73
从表5中可以发现,技术支撑层要素的平均得分最高,
其次是目标指引层要素,内容保障层要素得分最低。这表明
该图书馆具较好的数据治理相关技术手段,且一定程度上明
确了数据治理实施目标和发展战略,但是数据治理的相关标
准和组织文化尚未成熟。
根据领域专家的权重打分结果和各要素得分情况,计算
得该图书馆数据治理成熟度水平C= 2.38 ,即介于重复级和
已定义级之间,这说明该图书馆目前尚未形成较为完整的数
不可知论69
丁香人妻小说

本文发布于:2024-09-21 19:04:49,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/442077.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   治理   图书馆   要素   成熟度   流程
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议