美国海洋科学数据管理政策现状与启示

Doi:10.19661/jki.mi.2019.04.001
!前沿动态】
美国海洋科学数据管理政策现状与启示
赵强I"#,于凯本$
(1.自然资源部第一海洋研究所海洋沉积与环境地质国家海洋局重点实验室青岛266061;
2.青岛海洋科学与技术试点国家实验室海洋地质过程与环境功能实验室青岛266061;
3.国家深海基地管理中心青岛266200)
摘要美国科学数据的管理走在世界前列,本文以美国海洋科学数据管理政策为研究对象,对美国海洋数据管理的政策法规体系的演变过程进行了梳理,对不同科研机构的具体数据政策进行了分析比较。结果表明,美国海洋科学数据管理中"开放共享”的指导思想、完善的法规体系以及在数据存储、保护、引用等方面的经验做法,可为我国海洋强国建设过程中创新海洋科学数据的管理方式提供有益的借鉴。
关键词数据管理;海洋科学;开放共享
中图分类号C931
Review of the Marine Scientific Data Management in the United States of America
产业结构理论
ZHAO Qiang1"2,YU Kai-ben3
(1.Key Laboratory of Marine Sedimentology and Environmental Geology,First Institute of Oceanography,Ministry of
Natural Resources,Qingdao266061,China;2.Laboratory for Marine Geology,Qingdao National Laboratory for
Marine Science and Technology,Qingdao266061,China;3.National Deep Sea Center$Qingdao266200,China)
Abstract The management of scientific data in the United States of America is at the forefront of the world.This paper takes the management policy of marine scientific data in the United States as the research object,sorts out the evolution process of the policy and regulation system of marine data management in the United States,and analyzes and compares the specific data policies of different scientific research institutions.The results show that the guiding principle of"open and share"in the m
anagement of marine scientific data in the United States,the well-developed legal system and the experience and practice in data storage,protection and citation can provide useful reference for innovating the management mode of marine scientific data in the process of building China into a maritime power.
Keywords data management;marine science;opening and sharing
随着海洋科技的深入发展,海洋科学数据的累积呈爆炸性增长%在“数据密集型科学发现”成为科学研究的新范式的时代,科技创新越来越依赖数据,但科学数据管理在我国长期被视为“短板中的短板”。2018年3月,国务院办公厅印发《科学数据管理办法》[1b,至此,我国才终于有了第一部国家层面的类目数据管理办法,但相关的制度建设仍在制定和完善%相对而言,美国作为当今世界第一海洋科技强国,同时也是许多国际重大海洋科技计划的倡导者和领导者,其在海洋科技数据的管理领域所积累的成功做法值得借鉴%
收稿日期:2019-09-11
项目支撑:青岛海洋科学与技术试点国家试验室鳌山科技创新计划项目子课题深海专项总体规划与科学管理研究(2016ASKJ11-ZRW
04);泰山学者工程专项项目(tspd20161007)%
||2019年第4期1||
1美国海洋科学数据管理的法规体系
美国对海洋科学数据的管理主要是通过一系列的法律法规来进行,可分为国家立法和政府部门规章两个层面"《信息自由法案》何《开放政府法案》冋和《开放政府数据法案》是美国与海洋科学数据管理有关的主要法律%美国国会还通过立法来保障一些重大科技计划的执行,如&1990年美国全球变化研究法案》同和《近岸和海洋观测系统综合法案(ICOOSAct)》问等%此外,美国政府还通过通告、政策指令、备忘录、总统令、倡议和政策等形式来发布与科学数据管理有关的规定,如《A-130通告》《透明和开放政府备忘录》《开放政府指令》《政府数据开放倡议》《开放数据政策》以及《美国数据开放行动计划》等[7-12]o美国政府要求各个部委和有关单位均制定本部门的数据和信息管理政策,以落实国家政策和法令%美国具体的海洋科技数据管理政策主要由美国海洋与大气管理局(NOAA)制定,美国自然科学基金委(NSF)对其所支持的涉海研究项目也制定有相应的数据管理政策%NOAA在2010年发布的《下一代战略规划》问中提出了数据管理体系建设的战略构想,成立NOAA环境数据管理委员会(EDMC),并同年发布了NOAA212-15号行政令(《环境数据与信息的管理》)网,为数据管理提供决策和行动指南%2011年,NOAA环境数据管理委员会发布了《数据文档指南1.0》版%2013年3月,NOAA发布了“环境数据管理框架”(EDMF)文件问,作为数据管理的依据。该框架对NOAA 环境数据管理的原则、组织架构、法规体系、人员经费及其他资源、标准、架构
、评估和数据生命周期等方面进行了定义。NAO212-15为EDMC提供开发和批准程序指令(PDS)的权限。除了NAO212-15行政令及数据管理委员会的EDMF之外,NOAA环境数据管理Wiki购中公布了有关政策、标准和工具的指导方针、最佳方案及相关信息,旨在帮助用户到资源并连接到其他人,以便改进环境信息的访问、互操作性和可用性。
||22019年第4期||
信任代理2013年2月,白宫科技政策办公室(OSTP)发布“推进联邦资助研究成果的开放”的备忘录呵%作为对该备忘录的响应,2015年2月,NOAA研究理事会制定了“促进公众获取研究成果的计划”(PARR)两%计划的重点是建设当前的技术基础设施,以及完善数据共享%同时,NOAA环境数据管理委员会(EDMC)又更新了“NOAA项目资助与合同的数据与出版物共享指南”(3.0版)凹%作为对2016年《开放政府数据法案》的响应,2017年,NOAA环境数据管理委员会又发布了新版的《数据文档指南(2.0版)》㈣,确保NOAA环境数据是用机器可读的元数据记录,以实现这些资源的检索、访问和使用%同年,美国国家科学基金会(NSF)海洋科学司(OCE)颁布了新的样品与数据管理政策(NSF17-037)的,以取代2011年颁布的NSF 11-060管理办法%
2美国海洋科学数据管理的特点
2.1数据管理的基本原则
NOAA要求所有数据的管理都应当遵循完全开放、长期保存、保证质量和易于使用的原则,某些特定的数据(如专有或机密数据)除外%“NOAA项目资助与合同的数据与出版物共享指南(3.0版)”#19%中指出“数据共享”是指以不产生任何成本(或不超过复制成本)的方式能及时查询、访问和正确使用基于开放标准的、机器可读的元数据%特别的是,NOAA资助项目必须事先考虑如何确保成果数据的公众可访问性和长期保存,为申请人制定数据访问计划提供指导,并将之作为获得资助的强制条件%
NOAA要求数据从采集到公开应尽可能缩短延迟的时间,并贯彻非歧视原则,除了法律、商业协议或出于国家安全等原因禁止的数据,NOAA的数据应以不妨碍访问的形式分发,使其得到最广泛的传播%科学数据被视为国家财富,特别是许多地球观测不仅成本高昂且不可再现,例如卫星、船舶、飞机、先进传感器、公海浮标及现场观测等%NOAA认为这些观测资料应作为机构和国家资产进行妥善管理和保存,数据要确保原样保存且持续可用,防止发生意外或被恶意
修改。NOAA要求确保环境数据和元数据的质量优良,并要求在数据报告中对质量控制(QC)过程以及质量评估本身进行说明%为了鼓励数据得到广泛的传播和使用,要求数据管理机构创建各种条件,使用户能够便捷地通过搜索引擎、目录&门户网站或其他方式容易地到各类数据观测结果和派生产品。通常是通过Web服务或者其他基于互联网的机制来提供和访问数据,而非通过传递物理媒介或建立专用或专有的链接。这些服务应符合地理空间数据的非专有互操作性规范,数据应以已知的格式提供,以通用的支持工具工作,使用通用的词汇表&语义和数据模型,并能接收用户的反馈以改进服务。抽象函数
作为众多海洋科研项目的资助和管理机构,美国国家基金委(NSF)海洋科学司(OCE)关于海洋数据管理与传播的理念体现在(NSF资助与管理指南》122.中%凡是在NSF资金资助下获取的数据&样品&实物收藏和其他辅助材料,都要在合理的时间内,在无须增加额外成本的前提下与其他研究人员和公众分享%自2011年始,NSF 便要求所有项目申请都要提交专门的数据管理计划㈣,并作为项目申请书的一部分进行审查,其中需要详细说明的是:项目将收集哪些数据或样本,将进行哪些分析,以及项目将如何提供数据&样本及派生数据产品(例如模型和模型输出)的公开而快速的访问,以及在项目执行期间和完成后的其他相关信息%
2.2数据的全生命周期管理
寿亲养老新书NOAA的数据除了自身提供之外,还有大量来自国际合作伙伴、商业企业、教育机构和其他联邦机构,这些数据原则上是按照NOAA的标准来统一进行管理%NOAA下设的国家气候数据中心(NCDC)、国家地球物理数据中心(NGDC)和国家海洋数据中心(NODC)3个国家数据中心接收来自各方的数据%2015年,美国《合并与持续拨款法案》㈣批准NOAA将3个数据中心合并为国家环境信息中心(NCEI),使该中心具有全面的海洋&大气和地球物理数据,以应对高价值环境数据和信息需求急剧增加的压力%
NOAA对数据实行全生命周期的管理,主要包括数据的规划和生产活动&数据管理活动和应用活动3个
阶段问%其中,“数据的规划和生产活动”包括评估新观测系统的需求和要求,规划如何满足这些要求以及如何管理结果数据,开发任何必要的传感器,部署观测系统以及进行观测系统的操作和维护等任务。“数据管理活动”涵盖了数据采集&处理&质量控制、数据报告&数据分类、发布、保存、管理权、使用追踪到最终的处理的各个环节%作为第三阶段的“应用活动”通常超出数据管理员影响的范围,用户获取数据后对数据的使用通常是未知和不可控的%即便如此,改善用户获取和使用数据的能力是优秀的数据全生命周期管理的必然要求,而且来自用户或关于用户的信息可能会影响或改善数据管理的过程%NOAA是其自身数据的最大用户,因此数据管理过程的改进还可以降低管理的成本和复杂性%“应用活动”阶段的具体内容包括:用户必须能够到和获取他们想要的数据;用户可对数据进行科学分析,并对数据的有用性做出快速地评估;用户还可以借由NOAA数据创建衍生品或增值产品;用户还能够对NOAA数据的可用性、质量问题及其他方面的问题进行反馈;数据集产品还应被模型&决策或科学论文明确引用;能实现数据集的可标记以及差距分析%
2.3专业的数据存储机构
美国建立了多级的专业存储机构来实现数据与样品的存储,主要分为联邦国家数据中心&各类数据管理中心、其他数据存储机构以及实物样品库4类㈣%存储库为数据集提供存储和访问平台,支持标准化的数据质量控制和完整的全生命周期管理%
联邦国家数据中心有国家环境信息中心(NC EI)、国家冰雪数据中心'NSIDC)、二氧化碳信息分析中心'CDIAC)%其中,美国国家环境信息中心接收全面的海洋、大气和地球物理数据;国家冰雪数据中心主要接收海冰和其他冰川数据,如海冰&冰山&冰架和相关的物理海洋学和气象数据;国家二氧化碳信息分析中心主要接收世界海洋环流实验(WOCE)和联合全球海洋通量研究(JGOFS)的二氧化碳测量数据%
汽车机械
在国家数据中心之外,经NSF批准和授权,美国还设立了其他各类数据管理中心以进行特定数据资料的存储%如生物和化学海洋学数据管理办公室(BCO-DMO)负责管理来自个别科学研
||2019年第4期3||
究人员和合作研究小组的海洋学数据,使数据可以公开获取,并将它们上交给适当的国家数据管理中心来进行永久保存°BCO-DMO定期处理来自海洋、海岸和大湖研究的所有观测和测量,包括CTD、生物丰度、气象、营养、pH、碳酸盐、PAR、海面温度、热量和动量通量、沉积物成分、微量金属、初级生产力和素浓度数据等的实验和模拟结果以及它们的图像和影像数据。海洋地质和地球物理的数据中心和存储库有多个°其中,跨学科地球数据联盟(IEDA)接收来自固体地球(除OBS之外的海洋地球物理数据、岩石学、沉积地球化学、地质年代等数据)以及软件、地图、衍生资料、模拟结果等资料,与项目负责人合作完成数据质量控制,生成联邦机构所需的元数据,进而提交给多个联邦国家
数据中心和哥伦比亚图书馆来进行深度存档。地震联合研究协会数据管理中心(IRIS DMC)接收来自海底地震仪(OBS)的数据,在此之前由OBS 设备管理办公室完成数据筛选和质量控制工作°NOAA古气候学世界数据服务处(NOAA-Paleo)保存和分发世界各地科学家提供的各种古气候和古海洋学数据。地磁信息联盟(MagIC)主要接收国际古地磁、地磁和岩石磁学数据。地球表面动力学建模系统(CSDMS)存储了许多不同类型的地球表面过程和沉积物分布模型。国家深潜设备(NDSF)(如阿尔文深潜器、杰森遥控潜水器、哨兵水下机器人)收集的数据存储在拉蒙特-多尔蒂地球观测平台负责托管的IEDA海洋地球科学数据系统中,NDSF的图片和视频资料则存储在其运行管理的机构一伍兹霍尔海洋研究所。气候变化与预测和碳水文数据办公室(CCHDO)是为数据质量控制和数据合成设立的数据组装中心,将代表项目负责人向国家数据中心(如NODC)提交最终的数据集,其数据提交要求与世界海洋环流实验(WOCE)类似。
在NSF的批准下,其他一些存储机构也可以提供数据的存储服务。如海洋生物地理信息系统(OBIS)可以提供物种级生物数据的存储,OBIS允许参与者开发并为自己的数据提供服务,是一个社区开发的全球海洋动植物分布数据库。美国国家生物技术信息中心(NCBI)是美国国立卫生研究院(NIH)的一个机构,负责管理基||42019年第4期||因银行(GenBank)和其他分子数据库基因数据的存储。
美国实物样品库包括沉积物和岩石样品库以及海洋藻类和微生物存储库,以保证这些成本高昂的实物样品得到妥善的保存,在科学界发挥更大的价值和作用。NSF批准的海洋样品存储机构有:拉蒙特一
多尔蒂地球观测站、俄勒冈州立大学、罗德岛大学、伍兹霍尔海洋研究所、斯克里普斯海洋研究所。有价值的菌藻类样品则在普罗瓦索利一吉拉德国家海洋藻类和微生物中心(NCMA)存储。
2.4数据的保护期设置
NOAA鼓励数据的“及时”共享。所谓“及时”是指不迟于基于数据的文章的发表,或不迟于收集和数据验证后两年,或不迟于初期资助结束后两年(不包括任何延期或后续资助),除非得到NOAA的授权延期,将以其中最快的为准凹。
NSF亦鼓励其资助的研究人员在“合理时间”内向其他研究人员或大众分享他们的数据、样品或其他支撑材料。NSF海洋科学司要求元数据文件、完整数据集、派生数据产品和实物样品必须在两年内可公开获取,这包括软件和数据衍生产品。任何数据、样品等的保护期如果超过两年,必须在申请书的数据管理计划预做说明并提供有说服力的理由,或得到项目主管官员的认同A叫
NOAA要求数据采集后在最短的时间内公开。自动传感器的常规、持续观测应在数据处理、传输等造成的延迟后立即可用,如IOOS的传感器数据都是近实时公布"海洋地质样品的元数据(包括归档位置)必须在航行后60d内提交给相应的国家数据中心和IEDA"如美国大陆边缘研究计划(MARGINS)的基本元数据(如数据类型,样品类型,取样位置,航次信息等)必须在调查结束之后60d之内提交给MARGINS数据管理系统(DMS),并可在MARGINS数据管理系统网站(/ma
rgins/)下载,可被所有获得MARGINS基金资助的项目负责人使用㈣"尽管CLIVAR数据也设有两年的保护期,但是多个CLIVAR项目,如碳/全球水文调查均要求首席科学家在数据采集后的6个月内
即向CLIVAR和碳一水文数据办公室进行提交叫IODP则为数据和样品设置了为期1年的保护期何,参与一线工作的科学团队成员可以优先获得样品和数据。
水产大学2.5数据的引用
科学数据和学术论文同样重要,科学数据引用可以促进科学数据的共享和再利用,助推科学研究的进程㈣,因而科学数据需要被正确的引用和评价!科学数据引用的对象主要都是数据集。2014年2月,“数据引用共同原则”(Data Citation Synthesis Group&[2E+最终版发布,提出了数据引用的8条原则,到2014年底已被国际科技数据委员会(CODATA)、DCC、美国国家科学、工程和医学学院以及哈佛大学社会科学研究所等超过85个机构、出版商和数据仓储支持和采纳。
2015年5月15日,NOAA环境数据管理委员会(EMDC)批准了《数据引用程序指南》(1.1版)本指南规定了获取NOAA国家环境信息中心(NCEI)存档数据的永久标识符的要求,创建提供数据集信息和访问说明的登录页面的程序,以及对内部和外部用户引用NOAA数据的建议。指南讨论了这些标识符的用途和语法、数据收集的适当粒度级别、如何获取标识符、登录页的内容以及推荐的数据引用格式,由NOAA 环境数据管理委员会负责实施、跟踪和维护。该指南于2015年6月1日正式生效,NCEI
将根据可用资源的优先级和需要逐步开展标识符的分配工作。指南要求应至少每季度向EDMC和首席信息官的NOAA办公室报告分配的NOAA DOI 的数量,以纳入机构开放政府指标报告。NOAA 中央图书馆还应收集出版物中引用NOAA数子标识符的统计数据,并至少每季度向EDMC报告一次,并规定该指南将至少每3年审查一次,根据EDMC或指定工作组的需要来进行修订,
3借鉴与启示
3.1贯彻开放共享的管理理念
“开放共享”是美国海洋科学数据管理的核心理念。早在20世纪90年代初,美国便将科学数据共享作为实施科技领先战略的重要保障的。1991年颁布的“美国全球变化研究数据政策七条”中首次提出“完全与开放”的科学数据共享政策。克林顿政府时期,美国确立了在国家层面上建设国有科学数据和信息全社会共享环境的战略部署図。自2000年《联邦政府信息资源管理通告》(A-130通告&颁布以来,美国政府致力于将一切由联邦政府创造、收集、处理、传播、处置的信息免费开放给所有人使用及再利用。2009年,美国政府发布了《政府数据开放倡议》,要求政府各部门发布可机读的标准化高价值数据,以更好地为社会经济服务。自2010年奥巴马政府发布A-130号通告以来,短短的数年间美国联邦政府已经发布近10项政策、行动计划、执行命令来保障政府数据开放的实施㈣,使得美国政府数据的开放达到了前所未有的高度与广度。2016年,美国国会又通过了《开放政府数据法案》,对于公开数
据的机器可读性、可检索性和开放性格式等方面进行了规定,旨在进一步扩大政府对数据的使用和管理,以便增强信息透明度并提高政府管理的有效性网。美国对科学数据的共享管理已经进行了近30年的制度建设,通过各项法规、政策持续推动科学数据共享的理念落到实处,完全、公开、无歧视地向社会提供共享服务。美国科学数据开放共享的政策呼应了时代的需要,极大地推动了美国科技数据的使用效率和科技创新的步伐,彰显了美国的大国气度,提升了美国的国际形象和吸引力,为美国不断引领全球科技的发展注入了强大动力。
相对而言,我国科学数据的共享长期以来不尽人意,饱受批评,被视为“短板中的短板”。直至2018年的《科学数据管理办法》中才首次在国家层面提出了“开放为常态,不开放为例外”的共享原则。但是,我国《科学数据管理办法》中的数据共享理念是在新时代改革开放和“加快建设海洋强国”的背景下提出的。面对新时代的机遇和挑战,我国提出了“人类命运共同体”的理念,并将之写入《宪法》,“遵循共商共建共享原则,推进-一带一路’建设”已写入 中国共产党的章程。习近平总书记在《改革开放40周年讲话》中指出,要“实行积极主动的开放政策,形成全方位、多层次、宽领域地全面开放新格局”。这些国策方针将在最高层面上指引我
||2019年第4期5H

本文发布于:2024-09-22 09:37:33,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/364747.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   海洋   科学   数据管理
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议