洋基础科学数据库及其信息管理系统的建立

海洋基础科学数据库及其信息管理系统的建立
栾振东1  阎  军  代亮  范奉鑫  陈长安
(中国科学院海洋研究所,青岛 266071)
提要  探讨了把GIS技术和空间数据仓库技术引入正在建设的海洋基础科学数据库及其信息管理系统中,从空间数据仓库的技术手段上阐述了建设海洋基础科学数据库及其信息管理系统的构想和实现方法。
关键词:海洋基础科学数据库,信息管理系统,空间数据仓库,GIS
奥迪氏
1、 建立海洋基础科学数据库及其信息管理系统的必要性
  随着信息技术的飞速发展,数字地球的观念深入人心,各发达国家纷纷竞相投入巨大的人力、财力进行开发和研究。数字地球基础平台是多维、多种分辨率,能嵌入巨大数量的地理数据、属性数据和多媒体数据等。构成数字地球的数据的基石是可以具有空间信息属性的空间数据库,数字海洋则是数字地球的重要组成部分。在我国,海洋学的研究,已经经历了近百年的时间。建国以来,各相关单位在我国海域和大洋地区相继开展了多次大规模的海洋调查研究工作,积累了丰富的资料。随着以信息化技术为代表的高新技术的应用,例如遥感、多波束探测等,使得海洋研究数据呈指数规律爆炸性增长。海洋学是一门综合性极强的学科,涉及众多的领域,而以上每一领域又包括了众多的研究方向和研究手段,在海洋
刚果埃博拉疫情
科学研究领域中,从资料采集、数据处理到研究方式都发生了巨大的变化,如何从浩瀚的资料中快速提取所需的信息用于特定研究目的,是摆在科研人员面前的重要问题。
  近几年来.我们已开发的数据库系统基本上是面向事物处理的简单管理信息系统.随着海洋信息需求的日益广泛、复杂和迫切、这些传统的数据库系统存在的问题也越来越明显[1]:
(1)数据系统随机性的综合信息提取功能差;(2)原有数据库系统是面向事物处理而非面向分析处理的;(3)原有系统难以适应研究对象对数据的要求。
  地理信息系统(GIS)技术作为一种利用计算机对地球空间数据进行采集、存储、检索、查询、分析、建模 和表示的有效工具,不仅能够管理属性数据及空间数据,而且能够进行各种空间分析。自20世纪60年代中期,加拿大建立起世界上第一个地理信息系统(CGIS, 主要用于土地资源管理)以来,GIS在应用和技术方面都有了飞速的发展,在测绘、制图、环境及资源管理等传统领域有了更深入、更广泛的应用。随着海洋科学的不断发展,信息的大量增加,GIS技术已成为海洋科学研究中不可缺少的组成部分,在海洋科学研究与管理的各个领域发挥愈来愈重要的作用[2]。空间数据
仓库技术是近几年才兴起的一门新技术。空间数据仓库就是面向主题的、集成的、稳定的、不同时间的空间数据集合,用以支持空间信息管理中的决策制定过程。自二十世纪90年代开始对海洋基础数据信息管理系统研究至今已有十余年的历史。最初的海洋基础数据信息管理系统是基于数据库、数模库
的系统结构。实践证明,这种系统结构很难做到内在的统一和完整,加上缺乏面向最终用户的决策支持工具.多年来-直处于理论探讨和实验阶段,没有取得实质性进展。近年以来,国外兴起的空间数据仓库(Spatial Data Warehousing)技术、联机分析处理(OLAP)技术及数据挖掘(DM)技术为海洋信息决策管理系统的研究和系统开发提供了一条新的途径,将海洋研究推向了实用化阶段。空间数据仓库是现代计算机系统信息处理技术的热点之一[1].更是计算机应用领域里的一个崭新方向。空间数据仓库以集成的、全海洋行业范围的历史数据作为坚实的基础,把行业的原始操作数据和来自外部的数据汇集和整理成数据库,在此基础上通过通畅、合理、全面的信息处理.使最终用户从数据仓库提取数据.进行各种数据分析。可以迅速准确地对某一海域的科学研究、资源开发、利用和管理、环境监测与保护,油气生产宏观调控、及港口建设等提供基础数据,为各种方案的分析比较和重大战略决策提供信息服务。面向分析处理(oLAP)、支持数据的多维分析与挖掘(DM)、支持决策系统是数据仓库的主要持征,就是将空间数据仓库技术与空间数据挖掘技术运用到海洋基础科学数据库及其信息管理系统中来[2]。
  当代海洋学问题的提出和解决常常要求多学科多部门之间的协作。因此,空间信息的共享与互操作、分析与综合在对于海洋学问题的综合研究中便显得日益重要。
2、 海洋基础科学数据库及其信息管理系统的主要内容
  海洋信息有明显的空间信息特点和多用途的服务对象。利用数据库和地理信息系统(GIS)技术建立空间数据库是解决这一问题的途径之一。健全的海洋基础科学数据库及其信息管理系统可以迅速准确地对某一海域的资源开发、利用和管理、环境监测与保护,油气生产宏观调控、及港口建设等提供基础数据,为各种方案的分析比较和重大战略决策提供信息服务。其信息具有类型多、数据量大、来源多、获取代价大等特点。
  目前各研究、生产和其它相关机构基于不同的目的,已经和正在建立各种各样的海洋空间数据库,这为历史资料的查询和资料存储、更新提供的很大的方便。正在建设的海洋科学数据库包括:物理海洋基础数据库、
海洋地质基础数据库、环境物理参数数据库、海洋遥感数据库、海洋生物数据库等(见图1);完成后数据量可达400GB以上。冰川冻土
  图1  海洋科学数据库结构框图
唐溶
  由于现在的GIS技术是一种面向空间数据管理及处理的技术,因此这就要求资源与环境信息系统设计中首先建立资源环境信息向GIS空间概念的影射关系,其空间特征的正确表达是最重要的[5]。海洋基础科学数据库及其信息管理系统对数据的管理是基于图层的,并通过关键字段将空间数据和属性数据连接起来[3]。为了能对数据合理地分层,首先必须进行合理地分类,设立主题、亚层主题等。其次,
应对每一层的空间符号(点、线、面)进行定义,制定出合理分类、分层体系。属性数据通常用来反映与空间实体对应的属性,一般是通过分类、量算、命名、统计等方法得到的。海洋基础科学数据库及其信息管理系统主要内容包括栅格数据和矢量数据的输入、存储,地理数据的操作和分析(矢量数据空间分析和栅格数据空间分析)、将用户查询的结果或是数据分析的结果以合适的形式输出[1]。
  海洋基础科学数据库及其信息管理系统栅格数据和矢量数据的质量控制方法及标准:各专子库都包括一个质量标准表,含质量标志码、质量级别、数据精度、说明等信息,数据库中业每条数据记录都含有质量标志描述,具体标准将根据各专业历史及现状,用户需求而定。质量控制过程采用分阶段(粗筛与精筛)自动与人机交互相结合,以确保数据入库的质量与速度。
  海洋基础科学数据库及其信息管理系统的进一步开发,就是将空间数据仓库技术与空间数据挖掘技术运用到海洋科学数据库及其信息管理系统中来,通过空间数据仓库技术、空间数据挖掘技术、元数据管理技术、网络技术以及地理信息系统(GIS)技术,将不同来源、不同格式的空间数据库资源有机结合起来,为用户提供统一、友好的界面,以人机交互方式实现海量数据的海洋科学信息分析系统,将极大的提高海洋科学信息的使用效率。
3、 海洋基础科学数据库及其信息管理系统的结构设计
3.1资料预处理(数据抽取)
由于历史的原因及各类资料采集设备的不同,原始资料的数据结构与格式和应用标准间存在着很大差异,需要编制相应的资料预处理软件对其进行抽取、整理、转换等处理;另外还要将需要的图件及模拟资料数字化;数据的抽取是数据进入仓库的入口。由于数据仓库是一个独立的数据环境,它需要通过抽取过程将数据从
联机事务处理系统、外部数据源、脱机的数据存储介质中导入到数据仓库。数据抽取在技术上主要涉及互连、复制、增量、转换、调度和监控等几个方面。数据仓库的数据并不要求与联机事务处理系统保持实时的同步,因此数据抽取可以定时进行,但多个抽取操作执行的时间、相互的顺序、成败对数据仓库中信息的有效性则至关重要。在技术发展上,数据抽取所涉及的单个技术环节都已相对成熟,其中有一些是躲不开编程的,但整体的集成度还很不够。目前市场上所提供的大多是数据抽取工具。这些工具通过用户选定源数据和目标数据的对应关系,会自动生成数据抽取的代码。但数据抽取工具支持的数据种类是有限的;同时数据抽取过程涉及数据的转换,它是一个与实际应用密切相关的部分,其复杂性使得不可嵌入用户编程的抽取工具往往不能满足要求。因此,实际的数据仓库实施过程中往往不一定使用抽取工具。整个抽取过程能否因工具的使用而纳入有效的管理、调度和维护则更为重要。
3.2 数据存储和管理系统
  对大量数据的存储和管理,这里所涉及的数据量比传统事务处理大得多,且随时间的推移而累积。从现有技术和产品来看,只有关系数据库系统能够担当此任。关系数据库经过近30年的发展,在数据存储和管理方面已经非常成熟,非其它数据管理系统可比。目前不少关系数据库系统已支持数据分割技术,能够将一个大的数据库表分散在多个物理存储设备中,进一步增强了系统管理大数据量的扩展能力。采用关系数据库管理数百个GB甚至到TB的数据已是一件平常的事情。数据仓库要解决并行处理问题,在传统联机事务处理应用中,用户访问系统的特点是短小而密集;对于一个多处理机系统来说,能够将用户的请求进行均衡分担是关键,这便是并发操作。而在数据仓库系统中,用户访问系统的特点是庞大而稀疏,每一个查询和统计都很复杂,但访问的频率并不是很高。此时系统需要有能力将所有的处理机调动起来为这一个复杂的查询请求服务,将该请求并行处理。因此,并行处理技术在数据仓库中比以往更加重要,主要包括数据的录入、维护、查询等功能。录入模块将预处理过的数据资料经筛选、质控检验入库;维护模块负责对入库数据进行修正、剔除等操作;查询模块可查询输出已入库数据内容。系统是面向数据管理与操作人员的。通过系统可保证数据准确无误的入库。
3.3数据服务系统
 系统包括信息发布、数据咨询服务等功能,是面向最终用户的。乌龙学院
3.4海洋基础科学数据库及其信息管理系统的工作流程(图2)
                        有错
图2 海洋基础科学数据库及其信息管理系统的工作流程图
斯蒂文斯4、 海洋基础科学数据库及其信息管理系统采用的主要技术
  数据仓库技术并不是一种市场上现成可买的软件产品,但许多软件生产厂商都提供相应的数据仓库解决方案,并开发了相应的数据仓库开发支持软件工具产品。使用这些软件产品可以方便地根据自己应用需求构建相应数据仓库。下面是市场上可见的几种数据仓库解决方案:(1)Infomax数据仓库产品;(2)Sybase数据仓库产品;(3)Oracle数据仓库解决方案及OLAP产品技术分析。数据仓库技术理论日趋完善,国内外在企业界已经有了广泛的应用,成功开发出了许多基于数据仓库的应用系统[4]。
  联合和交叉是未来学科发展的方向。海洋科学也不例外。用于只能采集、存储、管理、利用海洋信息资源的海洋基础科学数据库及其信息管理系统必然要面临解决一系列新的问题,虽然现在要描述一幅完善的未来蓝图尚有困难,但一些方向已日渐明朗。首先对目前所拥有的数据库进行面向主题的数据"仓库化"处理.在此基础上进行应用系统的多次开发,因而在技术上可以根据它的工作过程分为:数据的抽取、存储和管理、数据的表现以及数据仓库的设计的技术咨询四个方面。
  由于海洋信息中的数据具有多来源性,这就决定了网络技术和分布式数据库技术会在今后的海洋信息系统发挥日益重要的作用,加上数据仓库技术,可将海洋基础科学数据库及其信息管理系统组织为图3所示的整体结构。数据仓库数据库,是整个数据仓库环境的核心,是数据存放的地方和提供对数据检索的支持。相对于操纵型数据库来说其突出的特点是对海量数据的支持和快速的检索技术。元数据是描述数据仓库内数据的结构和建立方法的数据。元数据是数据仓库的设计和管理人员用于开发和日常管理数据仓库是用的数据。包括:数据源信息;数据转换的描述;数据仓库内对象和数据结构的定义;数据清理和数据更新时用的规则;源数据到目的数据的映射;用户访问权限,数据备份历史记录,数据导入历史记录,信息发布历史记录等。元数据为访问数据仓库提供了一个信息目录(information directory),这个目录全面描述了数据仓库中都有什么数据、这些数据怎么得到的、和怎么访问这些数据。是数据仓库运行和维护的中心,数据仓库服务器利用他来存贮和

本文发布于:2024-09-24 15:19:20,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/283126.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   海洋   数据仓库   数据库   技术   空间   信息   研究
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议