ZY-仓库演播室(1)

Warehouse Studio
Warehouse Studio是Sybase为其建树性数据仓库平台起的名字,它用来进行数据仓库设计、多数据源集成、以简便的方式实现数据管理、数据的具体化和管理整个环境。Sybase数据仓库方案可以拓展成为某个指定应用需求服务,这样的一些附加性能将在下文中加以描述。
    图四:Sybase数据仓库产品包可用于建立数据仓库和数据集市
经过不断的努力,Sybase已经拥有了一个数据仓库建立方法,既可以支持数据集市又可以支持集中式数据仓库的建立。Sybase的Adaptive Server数据库管理系统其关键的保证组件,表现为一个称为Adaptive Server IQ的高性能决策支持优化数据库,一个称为企业级Adaptive Server的企业级联合数据库以及对已有DBMS进行集成的连接组件。
对这些数据库的集成以及对元数据的高度集成和管理是Sybase能有效地支持数据集市和集中式数据仓库建立的主要原因,这种建立可以快速地实现,花费也是有效的。Sybase的另一个重大成果是它将一系列简单易用、强大和自动化支持工具进行集成,减轻了系统集成难度,加快了实现过程。
Sybase的数据仓库建立方法是由业务应用逆向进行,从数据集市开始建立企业体系结构。在开始时,为了使企业的需要与那些已建立有效数据集市的单个部门保持一致,Sybase提供了一个体系框架和一套自动化产品集。与大多数数据仓库供应商比较起来,Sybase的数据集市方法、支持技术和方法能够提供更大的灵活性、可扩展能力、高性能和有效成本。在不牺牲各自利益的前提下,它可以帮助你避免因每个部门建立一个分离的数据集市而带来的混乱。
这种方法的基础是贯穿于数据集市开发进程中的元数据的采集和提炼。因而,使用了Sybase后,你可以建立独立的数据集市,具有一个共同的基础逻辑数据模型,在当前或将来允许你构筑一个多层的数据仓库环境。在这一体系结构中,一个中央数据仓库建立功能函数被作为一层置于所有数据集市之上,支持它们的共同需求。例如,中央层将作为一个从数据源中进行数据抽取和数据转换的共同位置。在这个方案中,你可以将一套非依赖性数据集市重构为从一个共用数据仓库获得信息的依赖性数据集市系统。
下面将介绍Warehouse Studio提供的建立和完成数据仓库的功能和附加工具产品。
设计和建模
   
虚拟演播室系统方案
WarehouseArchitect
在任何一个企业体系中,关键的是要定义可在应用之间进行共享的数据元素。每个数据集市都需要尽可能迅速地建立起来,以适应单个应用需求,然而,IT部门必须具有一种企业级的眼光和拥有一个可扩展的元数据模型。
    对于数据仓库数据设计来说,PowerDesigner WarehouseArchitect是个高度优化的数据库工具,广泛用于数据源的逆向工程、建模、数据仓库方案设计,以适应每个业务需求。通过对逻辑设计、物理设计和应用建模进行集成,WarehouseArchitect方便了数据仓库的开发和实现。
    利用WarehouseArchitect,数据集市或数据仓库设计者可以自动地对产品数据库进行逆向工程,建立目标数据库设计、物理设计和DDL。它能够支持包括星形模式、标准/非标准化ER图和聚集等级模式在内的所有业务模式,Wizards工具可以帮助数据库设计者对一个模式进行创建或修改,以最好地适于业务需求或业务模型。一旦产生了一个数据库,数据仓库体系可以直接从数据库设计生成数据仓库应用,或者使用一种流行的的分析系统,或者通过生成Web页模板。这些都可以在单一WIN95图形环境中实现。
    所有的设计、DDL和元数据都被存放在中央数据仓库里。这使得IT部门可以对设计进行不断修改,对先前的模式数据库进行重用和重构。一个效果分析模块被用来帮助开发者在数据集市中识别共用数据元素,以保障企业数据集市体系的坚固一致性。
数据集成
    在进行数据仓库或数据集市的建立时,最大的挑战之一是如何将原始业务数据转化为一致的格式,使之更好地为决策支持服务。这包括对已有数据的准确性和一致性进行检验、净化,将数据进行转化、提取、转换、装载到数据集市或数据仓库以及对其进行定期更新和管理。
由于这一工作的复杂性,适于这些任务的许多可用工具成本花费又高,又需要相当的专业技术。因为你可能会用到几个既没有很好地集成又不是图形化的工具。这些工具在培训和咨询服务方面的投资成本对于一个小小的数据集市项目而言是过分昂贵的。
另一个途径是建立你自己的工具。这对于转换和抽取需求相对简单的情况来说可能足够用了,而当需求变得复杂时就会显得效率低下。当数据集市的规模激烈增长时,越来越多的数据源需要被访问并维持一致性,越来越多的复杂转换需要在数据上进行处理。
Sybase的数据仓库平台的特点之一是将你所需要的数据转移工具的成本花费维持在一个相对低廉的水平上。
PowerStage
与Ardent软件公司合作开发的PowerStage,是Sybase为使用客户/服务器数据源进行项目建立而提供的。这些数据源包括运行于Windows NT和UNIX平台上的业务系统。PowerStage既可以对由大型机或遗留的数据源抽取的展平文件(flat-file)中的数据进行转换,也可以对从Sybase中间件、企业级连接和复制服务器而来的数据进行转换。
PowerStage是一套新的“第二代”数据移植工具,通过一个引擎进行数据处理,而第一代产品使用COBOL代码生成器。PowerStage通过一套紧密集成的工具使数据集市建立的步骤自动化,并且易于使用,具有强大的功能和性能。
PowerStage使用了代码重用工具组件,如装载器、聚集器和抽取器等等。个别组件通过Sybase的DirectConnect工具可以对25个数据源进行访问,并且可以将数据变化捕捉到Sybase、Oracle、DB2、IMS和其它的OLTP数据库中,在将其装入一个数据仓库前对其进行成批处理。这些组件和转换过程中的步骤在下边以图形方式描绘出来,显示了数据的处理方式。这些组件随后被链接或配置,以便产生可以通过PowerStage引擎进行运行的批量任务。
有了PowerStage,数据仓库开发者可以使用产品的虚拟设计应用直接对数据的移动和处理
进行建模。开发者不再需要进行编码,也不必使已有的转换程序成为一个可重用组件。开发者建立一个处理模型,对每个数据移动或处理步骤进行图解,这个工程看起来就象一个流程图。PowerStage不象一些数据集市方案那样牺牲了易于使用的性能,它的建模性能提供了最大的设计灵活性。这样,不仅易于学习和使用,PowerStage还为数据仓库开发者提供了一个图形化的、高度面向客户的方式来管理更加复杂的方案。
PowerStage组件
PowerStage在一个集成的开发套件中,为开发者提供了全面的设计、开发、编译和运行环境,它们包括:the Designer、the Repository Manager、the Director和the Administrator ,和基于NT平台的服务器:
The Designer – The Designer是图形用户界面,功能强大的开发工具,让我们方便地、充满信心地设计端到端的数据仓库和数据集市的解决方案。它包括:一个转换引擎、一个数据和元数据的存储库和两种编程语言(SQL 和BASIC)。使用The Designer中的Drag and Drop 功能,可以方便地设计在数据仓库的准备阶段中需要的数据转换过程模型,即不必关心不同操作系统带给我们的干扰,也不必考虑系统的性能问题。
The Repository Manager – The Repository Manager用来浏览、编辑和输入在数据仓库开发过程中的元数据。可能包括来自操作系统或目标数据仓库的元数据,也可能包括在项目开发过程中,由处理过程的结果而产生的元数据(例如:新数据类型的定义、新的数据转换定义和新的商业规则定义等)。
The Director – 使用The Director 和它的run-time引擎,操作人员可以自由地安排解决方案的运行计划,测试并调试组件,并可以监视各可执行版本的运行结果(可以是随机的或有计划的)。
The Administrator – 通过The Administrator,极大简化了在数据仓库开发过程中所需的各种管理工作。你可以为用户或用户组授权, 可针对PowerStage的客户端程序或作业,指出哪一个用户可以看哪一个,哪一个用户可以运行哪一个等,并可建立全局的设置,如:Log文件的自动清除。移动、更名、删除工程项目,管理并发布作业。
The PowerStage Server – PowerStage提供了一个具有出类拔萃的性能和功能的基于Windows NT的服务器。它采用了ARDENT公司的成熟技术:高速转换引擎、临时数据存储库、关系型与非关系型数据结构的支持、预定义的转换模式等等。另外,the PowerStag
e Server通过对Windows NT上多处理器平台的优化为用户提供了极佳的可扩展性,支持数据的多种输入/输出方法,并为增加新数据源和新的转换方法提供了方便的途径。
数据仓库的数据存储
一旦数据被抽取和转换后,它必须在数据仓库或者数据集市中得到分布和存储。在这个方面,Sybase是独一无二的。当不同的负载在数据仓库环境中出现时,它提供的适应性服务器产品系列使用优化的数据存储技术使处理工作做的更好。Sybase的新通用语言接口(Common Language Interface)和总目录表(Global Catalog)服务于Adaptive Server Enterprise(原Sybase SQL Server)和Adaptive Server IQ(原Sybase IQ),为对象数据类型指定数据存储,为遗留的数据源提供开放访问。值得注意的是,有了适应性服务器,Sybase的数据库管理系统现在可以更好地协同工作,原因在于共享了复制和通用性管理(Sybase Central)等服务。
虽然Sybase的数据存储是为特定负载而进行优化的,但是它现在可以利用同样的语言,应用于单一应用开发环境。由于一个的单一的应用开发环境和全球的数据目录集成了数据仓库的分布式处理,这种折衷是十分有效的。对于数据集成和分析来说,Sybase的数据存储
处理规模可以达到TB一级。由于这些数据存储为不同的处理任务进行了优化,对它们的联合使用就可以保证所有的数据库任务得到快速处理。

本文发布于:2024-09-22 04:26:49,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/352108.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   数据仓库   进行   集市   建立   数据库
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议