荔园在线

荔园之美,在春之萌芽,在夏之绽放,在秋之收获,在冬之沉淀

[回到开始] [上一篇][下一篇]


发信人: Jobs (温少), 信区: Database
标  题: 数据仓库概述
发信站: BBS 荔园晨风站 (Mon May  1 15:05:23 2000), 转信



数据仓库概述

    随着计算机技术的飞速发展和企业界不断提出新的需求,数据仓库技术
应运而生。传统的数据库技术是单一的数据资源,即数据库为中心,进行从
事事务处理、批处理到决策分析等各种类型的数据处理工作。近年来,随着
计算机应用,,网络计算,开始向两个不同的方向拓展,一是广度计算,一
是深度计算,广度计算的含义是把计算机的应用范围尽量扩大,同时实现广
泛的数据交流,互联网就是广度计算的特征,另一方面就是人们对以往计算
机的简单数据操作,提出了更高的要求,希望计算机能够更多的参与数据分
析与决策的制定等领域。特别是数据库处理可以大致地划分为两大类:操作
型处理和分析型处理(或信息型处理)。这种分离,划清了数据处理的分析
型环境与操作型环境之间的界限,从而由原来的以单一数据库为中心的数据
环境发展为一种新环境:体系化环境。


    数据库系统作为数据管理手段,从它的诞生开始,就主要用于事务处理
。经过数十年的发展,在这些数据库中已经保存了大量的日常业务数据。传
统的业务系统一般是直接建立在这种事务处理环境上的。随着技术的进步,
人们试图让计算机担任更多的工作,而数据库技术也一直力图使自己能胜任
从事务处理、批处理到分析处理的各种类型的信息处理任务。后来人们逐渐
认识到,在目前的计算机处理能力上,根本无法实现这种功能,而且,另一
方面,事物处理和分析处理具有极不相同的性质,直接使用事务处理环境来
支持决策是行不通的。

    事务处理环境不适宜DSS应用的原因主要有以下五条:

    (1)事务处理和分析处理的性能特性不同。

    在事务处理环境中,用户的行为特点是数据的存取操作频率高而每次操
作处理的时间短;在分析处理环境中,用户的行为模式与此完全不同,某个
DSS应用程序可能需要连续几个小时,从而消耗大量的系统资源。将具有如
此不同处理性能的两种应用放在同一个环境中运行显然是不适当的。



    (2)数据集成问题。

    DSS需要集成的数据。全面而正确的数据是有效的分析和决策的首要前
提,相关数据收集得月完整,得到的结果就越可靠。当前绝大多数企业内数
据的真正状况是分散而非集成的。造成这种分散的原因有多种,主要有事务
处理应用分散、“蜘蛛网”问题、数据不一致问题、外部数据和非结构化数
据。

    (3)数据动态集成问题。

    静态集成的最大缺点在于,如果在数据集成后数据源中数据发生了变化
,这些 变化将不能反映给决策者,导致决策者使用的是过时的数据。集成
数据必须以一定的周期(例如24小时)进行刷新,我们称其为动态集成。显
然,事务处理系统不具备动态集成的能力。



    (4)历史数据问题。

    事务处理一般只需要当前数据,在数据库中一般也是存储短期数据,切
不同数据的保存期限也不一样,即使有一些历史数据保存下来了,也被束之
高阁,未得到充分利用。但对于决策分析而言,历史数据是相当重要的,许
多分析方法必须一大量的历史数据为依托。没有历史数据的详细分析,是难
以把握企业的发展趋势的。DSS对数据在空间和时间的广度上都有了更高的
要求,而事务处理环境难以满足这些要求。

    (5)数据的综合问题。

    在事务处理系统中积累了大量的细节数据,一般而言,DSS并不对这些
细节数据进行分析。在分析前,往往需要对细节数据进行不同程度的综合。
而事务处理系统不具备这种综合能力,根据规范化理论,这种综合还往往因
为是一种数据冗余而加以限制。

    要提高分析和决策的效率和有效性,分析型处理及其数据必须与操作型
处理及其数据相分离。必须把分析型数据从事务处理环境中提取出来,按照
DSS处理的需要进行重新组织,建立单独的分析处理环境,数据仓库正是为
了构建这种新的分析处理环境而出现的一种数据存储和组织技术。



--


   我想超越这平凡的生活,注定我暂时漂泊!

   我无法停止我内心的狂热,对未来的执着!

※ 来源:·BBS 荔园晨风站 bbs.szu.edu.cn·[FROM: 192.168.11.111]


[回到开始] [上一篇][下一篇]

荔园在线首页 友情链接:深圳大学 深大招生 荔园晨风BBS S-Term软件 网络书店