多维数据库

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

多维数据库(Multi-Dimensional Database,MDD)

目录

什么是多维数据库[1]

  多维数据库是指将数据存放在一个门维数组中,而不是像关系数据库那样以记录的形式存放。因此它存在大量稀疏矩阵,人们可以通过多维视图来观察数据。多维数据库增加了一个时间维,与关系数据库相比,它的优势在于可以提高数据处理速度,加快反应时间,提高查询效率。

多维数据库的产品[1]

  目前有两种MDD的OLAP产品:基于多维数据库的MOLAP和基于关系数据库的ROLAP。ROLAP建立了一种新的体系,即星型结构。

  MDD并没有公认的多维模型,也没有像关系模型那样标准地取得数据的方法(如SOL、API等)。基于MDD的OLAP产品,依据决策支持的内容使用范围也有很大的不同。

  在低端,用户使用基于单用户或小型LAN的工具来观察多维数据。这些工具的功能性和实用性可能相当不错,但由于受到规模的限制,它们不具备OLAP的所有特性。这些工具使用超立方结构,将模型限制在行维形态。当模型足够大且稀疏数据没有控制好时,这种模型将会不堪一击。这些工具使用数据库的大小是以MB计量的,而不是以GB计量的,因此只能进行只读操作,且具备有限的复杂计算。

  在高端,OLAP工具用4GL提供了完善的开发环境、统计分析时间序列分析、财政报告、用户接口、多层体系结构、图表等许多其他功能。尽管不同的OLAP工具都使用了它们自己的多维数据库,但它们在不同程度上也利用了关系数据库作为存储媒体。因为关系数据库和OLAP工具同时在高端服务器上处理,所以速度和效率仍然很快。

  纯多维数据库引擎也被开发出来。尽管这些工具缺乏4GL及充分的开发环境,但却有比高端MDD工具所使用的数据库更为复杂的数据库。这些工具也具有统计分析、财务分析和时间序列分析等功能,并有自己的API,允许其对前端的开发环境开放。

  MDD能提供优良的查询性能。存储在MDD中的信息比在关系数据库中的信息具有更详细的索引,可以常驻内存。MDD的信息是以数组形式存放的,所以它可以在不影响索引的情况下更新数据。因此MDD非常适合于读写应用。

多维数据库的组织方式[2]

  各公司多维数据库产品的数据组织不完全相同,Arbor公司的ESSbase多维数据库是一种具有代表性的产品,下面以这种组织方式为例,说明从多维数据库或关系数据库中抽取出来、存放在多维数据库的数据组织。

  将用于分析的数据从关系数据库或关系数据仓库中抽取出来,存放到多维数据库的超立方结构中。首先,设计一个例子来说明这种组织结构(如图1所示)。

  Image:多维模型示意图.jpg

  有一组包含6个维的数据:

  销售方式 6成员

  产品 1500成员

  销售地 100成员

  时间 17成员

  项目 8成员

  统计 50成员

  其中,一些维被称为“稠密维”(dense dimensions),这些维构成了数据存储的“多维体”,其他的维被称为“稀疏维”(sparsedimensions)。

  可以将这些“稀疏维”存储在类数据库表结构中,这个表中只记录那些组合存在的数据,并有一个索引指向相应的“多维体”。

  在例子中“时间”、“项目”和“统计”是“稠密维”,如图2所示,它们构成了“立方体”;其他的三维产品、销售方式、销售地区是“稀疏维”,如图3所示。

  Image:稠密维示意图.jpg

  图  稠密维示意图

  这种多维体是以多维数组方式记录各测量值的,相应各维有一定的记录维及维内层次的元数据结构。

  这种数据组织方式消除了大量数据库表中由于空穴造成的空间浪费,以及在每个元组中存储的外键信息,它由统一的维与数组的对应系数限定数据,大大减少了存储空间。

  当使用多维数据库作为数据仓库的基本数据存储形式时,其最主要的特点是:大大减少了以维为基本框架的存储空间,针对多维数据组织的操作算法,极大地提高了多维分析操作的效率

  Image:稀疏维示意图.jpg

多维数据库与关系数据库不同[3]

  多维数据库是在最近十年内发展起来,其目的是分析数据而不是完成在线事务。多维数据库(MDA)对数据进行建模以作为事实、维度或者数值度量,这些都为做出决策而进行了大量数据的交互分析。这类数据库常见的示例包括InterSystems Cache、ContourCube以及Cognoa PowerPlay。多维数据库使用立方体的概念来代表用户可用数据的维度,并且使用了4个维度(参见图4)。例如,“销售”可以看作是如下几个维度:(1)产品模型;(2)地理位置:(3)时间;(4)其他附加的维度。在上述情况下,“销售”可以看作是数据立方体的主要属性(或者度量),而其他维度则可以看作是“特性”属性。

  Image:抽样销售额的电子表格.jpg

  关系数据库常常需要SELECT……FROM以及其他类型的SQL查询来提供信息,与此不同,多维数据库允许用户以更为口语化的英语来询问问题,例如,“How many type Z dog leashes have been sold in New Jersey so far this year?”为达到此目的可以使用一种在线分析处理(OLAP)的软件,该软件可以迅速地提供出复杂数据库的查询答案。OLAP软件常常使用于销售与市场业务报表、管理报表、趋势分析等类似的领域中。访问多维数据库中数据的OLAP应用软件称为MOLAP(多维OLAP)应用软件。

参考文献

  1. 1.0 1.1 杨成兴,赵建保,周凤珍等编著.电力系统IT应用100句.中国电力出版社,2010.10.
  2. 高洪深著.决策支持系统(DSS)理论·方法·案例.清华大学出版社,2005年05月第3版.
  3. (美)Brian K.Williams,Stacey C.Swyer著;冯飞,姜玲玲译.信息技术教程.清华大学出版社,2009.06.
本条目对我有帮助3
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目投诉举报

本条目由以下用户参与贡献

jane409,Tracy.

评论(共0条)

提示:评论内容为网友针对条目"多维数据库"展开的讨论,与本站观点立场无关。

发表评论请文明上网,理性发言并遵守有关规定。

打开APP

以上内容根据网友推荐自动排序生成

闽公网安备 35020302032707号