数据集市技术
出自 MBA智库百科(https://wiki.mbalib.com/)
目录 |
数据集市技术,指数据集市成立的技术实现。数据集市的数据源主要来自数据仓库和其他数据源。实际上,如果先建数据集市,后建数据仓库,则数据集市的数据就不能来自数据仓库,因此在实际应用中数据集市最主要的数据源来自业务数据库。
实际应用中,考虑到业务数据库的服务器承担着繁忙的业务活动,所以我们将数据集市服务器与业务数据库的服务器分开。因此,有关系统以及WEB的开发,都是基于数据集市服务器的。
数据集市主要是为有关的决策提供支持的,它能够大大提高工作效率,降低建设风险,在较短的时间内取得较好的成果,因此得到广泛的应用。数据集市可以分为两类:独立型和依赖型。在独立型数据集市中,数据来自一个或多个操作系统或外部信息提供者,或者来自在一个特定的部门或地域局部产生的数据。依赖型数据集市中的数据直接来自企业数据仓库。
目前,国内还是依赖型的数据集市居多。两者的区别就在于是否从一个中央数据仓库而来。因为国内的数据仓库项目在开始阶段多是国外厂商推进的,肯定有些不理智,大多直接从数据仓库的概念入手,整合分散的、异构的数据。而独立型数据集市是因为客户有分析需求,需要一些用于分析的数据支撑,所以在部分或者自己的区域内建立这种小型数据仓库。独立型数据集市是服务具体分析应用的。
就应用而言,独立型和依赖型数据集市应该是相似的,因为目前对于数据集市的建模方法基本一致:使用建立面向主题的星型模式,服务于某项分析应用。二者主要的差别还是在扩展性方面,独立型数据集市还是会导致不一致的数据。因为它可能按照自己本地的方式来进行编码,当存在多个独立数据集市的时候,他们之间的数据很难共享。依赖型的数据集市则是按照中央数据仓库统一的编码方式,可以共享。
要建立数据集市服务器,必须将业务数据库中的数据提取到数据集市数据库。但是从业务数据库提取来的数据是被设计用于日常的事物处理的,这种按传统方式组织的数据不适合支持因决策而经常进行的查询,故查询的效率比较低。为了提高查询效率,克服传统数据组织结构所带来的弊端,多维数据库是一种较好的解决方法。多维数据库是以多维数据存储形式来组织数据的数据管理系统,它不是关系型数据库,在使用时需要将数据从关系数据库中转载到多维数据库中方可访问。多维数据库在针对多维的分析应用时具有较好的效果。
数据集市技术可以方便快捷地建立面向部门的或面向主题的统计查询系统,在现代企业客户管理系统中,通过数据集市技术可以全面分析您的客户管理现状和发展目标,帮助您设计、开发和维护客户信息和营销活动管理系统。从这一层面来看,“ecdms数据集市”所提供的数据库产品更能体现出数据集市技术在现代商务营销模式中的重要作用。综合以上所述也可以预见,数据集市技术将会在各行业领域得到越来越广泛的应用和更大的发展。