数据仓库与联机分析处理

数据仓库与联机分析处理:

数据仓库:

•数据仓库公认的(基于W. H. Inmon)定义:

数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理过程的决策过程。

•四个基本特征:

  1. 数据是面向主题的:要做什么?

  2. 数据是集成的:收集、整合多源异构数据

  3. 数据是非易失的:数据的初始化操作和数据访问

  4. 数据是随时间不断变化的:数据随时间变化而定期更新。

数据仓库与数据库的区别:

1) 数据库用于事务处理:

数据库作为数据资源用于管理业务中的事务处理。

数据库中存放的数据基本上是保存当前数据,随着业务的变化随时在更新数据库中的数据。

不同的管理业务需要建立不同的数据库。例如,银行中储蓄业务、信用卡业务分别要建立储蓄数据库和信用卡数据库。

2) 数据仓库用于决策分析:

数据仓库用于决策分析

数据库保持事务处理的当前状态,数据仓库既保存过去的数据又保存当前的数据

数据仓库的数据是大量数据库的集成

对数据库的操作比较明确,操作数据量少。对数据仓库操作不明确,操作数据量大

数据组织的四个级别:

DW中的数据以四个基本特征为基础, 分为四个级别:

早期细节级、当前细节级、轻度综合级、高度综合级。

源数据经过综合后,首先进入当前细节级,并根据具体需要进行进一步的综合从而进入轻度综合级及至高度综合级。

老化的数据将进入早期细节级。

不同的综合级别称之为 "粒度"

如图:

数据仓库与联机分析处理

数据仓库设计:

数据集市类型:

独立数据集市:数据来自于操作型数据库,是为了满足特殊用户而建立的一种分析型环境。

从属数据集市:数据来自于企业的数据仓库。

数据仓库与联机分析处理

 

 

数据仓库的数据模型:

都是图:

1,

数据仓库与联机分析处理

数据仓库与联机分析处理

星型模型:

数据仓库与联机分析处理

数据仓库与联机分析处理

雪花模型:

数据仓库与联机分析处理

数据仓库与联机分析处理

 

(星座)模型:

数据仓库与联机分析处理

 

数据仓库与联机分析处理

又一波截图:

1星型模型(Star Model ):

数据仓库与联机分析处理

数据仓库与联机分析处理

数据仓库与联机分析处理

雪花模型:

数据仓库与联机分析处理

星座模型(Constellation Model):

数据仓库与联机分析处理

联机分析处理:

OLAP的基本操作:

Ø数据切片多维数据是由多个维度组成的,如果在某个维度上选定一个取值,则多维数据从n维下降成n-1

Ø数据切块将完整的数据立方体切取一部分数据而得到的新的数据立方体。

Ø数据钻取(下钻)从较高的维度层次下降到较低的维度层次上来观察多维数据

Ø数据聚合(上卷)对数据进行高层次综合的操作

Ø数据旋转改变维度的位置关系,使最终用户可从其他视角来观察多维数据。

例子:

数据仓库与联机分析处理

切片: 在给定的数据立方体上的一个维进行选择操作, 得到一个子立方体。

数据仓库与联机分析处理

数据仓库与联机分析处理

钻取:

数据仓库与联机分析处理

 

数据仓库与联机分析处理

数据仓库与联机分析处理

数据仓库与联机分析处理

转轴(pivot or rotate)旋转:

通过旋转可以得到不同视角的数据。旋转操作相当于平面数据将坐标轴旋转。例如,旋转可能包含了交换行和列,或是把某一个行维移到列维中去。

或是把页面显示中的一个维和页面外的维进行交换(令其成为新的行或列中的一个)

数据仓库与联机分析处理

【季度和年份变换】

数据仓库与联机分析处理

案例【一堆截图】:

数据仓库与联机分析处理

数据仓库与联机分析处理

数据仓库与联机分析处理

数据仓库与联机分析处理

数据仓库与联机分析处理