数据仓库(《数据仓库工具箱:纬度建模权威指南》)
===重要章节(1、2、4、18、19、20、21)
1.数据治理
1.1数仓基本概念
- 元数据
-纬度表
描述具体事物信息的记录,例如物品、人员信息、商品信息等
-事实表
生产、活动产生的记录信息,例如购物记录、旅行记录等(通过外键关联纬度表)
-事实表与纬度表区别
可以通过分析该列是否是一种包含多了个值并且作为计算的参与者的度量,这种为事实;或菏泽该列是对具体指的描述,
是一个常量、某一约束和行标示的参与者,此时属性往往是纬度属性。
1.2.纬度建模架构
通过架构的形式信息的定义了如何处理数据以及逻辑、物理分层模型。展现了从底层数据->etl->数据仓库->数据展现的一个整体流程和架构。
DW/BI架构
独立的数据集市架构
辐射状企业信息工厂
混合架构