数据仓库是一种体系结构,而不是一种技术。数据仓库最为核心的内容分类两部分:

  1. 基于关系数据库的多维建模(RDBMS-based dimensional modeling);
  2. 基于数据立方体的 OLAP 查询(Cube-based OLAP);

一些基础概念


维度 & 事实

事实表 & 维度表

《BI那点儿事-数据的艺术》理解维度数据仓库--事实表、维度表、聚合表

缓慢变化维 SCD

缓慢变化维指维度并不是静态的,而是会随着时间的推移发生缓慢变化。通用的处理方法是,在不考虑存储成本的情况下可通过每天保留一份全量的快照数据来处理变化的维度,当有需要的时候取最近的维度表进行关联。除此之外,还有全量重写、增加行、增加列、开发拉链表等方法来处理这个问题。

聊聊数据仓库中的缓慢变化维度(SCD)

数据域 & 业务过程