关系模型和多维模型

1 数据库设计模型

  • 关系模型

    在数据仓库设计中是Inmon方法,适合长期使用

  • 多维模型

    在数据仓库设计中是Kimball方法,适合短期使用,并且适用范围有限

(1) 关系模型

关系型数据以一种标准化的形式存在。

数据标准化是指将数据分解为最低粒度级。共分为三级。

优点:

  • 灵活

  • 多功能

    支持数据的多种视图

(2) 多维模型

也叫星形连接。

中心是一张事实表,周围是一些维度表。事实表包含多次出现的数据,维度表包含相关的、独立的辅助信息。

优点:访问高效

雪花结构:将多张事实表结合,事实表间共享维度表。共享的维表又叫一致维表。

(3) 模型区别

关系模型适合数据仓库,多维模型适合数据集市

  • 灵活性

    关系模型存储低粒度级数据,能适度变化以支持未来需求。多维模型难以改动。

  • 性能

    多维模型性能更好,支持直接数据存取;关系模型支持间接数据存取。

  • 设计范围

    关系模型结构更通用,适合大范围数据;多维模型针对某些需求优化,适合小范围数据

2 数据集市

数据集市是用来表示服务特定群体分析需求的一种数据结构。

独立数据集市和从属数据集市

独立数据集市由部门建立,不需全局考虑,但随着数据集市增加会出现部门间数据冗余问题。是一种短期、有限范围的解决方法。

从属数据集市数据只来自数据仓库,需要全局考虑,不会出现数据冗余问题。是一种长期、全局的解决方法。

独立数据集市问题,而从属数据集市没有:

  • 不提供数据重用
  • 不提供数据一致性基础
  • 不提供单一历史接口程序
  • 各自为政,数据冗余

参考资料

《数据仓库》