1 数据库设计模型
关系模型
在数据仓库设计中是Inmon方法,适合长期使用
多维模型
在数据仓库设计中是Kimball方法,适合短期使用,并且适用范围有限
(1) 关系模型
关系型数据以一种标准化的形式存在。
数据标准化是指将数据分解为最低粒度级。共分为三级。
优点:
灵活
多功能
支持数据的多种视图
(2) 多维模型
也叫星形连接。
中心是一张事实表,周围是一些维度表。事实表包含多次出现的数据,维度表包含相关的、独立的辅助信息。
优点:访问高效
雪花结构:将多张事实表结合,事实表间共享维度表。共享的维表又叫一致维表。
(3) 模型区别
关系模型适合数据仓库,多维模型适合数据集市
灵活性
关系模型存储低粒度级数据,能适度变化以支持未来需求。多维模型难以改动。
性能
多维模型性能更好,支持直接数据存取;关系模型支持间接数据存取。
设计范围
关系模型结构更通用,适合大范围数据;多维模型针对某些需求优化,适合小范围数据
2 数据集市
数据集市是用来表示服务特定群体分析需求的一种数据结构。
独立数据集市和从属数据集市
独立数据集市由部门建立,不需全局考虑,但随着数据集市增加会出现部门间数据冗余问题。是一种短期、有限范围的解决方法。
从属数据集市数据只来自数据仓库,需要全局考虑,不会出现数据冗余问题。是一种长期、全局的解决方法。
独立数据集市问题,而从属数据集市没有:
- 不提供数据重用
- 不提供数据一致性基础
- 不提供单一历史接口程序
- 各自为政,数据冗余
参考资料
《数据仓库》