最终用户社区

1 操作型与数据仓库开发过程区别

  • 操作型是一次成型,而数据仓库是迭代的
  • 操作型按照应用逐个开发,而数据仓库按照主题域逐个开发
  • 操作型有稳定的需求,而数据仓库需求在开发中确定
  • 操作型注重事务响应时间,而数据仓库不注重
  • 操作型数据来自企业外部,而数据仓库来自内部
  • 操作型数据几乎是当前值,而数据仓库是历史数据

2 复查时间

设计好一个主要主题域,并准备加入数据仓库时。

3 复查人员

主题域相关的开发、操作和管理人员。

4 涉及问题

所有设计、开发、管理和应用的问题,以及存在争议的问题

5 复查结果

  • 评价和建议
  • 文档
  • 行动列表

6 复查管理

督导员 + 记录员。其中督导员不能是开发或管理人员。

7 典型设计复查问题

1 复查成员

最重要的是分析员或最终用户

2 需求满足情况

由于需求时不明确的,需要猜测,并且不应花费大量时间

3 已有内容

开始阶段应在优先范围内,不应设计关键数据和过程。边试边改,逐步开发。

4 外部DSS处理

避免重复并寻求迁移

5 细节级

6 记录系统

7 数据量

8 抽取过程数据滤除机制

9 内外部软件接口

10 数据组织

11 存储设备扩展性

12 数据重构

13 性能

14 索引

  • 散列关键字或主关键字: 多数存取
  • 二级索引:其他存取
  • 临时索引:不常见存取
  • 子集抽取和顺序索引:不频繁和一生一次存取

避免分区过大

15 数据处理量和峰值

16 数据清除标准

17 数据之间的关系

18 物理反向规范化技术

19 数据恢复

20 数据所有权

21 数据修改

22 公共汇总数据

23 审计需求

24 数据压缩

25 元数据存储

26 目录、字典

27 数据更新。仅在异常情况下,没有其他处理时进行

28 时间延迟

29 外部数据

30 数据查找工具

31 数据回流到操作层

32 反复性处理

33 主要主题划分

34 稀疏索引、临时索引

35 文档

36 分布式管理

37 付费

38 分布式管理

39 监控

40 测试工具

41 数据装载量

42 粒度管理器

43 存储介质划分标准

44 数据移动

45 数据分布

46 非结构化数据

47 数据增长率

48 多维数据库设计

49 概要记录

50 培训

参考资料

《数据仓库》