迁移到体系结构化环境

迁移到体系结构化环境是一个逐步完成的过程。

1 迁移方案

(1) 数据模型

数据模型是迁移方案的起点,描述了企业需要的信息。

数据模型内容:

  • 主要主题
  • 主题定义
  • 主题关系
  • 关键字和属性分组

从企业数据模型,可以建立更底层的模型,用于详细描述概略信息。通常排除导出数据和DSS数据,因为:

  • 经常变化
  • 是由原子数据生成的
  • 常被删除
  • 有很多变化因素

(2) 定义数据源

从数据模型开始,找到最符合需要的数据源。

衡量标准:

  • 完备
  • 实时
  • 准确
  • 接近外部数据源
  • 与数据模型兼容

面临的技术挑战:

  • DBMS变化
  • 多源异构数据合并
  • 抽取
  • 格式变化
  • 数据量

(3) 设计

主要工作:

  • 加入时间元素
  • 清楚纯操作型数据
  • 将参照完整性关系转换为人工关系
  • 加入导出数据
  • 数据取值范围考量?
  • 海量数据处理考量,如增加数据缓冲、并行处理和延迟索引等

数据结构调整的原因:

  • 增加数据阵列
  • 冗余
  • 数据分离(含变动和稳定数据分离)
  • 数据表合并

(4) 接口

用于数据加载。

包含:

  • 抽取
  • 集成
  • 时间基准变更
  • 压缩
  • 确定建立和维护所需资源

一般数据集成和转换需要耗费约80%精力。

(5) 数据加载

分批加载可以简单快速调整。

合适的刷新频率可以减少操作型信息数据频繁变更的影响。

(6) 反馈循环

  • 分析员通过对原型系统不断反馈确认需求
  • 反馈周期越短,越容易成功
  • 数据量越大,循环周期越长

(7) 操作型系统重建策略

考虑因素(变化动因):

  • 系统老化
  • 技术更新
  • 组织剧变
  • 业务巨变

步骤:

  • 简单列出操作型环境与数据模型描述的环境间的差别
  • 评估差别的影响
  • 估计重建的资源消耗
  • 将以上内容以报告提交管理层

2 螺旋式开发方法

与迁移方案不同的是,迁移方案动态描述总体的工作步骤,而螺旋式方法讨论详细的工作步骤。

常见失败原因:

  • 不支持迭代工作
  • 包含不必要的工作
  • 缺乏对细节和特殊情况的关注
  • 没有考虑规模的影响
  • 项目管理和设计开发混为一谈
  • 没有区分操作型处理和DSS处理
  • 没有检查点和停止处
  • 缺乏好的判定和常识
  • 理论与实践脱节

螺旋式开发,因为由数据驱动,常被称为数据驱动。

利用已有,不做重复工作,是一个基本要点。

特点:

  • 以已有数据和代码为基础。找出共性的关键是数据模型。
  • 生命周期开始于数据,结束于需求。而操作型系统开始于需求,结束于代码。

建议:螺旋式开发描述目标和工作顺序,将实现细节留给开发者。

参考资料

《数据仓库》