迁移到体系结构化环境是一个逐步完成的过程。
1 迁移方案
(1) 数据模型
数据模型是迁移方案的起点,描述了企业需要的信息。
数据模型内容:
- 主要主题
 - 主题定义
 - 主题关系
 - 关键字和属性分组
 
从企业数据模型,可以建立更底层的模型,用于详细描述概略信息。通常排除导出数据和DSS数据,因为:
- 经常变化
 - 是由原子数据生成的
 - 常被删除
 - 有很多变化因素
 
(2) 定义数据源
从数据模型开始,找到最符合需要的数据源。
衡量标准:
- 完备
 - 实时
 - 准确
 - 接近外部数据源
 - 与数据模型兼容
 
面临的技术挑战:
- DBMS变化
 - 多源异构数据合并
 - 抽取
 - 格式变化
 - 数据量
 
(3) 设计
主要工作:
- 加入时间元素
 - 清楚纯操作型数据
 - 将参照完整性关系转换为人工关系
 - 加入导出数据
 - 数据取值范围考量?
 - 海量数据处理考量,如增加数据缓冲、并行处理和延迟索引等
 
数据结构调整的原因:
- 增加数据阵列
 - 冗余
 - 数据分离(含变动和稳定数据分离)
 - 数据表合并
 
(4) 接口
用于数据加载。
包含:
- 抽取
 - 集成
 - 时间基准变更
 - 压缩
 - 确定建立和维护所需资源
 
一般数据集成和转换需要耗费约80%精力。
(5) 数据加载
分批加载可以简单快速调整。
合适的刷新频率可以减少操作型信息数据频繁变更的影响。
(6) 反馈循环
- 分析员通过对原型系统不断反馈确认需求
 - 反馈周期越短,越容易成功
 - 数据量越大,循环周期越长
 
(7) 操作型系统重建策略
考虑因素(变化动因):
- 系统老化
 - 技术更新
 - 组织剧变
 - 业务巨变
 
步骤:
- 简单列出操作型环境与数据模型描述的环境间的差别
 - 评估差别的影响
 - 估计重建的资源消耗
 - 将以上内容以报告提交管理层
 
2 螺旋式开发方法
与迁移方案不同的是,迁移方案动态描述总体的工作步骤,而螺旋式方法讨论详细的工作步骤。
常见失败原因:
- 不支持迭代工作
 - 包含不必要的工作
 - 缺乏对细节和特殊情况的关注
 - 没有考虑规模的影响
 - 项目管理和设计开发混为一谈
 - 没有区分操作型处理和DSS处理
 - 没有检查点和停止处
 - 缺乏好的判定和常识
 - 理论与实践脱节
 
螺旋式开发,因为由数据驱动,常被称为数据驱动。
利用已有,不做重复工作,是一个基本要点。
特点:
- 以已有数据和代码为基础。找出共性的关键是数据模型。
 - 生命周期开始于数据,结束于需求。而操作型系统开始于需求,结束于代码。
 
建议:螺旋式开发描述目标和工作顺序,将实现细节留给开发者。
参考资料
《数据仓库》