迁移到体系结构化环境是一个逐步完成的过程。
1 迁移方案
(1) 数据模型
数据模型是迁移方案的起点,描述了企业需要的信息。
数据模型内容:
- 主要主题
- 主题定义
- 主题关系
- 关键字和属性分组
从企业数据模型,可以建立更底层的模型,用于详细描述概略信息。通常排除导出数据和DSS数据,因为:
- 经常变化
- 是由原子数据生成的
- 常被删除
- 有很多变化因素
(2) 定义数据源
从数据模型开始,找到最符合需要的数据源。
衡量标准:
- 完备
- 实时
- 准确
- 接近外部数据源
- 与数据模型兼容
面临的技术挑战:
- DBMS变化
- 多源异构数据合并
- 抽取
- 格式变化
- 数据量
(3) 设计
主要工作:
- 加入时间元素
- 清楚纯操作型数据
- 将参照完整性关系转换为人工关系
- 加入导出数据
- 数据取值范围考量?
- 海量数据处理考量,如增加数据缓冲、并行处理和延迟索引等
数据结构调整的原因:
- 增加数据阵列
- 冗余
- 数据分离(含变动和稳定数据分离)
- 数据表合并
(4) 接口
用于数据加载。
包含:
- 抽取
- 集成
- 时间基准变更
- 压缩
- 确定建立和维护所需资源
一般数据集成和转换需要耗费约80%精力。
(5) 数据加载
分批加载可以简单快速调整。
合适的刷新频率可以减少操作型信息数据频繁变更的影响。
(6) 反馈循环
- 分析员通过对原型系统不断反馈确认需求
- 反馈周期越短,越容易成功
- 数据量越大,循环周期越长
(7) 操作型系统重建策略
考虑因素(变化动因):
- 系统老化
- 技术更新
- 组织剧变
- 业务巨变
步骤:
- 简单列出操作型环境与数据模型描述的环境间的差别
- 评估差别的影响
- 估计重建的资源消耗
- 将以上内容以报告提交管理层
2 螺旋式开发方法
与迁移方案不同的是,迁移方案动态描述总体的工作步骤,而螺旋式方法讨论详细的工作步骤。
常见失败原因:
- 不支持迭代工作
- 包含不必要的工作
- 缺乏对细节和特殊情况的关注
- 没有考虑规模的影响
- 项目管理和设计开发混为一谈
- 没有区分操作型处理和DSS处理
- 没有检查点和停止处
- 缺乏好的判定和常识
- 理论与实践脱节
螺旋式开发,因为由数据驱动,常被称为数据驱动。
利用已有,不做重复工作,是一个基本要点。
特点:
- 以已有数据和代码为基础。找出共性的关键是数据模型。
- 生命周期开始于数据,结束于需求。而操作型系统开始于需求,结束于代码。
建议:螺旋式开发描述目标和工作顺序,将实现细节留给开发者。
参考资料
《数据仓库》