数据仓库和Web

1 从Web到数据仓库

Web日志中的点击流数据在进入数据仓库前,需要经过粒度管理器处理。

粒度管理器工作:

  • 清除无关、错误数据
  • 合并多条记录
  • 汇总

2 从数据仓库到Web

从数据仓库到Web需要经过操作型数据存储ODS,因为Web环境对响应时间非常敏感,数据仓库难以满足。

因为ODS是数据仓库特征和操作型系统特征的混合体。既包含了集成数据,支持决策,又支持高性能的事务处理。

数据仓库与ODS间仅存在少量的数据重叠。数据仓库包含详细的事务数据和历史数据,而ODS包含概要数据和解释性数据(数据仓库中集成而来)。生成的频率是周期性的,取决于数据的变化率和商业目的。

使用数据仓库支持Web具有以下作用:

  • 提高响应时间和数据的预分析(集成)
  • 管理大量数据(管理)
  • 支持多个Web环境(性能)

参考资料

《数据仓库》