第三章 商业智能数据仓库的理论知识

第一节 数据仓库的定义

    数据仓库是一个面向主题的、集成的、稳定的、反映历史变化的、随着时间的流逝发生变化的数据集合。它主要用来支持企业管理人员的决策分析。

    数据仓库中面向主题的特性是根据业务的不同而进行的内容划分。数据仓库的集成特性是因为不同的业务源数据具有不同的数据特点,当业务源数据进入到数据仓库时,需要采用统一的编码格式进行数据加载,从而保证数据仓库中数据的唯一性。数据仓库的非易失性是指数据仓库通常保存数据不同历史时期的各种状态,并不对数据进行任何更新操作。数据仓库的历史特性是指数据保留时间戳字段,记录每个数据在不同时间点内的各种状态。

    笔者认为:数据仓库是计算机应用发展的必然产物。它收集了企业相关内部和外部各个业务系统的数据源、归档文件等一系列历史数据,最后转化成企业需要的战略决策信息。数据仓库技术是企业应对市场激烈的竞争、扩大市场份额,提高企业利润的最佳方案之一。