第一十二章 数据抽取、转换和加载

第五节 ETL的设计过程

    (1)数据源和ODS之间的对应

    需要记录源数据和目标数据的数据库类型、服务器IP、数据库名称、用户名和密码。

    在进行ETL设计时,需要设定抽取的周期、抽取的字段和抽取的条件等。

    ODS设计见表12-9。

表12-9  ODS设计

 表12-9  ODS设计

    数据源和ODS之间的对应见表12-10。

表12-10  数据源和ODS之间的对应

表12-10  数据源和ODS之间的对应

 
    (2)ODS和数据仓库之间的对应

    需要记录源数据和目标数据的数据库类型、服务器IP、数据库名称、用户名和密码。

    在进行ETL设计时,需要设定抽取的周期、抽取的字段和抽取的条件等。

    数据仓库设计见表12-11。

表12-11  数据仓库设计

 表12-11  数据仓库设计

    ODS和数据仓库之间的对应见表12-12。

表12-12  ODS和数据仓库之间的对应

 表12-12  ODS和数据仓库之间的对应

    (3)数据仓库和数据集市之间的对应

    需要记录源数据和目标数据的数据库类型、服务器IP、数据库名称、用户名和密码。

    在进行ETL设计时,需要设定抽取的周期、抽取的字段和抽取的条件等。

    其中事实表的设计见表12-13。

    主题描述:按时间、地区、行业、统计客户购买商品的信息进行描述,并且进行同期比较(例如对2011年1月和2010年1月进行对比)。

表12-13  事实表的设计

 表12-13  事实表的设计

表12-14  地区维表

 表12-14  地区维表

    地区维表的设计见表12-15。

表12-15  地区维表的设计

 表12-15  地区维表的设计

    行业类别维表见表12-16。

表12-16  行业类别维表

 表12-16  行业类别维表

    行业维表的设计见表12-17。

表12-17  行业维表的设计

表12-17  行业维表的设计