元数据是关于数据的数据。在数据仓库中,元数据是定义仓库对象的数据。对于给定数据仓库的数据名和定义,创建元数据。其它元数据包括对提取数据添加的时间标签、提取数据的源、被数据清理或集成处理添加的字段等。

元数据的存储应当包括:

1.数据仓库结构的描述,包括仓库模式、视图、维、层次结构、导出数据的定义,以及数据集市

的位置和内容。

2.操作元数据,包括数据血统(移植数据的历史和用于它的转换序列),数据流通(主动的、档

案的、或净化的),和管理信息(仓库使用统计、错误报告、审计跟踪)。

3.汇总用的算法,包括度量和维定义算法,数据所处粒度、分割、主题领域、聚集、汇总、预定

义的查询与报告。

4.由操作环境到数据仓库的映射,包括源数据库和它们的内容、网关描述、数据分割、数据提取、

清理、转换规则和缺省、数据刷新和剪裁规则、安全(用户授权 和存取控制)。

5.关于系统性能的数据,除刷新、更新定时和调度的规则与更新周期外,还包括索引和改善数据

存取和提取性能的方法。

6.商务元数据,包括商务术语和定义、数据拥有者信息和收费策略。