Thomas Redman 基于数据结构的数据质量维度,将一个数据项定义为“科表示的三元组”:一个实体属性域和值的集合。维度可以与数据的任何组成部分相关联:模型(实体和属性)及其值。Redman 还定义了一类用于记录数据项规则的表达维度。在这三大类别中(数据模型、数据值、数据表达),他一共描述了 20 多个维度,其中包括以下内容:
- 数据模型
- 内容。
- 数据关联性。
- 获取价值的能力。
- 定义清晰性。
- 详细程度。
- 特征描述颗粒度。
- 属性域的精准度
- 构成。
- 自然性。每个属性在现实世界中应该有一个简单的对应物,且每个属性都应承载一个关于实体的单一事实。
- 可识别性。每个实体都应能与其他实体区分开来。
- 同一性。
- 最小必要冗余性。
- 一致性。
- 模型各组成部分的语义一致性。
- 跨实体类型属性的结构一致性。
- 应变性。
- 健壮性。
- 灵活性。
- 数据值。
- 准确性。
- 完备性。
- 时效性。
- 一致性
- 数据表达。
- 适当性。
- 可解释性。
- 可移植性。
- 格式精确性。
- 格式灵活性。
- 表达空值的能力。
- 有效利用存储。
- 数据的物理实例与其格式一致。
- 构成。