搞数据治理,要与具体业务结合
与具体业务脱节是数据治理走向失败的最主要原因。数据治理需要重具体业务问题出发,以具体业务为落地点,指定合理、可行的治理目标和改进路线,保证投入产出的经济性,才具备可持续推进的必要条件。
与具体业务脱节是数据治理走向失败的最主要原因。数据治理需要重具体业务问题出发,以具体业务为落地点,指定合理、可行的治理目标和改进路线,保证投入产出的经济性,才具备可持续推进的必要条件。
这是一个非常常见的问题。DAMA 和各种关于数据治理的书籍和材料,都有提到组织架构层面上的数据治理工作,如成立数据治理委员会,任命责任人,分配各种角色,等等。甚至有些材料认为,这是进行数据治理的必要条件和首要工作。 然而,从我自身的治理实践和其他团队的工作成效来看,有没有治理委员会之类的东西,并不是本质问题,而是在于能不能获得资源支持。 数据治理本身是一种工作,需要消耗资源。没有资源投入,什么委员
首发于公众号【KAMI说】(kami-said),原文:《数据治理目标-质量、效率、合规》 数据治理团队在开展治理工作之前,必须有明确的治理目标。 数据治理目标是业务导向的,不同的组织面临不同的业务现状和需求,所设定的治理目标也会不同。 然而,归根下来,数据治理目标都可以分为 “质量”、“效率”、“合规” 三类。 质量 业务驱动因素 提高组织数据价值和数据利用的机会; 降低低质量数据导致的风险和成
2013年,DAMA UK 发布了一份白皮书,描述了数据质量的6个核心维度: 完备性。存储数据量与潜在数据量的百分比。 唯一性。在满足对象识别的基础上不应多次记录实体实例(事物)。 及时性。数据从要求的时间点起代表现实的程度。 有效性。如数据符合其定义的语法(格式、类型、范围),则数据有效。 准确性。数据正确描述所描述的 “真实世界”对象或事件的程度。 一致性。比较事物多种表述与定义的差异。 DA
Thomas Redman 基于数据结构的数据质量维度,将一个数据项定义为“科表示的三元组”:一个实体属性域和值的集合。维度可以与数据的任何组成部分相关联:模型(实体和属性)及其值。Redman 还定义了一类用于记录数据项规则的表达维度。在这三大类别中(数据模型、数据值、数据表达),他一共描述了 20 多个维度,其中包括以下内容: 数据模型 内容。 数据关联性。 获取价值的能力。 定义清晰性。 详
Strong-Wang 框架(1996) 侧重于数据消费者对数据的看法,描述了数据质量的4个大类及15个指标: 内在数据质量 准确性。 客观性。 可信度。 信誉度。 场景数据质量 增值性。 关联性。 及时性。 完整性。 适量性。 表达数据质量 可解释性 易理解性 表达一致性 简洁性 访问数据质量 可访问性。 访问安全性。
Larry English 在《改善数据仓库和业务信息质量》 一书中提出了 一套综合指标, 分为两大类别 : 固有特征和实用特征。固有特征与数据使用无关,实用特征是动态的,与数据表达相关,其质量价值依赖数据的用途而不同。 固有质量特征 定义的一致性。 值域的完备性。 有效性或业务规则一致性。 数据源的准确性。 反映现实的准确性。 精确性。 非冗余性。 冗余或分布数据的等效性。 冗余或分布数据的并发