数据治理(Data Governance)是个宽泛的概念,并不是说一定是怎样怎样的定义,但总体来说,我认为就是规范地、高质量地设计、开发、使用数据。从高大上的语言表述,可以是将零散、混乱的数据变一统一规划的、有条理的、高质量的数据。
数据治理中有些工作有些是整体规划,有些是一次性改造,有些是长期工作(比如数据清洗)。
从技术层面
技术路线怎么选、硬件怎么选不浪费,安全保障是什么,甚至表名、字段名规范,接口规范。
从数据层面
元数据和数据字典定义。
数据资产管理,建立数据资产目录,业务流程、约束是怎样的。
数据质量管理,通过各种方法(比如数据清洗),保障数据唯一性、完整性、真实性。
数据共享发布,如何实现各数据之间的交换、使用。
从管理层面
数据制度,比如采集制度、发布制度、共享制度、安全制度等。
人员管理。