什么是 数据治理
将数据作为资产管理
什么是数据治理
数据治理是一个组织数据管理系统,包括确保数据质量、安全和有效使用的政策、流程、标准和指标。
关键组件
| 组件 | 描述 | |------|------| | 数据政策 | 使用和保护规则 | | 数据管理 | 数据质量所有权 | | 元数据 | 数据描述和分类 | | 质量标准 | 质量标准和指标 | | 合规性 | 监管要求遵守 |
数据治理角色
- 数据所有者 — 业务数据所有者
- 数据管理员 — 数据质量管理者
- 数据保管人 — 技术保管者
- 数据治理委员会 — 管理机构
- 首席数据官 — 数据主管
覆盖领域
| 领域 | 治理内容 | |------|----------| | 数据质量 | 准确性、完整性、一致性 | | 数据安全 | 保护和访问控制 | | 数据隐私 | 个人数据、GDPR | | 主数据 | 参考数据 | | 数据生命周期 | 存储和归档 |
工具
- 数据目录: Alation、Collibra、DataHub
- 血缘: Apache Atlas、OpenLineage
- 质量: Great Expectations、Monte Carlo
- 隐私: OneTrust、BigID
成功指标
- 按领域的数据质量评分
- 合规率
- 问题检测时间
- 错误纠正成本
- 员工数据素养水平