数据湖屋的数据和 AI 治理

“数据和 AI 治理”支柱的体系结构原则涵盖如何集中管理资产和访问权限。

Databricks 的数据治理湖屋体系结构图。

数据和 AI 治理原则

  1. 统一数据和 AI 管理

    数据和 AI 管理是执行数据和 AI 治理策略的基础。 它涉及受信任数据资产的收集、集成、组织和持久性,可帮助组织最大化其价值。 统一目录集中且一致地存储所有数据和分析项目,以及与每个数据对象关联的元数据。 它使最终用户能够发现可用的数据集,并通过跟踪所有数据资产的世系来提供出处可见性。

  2. 统一数据和 AI 安全性

    有效的数据安全治理有两个原则:了解谁有权访问哪些数据,以及谁最近访问了哪些数据资产。 此信息对于受监管行业的几乎所有合规性要求至关重要,对任何安全治理计划至关重要。 使用统一的数据安全系统,可以在所有数据资产中集中且一致地管理权限模型。 数据访问通过警报和监视功能进行集中审核,从而促进问责。

  3. 建立数据质量标准

    数据质量是从数据中获取准确且有意义的见解的基础。 数据质量有许多维度,其中包括完整性、准确性、有效性和一致性。 必须主动管理以提高最终数据集的质量,使数据成为业务用户的可靠和可信信息。

下一步:数据治理的最佳做法

请参阅数据和 AI 治理的最佳做法