다음을 통해 공유

数据湖屋的数据和 AI 治理

“数据和 AI 治理”支柱的体系结构原则涵盖如何集中管理资产和访问权限。

Databricks 的数据治理湖屋体系结构图。

数据和 AI 治理原则

  1. 统一数据和 AI 管理

    数据和 AI 管理是执行数据和 AI 治理策略的基础。 它涉及受信任数据资产的收集、集成、组织和持久性,可帮助组织最大化其价值。 统一目录集中且一致地存储所有数据和分析项目,以及与每个数据对象关联的元数据。 它使最终用户能够发现可用的数据集,并通过跟踪所有数据资产的世系来提供出处可见性。

  2. 统一数据和 AI 安全性

    有效的数据安全治理有两个原则:了解谁有权访问哪些数据,以及谁最近访问了哪些数据资产。 此信息对于受监管行业的几乎所有合规性要求至关重要,对任何安全治理计划至关重要。 使用统一的数据安全系统,可以在所有数据资产中集中且一致地管理权限模型。 数据访问通过警报和监视功能进行集中审核,从而促进问责。

  3. 建立数据质量标准

    数据质量是从数据中获取准确且有意义的见解的基础。 数据质量有许多维度,其中包括完整性、准确性、有效性和一致性。 必须主动管理以提高最终数据集的质量,使数据成为业务用户的可靠和可信信息。

下一步:数据和 AI 治理的最佳做法

请参阅数据和 AI 治理的最佳做法