为 Unity Catalog 对象添加 AI 生成的注释

本文介绍 AI 生成的 Unity 目录对象和表列注释(也称为 AI 生成的文档),介绍了它们的工作原理,并介绍了如何添加和编辑它们。

重要

保存注释会触发 SQL ALTER 命令,这会中断 Azure Databricks 管道和作业。

有关 AI 生成的注释背后的 AI 的详细信息,请参阅 Databricks AI 辅助功能信任和安全

支持的对象

以下 Unity Catalog 对象支持 AI 生成的注释:

  • Catalogs
  • Schemas
  • Tables
  • Views
  • 具体化视图
  • 表列
  • Functions
  • Models
  • Volumes

AI 生成的注释的工作原理是什么?

作为对象所有者或具有修改对象权限的用户,可以使用目录资源管理器查看并为由 Unity Catalog 管理的对象和表列添加 AI 生成的注释。 注释由一个大型语言模型 (LLM) 提供支持,该模型会考虑对象元数据,例如表结构和列名。

AI 生成的备注提供了一种可快速帮助用户发现由 Unity 目录管理的数据的方法。

重要

AI 生成的注释旨在根据架构对对象和表列进行一般性描述。 这些说明针对商业和企业上下文中的数据进行了优化,使用了来自不同行业的多个开放数据集的示例架构。 该模型使用数百个模拟样本进行评估,以验证它会避免生成有害或不当的描述。

AI 模型并非始终准确,在保存之前必须审查注释。 Databricks 强烈建议对 AI 生成的注释进行人工审查,以检查是否存在不准确之处。 该模型不应依赖于数据分类任务(例如检测包含 PII 的列)。

若要在添加批注后查看批注,您必须对目录具有 BROWSE 权限。 BROWSE 允许查看对象元数据,包括注释,而无需 USE CATALOGUSE SCHEMA 特权。

由 AI 生成的注释是 Databricks AI 辅助功能。 有关用于生成注释建议的模型的信息,请参阅 Databricks AI 辅助功能信任和安全

添加 AI 生成的注释

必须使用目录资源管理器查看建议的注释、编辑它们,并将它们添加到对象和表列中。

所需的权限:

  • 对于大多数对象(目录、架构、表、函数、模型和卷):必须是对象所有者或对对象拥有 MODIFY 权限。
  • 对于视图和物化视图,您必须是对象的所有者。

为对象添加一个由 AI 建议的注释

  1. 在 Azure Databricks 工作区中,单击 “数据”图标。目录

  2. 搜索或浏览以找到目标对象并将其选中。

  3. 关于此 <object> 面板中,单击“AI 生成”

    AI 生成的注释按钮

    AI 可能需要一些时间才能生成注释。

  4. 单击“接受”按原样接受注释,或单击“编辑”在保存之前对其进行修改。

向表格列添加 AI 建议的注释

  1. 在 Azure Databricks 工作区中,单击 “数据”图标。目录

  2. 搜索或浏览该表,然后选择它。

  3. 在表列标题上方,单击“AI 生成”

    为每个列生成一条注释。

  4. 单击列注释旁边的复选标记以接受它或在不保存的情况下将其关闭。

更新 AI 生成的注释

对象的所有者或具有该对象 MODIFY 特权的用户可以随时通过目录资源管理器 UI 更新注释。 内置聊天助手可协助编辑注释,提供以下选项:“缩短文本”或“翻译文本”为其他语言。

AI 生成的注释内联助手

还可以使用 ALTERCOMMENT ON SQL 命令。

隐私和安全

有关隐私和安全常见问题解答,请参阅 AI 辅助功能的隐私和安全常见问题解答