Azure Databricks 上的工作区模型注册表

注意

本文档介绍工作区模型注册表。 Azure Databricks 建议使用 Unity Catalog 中的模型。 Unity Catalog 中的模型集模型治理、跨工作区访问、数据世系和部署于一体。 工作区模型注册表将在未来弃用。

MLflow 模型注册表是一个集中式模型存储库,还是一个 UI 和 API 集,可用于管理 MLflow 模型的完整生命周期。 模型注册表提供:

  • 按时间顺序的模型世系(MLflow 试验和运行在给定时间生成了该模型)。

  • 模型版本控制。

  • 阶段转换(例如,从暂存阶段转换到生产或存档阶段)。

  • Webhook,用于根据注册表事件自动触发操作。

  • 模型事件的电子邮件通知。

你还可创建和查看模型说明,并留下注释。

可以通过模型注册表 UI 或模型注册表 API 来使用模型注册表。 本页提供概念信息,此外还通过一个示例笔记本演示了模型注册表的作用。

有关如何使用模型注册表在 Azure Databricks 中管理模型生命周期的说明,请参阅使用工作区模型注册表管理模型生命周期

模型注册表概念

  • 模型:MLflow 模型从使用模型风格的 mlflow.<model-flavor>.log_model 方法之一记录的试验或运行中记录。 记录后,你可以将模型注册到模型注册表。
  • 已注册的模型:已注册到模型注册表的 MLflow 模型。 已注册的模型具有唯一的名称、版本、模型世系和其他元数据。
  • 模型版本:已注册的模型的版本。 向模型注册表添加新模型时,它将添加为“版本 1”。 注册到同一模型名称的每个模型的版本号将递增。
  • 模型阶段:可以为一个模型版本分配一个或多个阶段。 MLflow 为常见用例提供了预定义的阶段:无、暂存、生产和已存档。 使用适当的权限,你可以在不同的阶段之间转换模型版本,也可以请求模型阶段转换。
  • 说明:你可以为模型的意图添加注释,包括说明和对团队有用的任何相关信息,例如算法说明、所采用的数据集,或者方法。
  • 活动:记录每个已注册的模型的活动(例如,阶段转换请求)。 活动跟踪提供了模型的发展(从试验到暂存版本再到生产)的世系和可审核性。

已注册模型页

在边栏中单击Models Icon模型时,将显示已注册模型页。 此页显示注册表中的所有模型。

可在此页中创建新模型

此外,工作区管理员还可以在此页中设置模型注册表中所有模型的权限

Registered models

已注册模型页

若要显示某个模型的已注册模型页,请在已注册模型页中单击相应的模型名称。 已注册模型页显示有关所选模型的信息,以及一个列出了有关每个模型版本的信息的表格。

在此页中,还可以:

模型版本页面

若要查看模型版本页,请执行以下操作之一:

  • 单击已注册模型页上的“最新版本”列中的版本名称。
  • 单击已注册模型页上的“版本”列中的版本名称。

此页显示有关特定已注册模型版本的信息,并提供指向源运行(为创建该模型而运行的笔记本版本)的链接。 在此页中,还可以:

Model version

示例

若要通过示例来了解如何使用模型注册表来构建机器学习应用程序,以预测风力发电场的每日电力输出,请参阅: