Azure Databricks 上的工作区模型注册表
注意
本文档介绍工作区模型注册表。 Azure Databricks 建议使用 Unity Catalog 中的模型。 Unity Catalog 中的模型集模型治理、跨工作区访问、数据世系和部署于一体。 工作区模型注册表将在未来弃用。
MLflow 模型注册表是一个集中式模型存储库,还是一个 UI 和 API 集,可用于管理 MLflow 模型的完整生命周期。 模型注册表提供:
按时间顺序的模型世系(MLflow 试验和运行在给定时间生成了该模型)。
模型版本控制。
阶段转换(例如,从暂存阶段转换到生产或存档阶段)。
Webhook,用于根据注册表事件自动触发操作。
模型事件的电子邮件通知。
你还可创建和查看模型说明,并留下注释。
可以通过模型注册表 UI 或模型注册表 API 来使用模型注册表。 本页提供概念信息,此外还通过一个示例笔记本演示了模型注册表的作用。
有关如何使用模型注册表在 Azure Databricks 中管理模型生命周期的说明,请参阅使用工作区模型注册表管理模型生命周期。
模型注册表概念
- 模型:MLflow 模型从使用模型风格的
mlflow.<model-flavor>.log_model
方法之一记录的试验或运行中记录。 记录后,你可以将模型注册到模型注册表。 - 已注册的模型:已注册到模型注册表的 MLflow 模型。 已注册的模型具有唯一的名称、版本、模型世系和其他元数据。
- 模型版本:已注册的模型的版本。 向模型注册表添加新模型时,它将添加为“版本 1”。 注册到同一模型名称的每个模型的版本号将递增。
- 模型阶段:可以为一个模型版本分配一个或多个阶段。 MLflow 为常见用例提供了预定义的阶段:无、暂存、生产和已存档。 使用适当的权限,你可以在不同的阶段之间转换模型版本,也可以请求模型阶段转换。
- 说明:你可以为模型的意图添加注释,包括说明和对团队有用的任何相关信息,例如算法说明、所采用的数据集,或者方法。
- 活动:记录每个已注册的模型的活动(例如,阶段转换请求)。 活动跟踪提供了模型的发展(从试验到暂存版本再到生产)的世系和可审核性。
已注册模型页
在边栏中单击模型时,将显示已注册模型页。 此页显示注册表中的所有模型。
可在此页中创建新模型。
此外,工作区管理员还可以在此页中设置模型注册表中所有模型的权限。
已注册模型页
若要显示某个模型的已注册模型页,请在已注册模型页中单击相应的模型名称。 已注册模型页显示有关所选模型的信息,以及一个列出了有关每个模型版本的信息的表格。
在此页中,还可以:
模型版本页面
若要查看模型版本页,请执行以下操作之一:
- 单击已注册模型页上的“最新版本”列中的版本名称。
- 单击已注册模型页上的“版本”列中的版本名称。
此页显示有关特定已注册模型版本的信息,并提供指向源运行(为创建该模型而运行的笔记本版本)的链接。 在此页中,还可以:
示例
若要通过示例来了解如何使用模型注册表来构建机器学习应用程序,以预测风力发电场的每日电力输出,请参阅: