MLflow 试验入门

本笔记本集合演示了如何启动和运行 MLflow 试验运行。

MLflow 组件

MLflow 是用于管理端到端机器学习生命周期的开源平台。 MLflow 有三个主要组件:

  • 跟踪
  • 模型
  • 项目

通过 MLflow 的“跟踪”组件可使用以下 API 来记录和查询机器模型训练会话(也称为运行):

MLflow 运行是与机器学习模型训练过程相关的参数、指标、标记和项目的集合。

MLflow 中的试验是什么?

试验是 MLflow 中组织的主要单位;所有 MLflow 运行都属于试验。 每个试验都允许可视化、搜索和比较运行,以及下载运行项目或元数据以便在其他工具中进行分析。 试验在 Azure Databricks 托管的 MLflow 跟踪服务器中进行维护。

试验位于工作区文件树中。 可使用与管理其他工作区对象(如文件夹、笔记本和库)相同的工具来管理试验。

MLflow 示例笔记本

下面的笔记本演示了如何使用 MLflow 跟踪 API 创建并记录 MLflow 运行,以及如何使用试验 UI 来查看运行。 这些笔记本可在 Python、Scala 和 R 中使用。

Python 和 R 笔记本使用笔记本试验。 Scala 笔记本在 Shared 文件夹中创建试验。

注意

使用 Databricks Runtime 10.4 LTS ML 及更高版本时,默认情况下已为 Python 笔记本启用 Databricks 自动日志记录