MLflow 试验入门
本笔记本集合演示了如何启动和运行 MLflow 试验运行。
MLflow 组件
MLflow 是用于管理端到端机器学习生命周期的开源平台。 MLflow 有三个主要组件:
- 跟踪
- 模型
- 项目
通过 MLflow 的“跟踪”组件可使用以下 API 来记录和查询机器模型训练会话(也称为运行):
MLflow 运行是与机器学习模型训练过程相关的参数、指标、标记和项目的集合。
MLflow 中的试验是什么?
试验是 MLflow 中组织的主要单位;所有 MLflow 运行都属于试验。 每个试验都允许可视化、搜索和比较运行,以及下载运行项目或元数据以便在其他工具中进行分析。 试验在 Azure Databricks 托管的 MLflow 跟踪服务器中进行维护。
试验位于工作区文件树中。 可使用与管理其他工作区对象(如文件夹、笔记本和库)相同的工具来管理试验。
MLflow 示例笔记本
下面的笔记本演示了如何使用 MLflow 跟踪 API 创建并记录 MLflow 运行,以及如何使用试验 UI 来查看运行。 这些笔记本可在 Python、Scala 和 R 中使用。
Python 和 R 笔记本使用笔记本试验。 Scala 笔记本在 Shared
文件夹中创建试验。
注意
使用 Databricks Runtime 10.4 LTS ML 及更高版本时,默认情况下已为 Python 笔记本启用 Databricks 自动日志记录。