重要
此功能目前以公共预览版提供。
在系统表中使用 MLflow 元数据,可以生成 仪表板 来分析来自整个工作区的 MLflow 实验和运行。 对这些任务使用现有的 MLflow UI 和 REST API 需要大量耗时的迭代。
单次运行详细信息的仪表板
若要开始可视化 MLflow 数据,请将 此示例仪表板 下载为 JSON 文件 并将其导入工作区。 此仪表板包含一个数据框架,用于复制 MLflow UI 中运行详细信息页上显示的内容。
对于给定的试验 ID、运行 ID 和指标名称,它会显示运行详细信息以及标记、参数和指标图。 可以从 UI 和 URL 本身的运行详细信息页获取试验 ID 和运行 ID。 https://<workspace>.databricks.com/ml/experiments/<experiment_id>/runs/<run_id>
如果从左侧导航菜单导航到仪表板面板,则可以 从此处的 JSON 文件定义导入仪表板。 在此处,可以使用顶部的输入框来筛选工作区内的相关运行和试验以绘制。 随时浏览查询并更改绘图以满足需求。
用于跨试验监视平均 GPU 利用率的仪表板
在上述仪表板的第四个选项卡上,可以输入一个指标名称,以便获取给定时间范围内使用该指标的所有试验的摘要统计信息。 此信息可用于监视工作区中 MLflow 记录 的系统指标 ,以监视低效的 CPU、内存或 GPU 利用率。
在此示例中,我们可以看到几个试验,平均 GPU 利用率小于 10%,可能需要调查这些试验。