共用方式為

experiments 命令组

注释

此信息适用于 Databricks CLI 版本 0.205 及更高版本。 Databricks CLI 目前处于公共预览阶段。

Databricks CLI 的使用须遵守 Databricks 许可Databricks 隐私声明,包括任何数据使用规定。

experiments CLI 中的命令组允许在 MLflow 中创建、编辑、删除和管理试验。 请参阅使用 MLflow 试验组织训练运行

databricks 实验 create-experiment

创建具有名称的试验。 返回新创建的试验的 ID。 验证同名的另一个试验尚不存在,如果存在同名的另一个试验,则失败。

如果存在具有给定名称的试验,则抛出 RESOURCE_ALREADY_EXISTS 异常。

databricks experiments create-experiment NAME [flags]

论据

NAME

    试验名称。

选项

--artifact-location string

    存储实验相关工件的位置。

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

全局标志

databricks 实验创建运行

在试验中创建新的运行。 运行通常指的是一次机器学习或数据ETL管道的单次执行。 MLflow 使用运行来记录与单次执行相关的 mlflowParam、mlflowMetric 和 mlflowRunTag。

databricks experiments create-run [flags]

论据

没有

选项

--experiment-id string

    关联的试验的 ID。

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件

--run-name string

    运行的名称。

--start-time int

    启动运行时的 Unix 时间戳(以毫秒为单位)。

--user-id string

    运行用户的 ID。

全局标志

databricks 实验 delete-experiment

标记试验和关联的元数据、运行、指标、参数和标签以供删除。 如果试验使用 FileStore,也会删除与试验关联的项目。

databricks experiments delete-experiment EXPERIMENT_ID [flags]

论据

EXPERIMENT_ID

    关联的试验的 ID。

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件

全局标志

databricks 实验 删除运行

标记要删除的运行。

databricks experiments delete-run RUN_ID [flags]

论据

RUN_ID

    要删除的运行的 ID。

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件

全局标志

databricks 实验 删除运行

批量删除在指定时间戳之前或之前创建的试验中运行。 删除每个请求最多max_runs。 若要从 Python 中的 Databricks Notebook 调用此 API,可以在 上使用客户端代码片段

databricks experiments delete-runs EXPERIMENT_ID MAX_TIMESTAMP_MILLIS [flags]

论据

EXPERIMENT_ID

    包含要删除的运行的试验的 ID。

MAX_TIMESTAMP_MILLIS

    用于删除运行的自 UNIX 纪元以来的最大创建时间戳(以毫秒为单位)。 仅删除在此时间戳或之前创建的运行。

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件

--max-runs int

    一个可选的正整数,指示要删除的最大运行数。

全局标志

databricks 实验 delete-tag

在运行过程中删除标签。 标记是可在运行期间和运行完成后更新的运行元数据。

databricks experiments delete-tag RUN_ID KEY [flags]

论据

RUN_ID

    标记记录所归属的运行 ID。 必填。

KEY

    标记的名称。 最大大小为 255 字节。 必填。

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件

全局标志

databricks 试验按名称获取

获取具有指定名称的实验的元数据。

此命令将返回已删除的试验,但如果活动试验和已删除的试验共享相同的名称,则首选活动试验。 如果多个已删除的试验具有相同的名称,API 将返回其中一个。

如果不存在具有指定名称的试验,则 RESOURCE_DOES_NOT_EXIST 引发。

databricks experiments get-by-name EXPERIMENT_NAME [flags]

论据

EXPERIMENT_NAME

    关联的试验的名称。

选项

全局标志

databricks 实验 get-experiment

获取指定 ID 的实验的元数据。 此命令适用于已删除的试验。

databricks experiments get-experiment EXPERIMENT_ID [flags]

论据

EXPERIMENT_ID

    关联的试验的 ID。

选项

全局标志

databricks 实验 获取历史

获取给定运行的指定指标的所有值的列表。

databricks experiments get-history METRIC_KEY [flags]

论据

METRIC_KEY

    指标的名称。

选项

--max-results int

    每个分页请求返回的最大指标记录数。

--page-token string

    指示要提取的指标历史记录页的令牌。

--run-id string

    要提取指标值的运行 ID。

--run-uuid string

    已弃用,请改用 --run_id 。 要提取指标值的运行 ID。

全局标志

Databricks 实验获取运行

获取某次运行的元数据、指标、参数和标签。 如果为运行记录了具有相同密钥的多个指标,则仅返回具有最新时间戳的值。

如果有多个具有最新时间戳的值,则返回这些值的最大值。

databricks experiments get-run RUN_ID [flags]

论据

RUN_ID

    要获取的运行 ID。 必须提供。

选项

--run-uuid string

    已弃用,请改用 --run_id 。 要获取的运行 ID。

全局标志

databricks 试验列表项目

列出运行的工件。 采用可选的artifact_path前缀(如果指定),响应仅包含具有指定前缀的项目。 对于 Unity Catalog 卷,最多可以检索 1000 个工件。 使用 databricks fs ls 列出 Unity Catalog 卷中的工件,支持分页功能。

databricks experiments list-artifacts [flags]

论据

没有

选项

--page-token string

    指示要提取的项目结果页的标记。

--path string

    筛选匹配此路径的项目(根项目目录中的相对路径)。

--run-id string

    要列出其项目的运行 ID。

--run-uuid string

    已弃用,请改用 --run_id 。 要列出其项目的运行 ID。

全局标志

databricks 试验列表-试验

获取所有试验的列表。

databricks experiments list-experiments [flags]

论据

没有

选项

--max-results int

    所需的最大试验数。

--page-token string

    指示要提取的试验页的标记。

--view-type ViewType

    返回试验类型的限定符。 支持的值:ACTIVE_ONLYALLDELETED_ONLY

全局标志

databricks 实验日志批处理

为一次运行记录一批指标、参数和标记。 如果任何数据未能持久保存,服务器将响应错误(非 200 状态代码)。 有关覆盖行为和请求限制,请参阅 试验

databricks experiments log-batch [flags]

论据

没有

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

--run-id string

    要登录的运行 ID。

全局标志

databricks 试验日志输入

注释

此命令是实验性的。

将输入(如数据集和模型)记录到一个 MLflow 运行中。

databricks experiments log-inputs RUN_ID [flags]

论据

RUN_ID

    要登录的运行 ID

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

全局标志

databricks 试验日志指标

记录运行的指标。 指标是具有关联时间戳的键值对(字符串键、浮点值)。 示例包括表示 ML 模型准确性的各种指标。 可以多次记录指标。

databricks experiments log-metric KEY VALUE TIMESTAMP [flags]

论据

KEY

    指标的名称。

VALUE

    要记录的指标的双精度值。

TIMESTAMP

    记录指标时 Unix 时间戳(以毫秒为单位)。

选项

--dataset-digest string

    与指标关联的数据集的数据集摘要,例如

--dataset-name string

    与指标关联的数据集的名称。

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

--model-id string

    与指标关联的已记录模型的 ID(如果适用)。

--run-id string

    要记录指标的运行 ID。

--run-uuid string

    已弃用,请改用 --run_id 。 要记录指标的运行 ID。

--step int

    记录指标的步骤。

全局标志

databricks 试验日志模型

记录模型信息。

注释

此命令是实验性的。

databricks experiments log-model [flags]

论据

没有

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

--model-json string

    JSON 格式的 MLmodel 文件。

--run-id string

    要登录的运行 ID。

全局标志

databricks 试验日志参数

记录用于运行的参数。 参数是键值对(字符串键、字符串值)。 示例包括用于 ML 模型训练的超参数以及 ETL 管道中使用的常量日期和值。 一项运行只能记录一次参数。

databricks experiments log-param KEY VALUE [flags]

论据

KEY

    参数的名称。 最大大小为 255 字节。

VALUE

    要记录的参数的字符串值。 最大大小为 500 字节。

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

--run-id string

    用于记录参数的运行 ID。

--run-uuid string

    [已弃用,请改用 run_id] 记录参数所使用的运行 ID。

全局标志

databricks 实验 恢复实验

恢复被标记为删除的实验。 这还会还原关联的元数据、运行、指标、参数和标记。 如果试验使用 FileStore,那么与试验相关联的底层工件也会被还原。

如果试验从未创建或已被永久删除,则引发RESOURCE_DOES_NOT_EXIST异常。

databricks experiments restore-experiment EXPERIMENT_ID [flags]

论据

EXPERIMENT_ID

    关联的试验的 ID。

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

全局标志

databricks 实验恢复运行

还原已删除的运行。 这还会还原关联的元数据、运行、指标、参数和标记。

如果程序从未创建或已永久删除运行,则将引发RESOURCE_DOES_NOT_EXIST

databricks experiments restore-run RUN_ID [flags]

论据

RUN_ID

    要还原的运行 ID。

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

全局标志

databricks 实验恢复运行

在未早于指定时间戳删除的试验中运行批量还原操作。 每个请求最多 max_runs 还原一次。

databricks experiments restore-runs EXPERIMENT_ID MIN_TIMESTAMP_MILLIS [flags]

论据

EXPERIMENT_ID

    实验的 ID,包含要还原的任务。

MIN_TIMESTAMP_MILLIS

    自 UNIX 纪元以来用于还原运行的最小删除时间戳(以毫秒为单位)。 仅还原未早于此时间戳删除的运行。

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

--max-runs int

    一个可选的正整数,用于指示要还原的最大运行次数。

全局标志

databricks 实验搜索功能实验

搜索满足指定搜索条件的实验。

databricks experiments search-experiments [flags]

论据

没有

选项

--filter string

    表示 SQL 筛选器条件的字符串

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

--max-results int

    所需的最大试验数。

--page-token string

    指示要提取的试验页的标记。

--view-type ViewType

    返回试验类型的限定符。 支持的值:ACTIVE_ONLYALLDELETED_ONLY

全局标志

databricks 试验搜索运行

搜索满足表达式的运行实例。 搜索表达式可以使用 mlflowMetric 和 mlflowParam 键。

databricks experiments search-runs [flags]

论据

没有

选项

--filter string

    一个基于参数、指标和标签的过滤表达式,该表达式允许返回部分运行实例。

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

--max-results int

    所需的最大运行数。

--page-token string

    当前页面进程的令牌。

--run-view-type ViewType

    是显示仅激活的、仅已删除的,还是所有运行。 支持的值:ACTIVE_ONLYALLDELETED_ONLY

全局标志

databricks 实验 set-experiment-tag

设置实验的标签。 试验标记是可以更新的元数据。

databricks experiments set-experiment-tag EXPERIMENT_ID KEY VALUE [flags]

论据

EXPERIMENT_ID

    用于记录标记的实验的 ID。 必须提供。

KEY

    标记的名称。 支持最大大小为 250 字节的键。

VALUE

    要记录的标签的字符串值。 支持最大大小为 64KB 的值。

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

全局标志

databricks 实验设置标签

在运行时设置标记。 标记是可在运行期间和运行完成后更新的运行元数据。

databricks experiments set-tag KEY VALUE [flags]

论据

KEY

    标记的名称。 支持最大大小为 250 字节的键。

VALUE

    要记录的标签的字符串值。 支持最大大小为 64KB 的值。

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

--run-id string

    要记录标记的运行 ID。

--run-uuid string

    已弃用,请改用 --run_id 。 要记录标记的运行 ID。

全局标志

Databricks 实验 update-experiment

更新实验。

databricks experiments update-experiment EXPERIMENT_ID [flags]

论据

EXPERIMENT_ID

    关联的试验的 ID。

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

--new-name string

    如果有提供,实验名称将被更改为新的名称。

全局标志

databricks 试验更新-运行

更新运行。

databricks experiments update-run [flags]

论据

没有

选项

--end-time int

    运行结束时的 Unix 时间戳(以毫秒为单位)。

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

--run-id string

    要更新的运行的 ID。

--run-name string

    更新了运行的名称。

--run-uuid string

    已弃用,请改用 --run_id 。 要更新的运行的 ID。

--status UpdateRunStatus

    已更新运行状态。 支持的值:FAILEDFINISHEDKILLEDRUNNINGSCHEDULED

全局标志

databricks 实验 获取权限级别

获取实验权限级别。

databricks experiments get-permission-levels EXPERIMENT_ID [flags]

论据

EXPERIMENT_ID

    要为其获取或管理权限的实验。

选项

全局标志

databricks 试验获取权限

获取试验的权限。 试验可以从其根对象继承权限。

databricks experiments get-permissions EXPERIMENT_ID [flags]

论据

EXPERIMENT_ID

    要为其获取或管理权限的实验。

选项

全局标志

databricks 试验设置权限

设置试验权限。

设置对象的权限,替换现有权限(如果存在)。 如果未指定任何权限,则删除所有直接权限。 对象可以从其根对象继承权限。

databricks experiments set-permissions EXPERIMENT_ID [flags]

论据

EXPERIMENT_ID

    要为其获取或管理权限的实验。

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

全局标志

databricks 实验功能的更新权限

更新试验权限。 试验可以从其根对象继承权限。

databricks experiments update-permissions EXPERIMENT_ID [flags]

论据

EXPERIMENT_ID

    要为其获取或管理权限的实验。

选项

--json JSON

    内联 JSON 字符串或包含请求正文的 JSON 文件中的 @path。

全局标志

全局标志

--debug

  是否启用调试日志记录。

-h--help

    显示 Databricks CLI、相关命令组或相关命令的帮助。

--log-file 字符串

    一个字符串,表示要将输出日志写入到的文件。 如果未指定此标志,则默认会将输出日志写入到 stderr。

--log-format 格式

    日志格式类型,textjson。 默认值是 text

--log-level 字符串

    一个表示日志格式级别的字符串。 如果未指定,则禁用日志格式级别。

-o, --output 类型

    命令输出类型为 textjson。 默认值是 text

-p, --profile 字符串

    要用于运行命令的 ~/.databrickscfg 文件中的配置文件名称。 如果未指定此标志,并且存在命名为 DEFAULT 的配置文件,则使用该配置文件。

--progress-format 格式

    显示进度日志的格式: defaultappendinplacejson

-t, --target 字符串

    如果适用,要使用的捆绑包目标