注释
此信息适用于 Databricks CLI 版本 0.205 及更高版本。 Databricks CLI 目前处于公共预览阶段。
Databricks CLI 的使用须遵守 Databricks 许可和 Databricks 隐私声明,包括任何数据使用规定。
fs
CLI 中的命令组允许对 Unity 目录中的卷和 Databricks 文件系统(DBFS)执行文件系统作。
fs命令需要卷路径以dbfs:/Volumes开头,并且需要 DBFS 中的目录和文件路径以dbfs:/开头。
若要对目录中的 /Workspace 工作区文件执行作,请使用 databricks workspace 命令。 请参阅 workspace 命令组。
重要
不支持对启用了防火墙的存储容器使用 Databricks CLI 或 REST API。 Databricks 建议使用 Databricks Connect 或 az storage。
databricks fs cat
输出文件的内容。 指定 DBFS 中文件的路径。
databricks fs cat FILE_PATH [flags]
论据
FILE_PATH
要输出的文件
选项
例子
以下示例输出了在指定卷的根中或 DBFS 根的 babynames.csv 目录中找到的名为 tmp 的文件的内容:
databricks fs cat dbfs:/Volumes/main/default/my-volume/babynames.csv
databricks fs cat dbfs:/tmp/babynames.csv
以下示例返回错误,因为它们尝试输出目录的内容而不是文件:
databricks fs cat dbfs:/Volumes/main/default/my-volume
databricks fs cat dbfs:/tmp
databricks fs cp
复制目录或文件。 指定指向要复制的源目录或文件的路径及其目标。 可以在本地系统文件和 DBFS 之间复制目录和文件,还可以在 DBFS 路径之间复制目录和文件。
如果省略 cp,则 file:/ 命令将采用 file:/。
databricks fs cp SOURCE_PATH TARGET_PATH [flags]
论据
SOURCE_PATH
源目录或文件路径
TARGET_PATH
目标目录或文件路径
选项
--overwrite
覆盖现有文件
-r, --recursive
以递归方式复制目录中的文件
例子
以下示例将名为 squirrel-data 的目录及其内容从本地文件系统路径复制到指定卷的根中或 DBFS 根中的 squirrels 目录。
databricks fs cp /Users/<username>/squirrel-data dbfs:/Volumes/main/default/my-volume/squirrels -r
databricks fs cp /Users/<username>/squirrel-data dbfs:/squirrels -r
以下示例将名为 squirrels.csv 的文件从本地文件系统路径复制到指定卷的根中或 DBFS 根中名为 squirrel-data 的目录。 如果目标中已存在该文件,则会覆盖该文件。
databricks fs cp /Users/<username>/squirrels.csv dbfs:/Volumes/main/default/my-volume/squirrel-data --overwrite
databricks fs cp /Users/<username>/squirrels.csv dbfs:/squirrel-data --overwrite
databricks fs ls
列出卷或 DBFS 中指定目录的内容。
databricks fs ls DIR_PATH [flags]
论据
DIR_PATH
目录路径
选项
--absolute
显示绝对路径。
--long, -l
显示自 Epoch 以来的大小、文件类型和修改时间(以毫秒为单位)的完整信息。
例子
以下示例列出了在指定卷的根中或 DBFS 根中找到的对象的名称:
databricks fs ls dbfs:/Volumes/main/default/my-volume
databricks fs ls dbfs:/
以下示例列出在指定卷的根目录或DBFS根目录内的tmp目录中找到的对象的详细信息(完整信息):
databricks fs ls dbfs:/Volumes/main/default/my-volume -l
databricks fs ls dbfs:/tmp -l
以下示例列出了在指定卷的根中或 DBFS 根的 tmp 目录中找到的对象的完整信息以及对象的完整路径:
databricks fs ls dbfs:/Volumes/main/default/my-volume -l --absolute
databricks fs ls dbfs:/tmp -l --absolute
databricks fs mkdir
创建目录。 指定要在卷或 DBFS 中创建的目录的路径。 如果该目录已存在,则不会执行任何操作。
databricks fs mkdir DIR_PATH [flags]
论据
DIR_PATH
要创建的目录路径
选项
例子
以下示例在指定卷的根中或 DBFS 根的名为 squirrel-data 的目录中创建名为 tmp 的目录:
databricks fs mkdir dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs mkdir dbfs:/tmp/squirrel-data
databricks fs rm
删除目录。 指定 DBFS 中现有目录的路径。
如果目录存在但不是空的,则返回错误。 如果目录不存在,则不会发生任何动作。
databricks fs rm PATH [flags]
论据
PATH
DBFS 中现有目录的路径
选项
-r, --recursive
删除所有内容
例子
以下示例从指定卷的根中或 DBFS 根的 squirrel-data 目录中删除名为 tmp 的目录:
databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs rm dbfs:/tmp/squirrel-data
以下示例从指定卷的根中或 DBFS 根的 squirrel-data 目录中删除名为 tmp 的非空目录:
databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data -r
databricks fs rm dbfs:/tmp/squirrel-data -r
全局标志
--debug
是否启用调试日志记录。
-h 或 --help
显示 Databricks CLI、相关命令组或相关命令的帮助。
--log-file 字符串
一个字符串,表示要将输出日志写入到的文件。 如果未指定此标志,则默认会将输出日志写入到 stderr。
--log-format 格式
日志格式类型,text 或 json。 默认值是 text。
--log-level 字符串
一个表示日志格式级别的字符串。 如果未指定,则禁用日志格式级别。
-o, --output 类型
命令输出类型为 text 或 json。 默认值是 text。
-p, --profile 字符串
要用于运行命令的 ~/.databrickscfg 文件中的配置文件名称。 如果未指定此标志,并且存在命名为 DEFAULT 的配置文件,则使用该配置文件。
--progress-format 格式
显示进度日志的格式: default、 append、 inplace或 json
-t, --target 字符串
如果适用,要使用的捆绑包目标