Git 文件夹中支持的资产类型

Git 文件夹支持特定Azure Databricks资产类型的版本控制。 当 Git 文件夹中支持资产类型时,可以将其提交到远程 Git 存储库,跟踪一段时间内的更改,并通过版本控制与其他用户协作。

注释

Git 文件夹是工作区文件夹。 Git 文件夹中的文件和笔记本存储在与其他工作区资产相同的位置。 有关Azure Databricks存储数据的位置的详细信息,请参阅 Azure Databricks写入数据的位置?

下表描述了受支持的资产类型及其要求:

资产类型 详细信息
文件 序列化的数据,例如库、二进制文件、代码或图像。 请参阅什么是工作区文件?
笔记本 Azure Databricks支持的笔记本文件格式。 Git 文件夹通过文件扩展名(.ipynb)或文件内容中的特殊标记(例如 # Databricks notebook source 文件开头的 .py 注释)标识笔记本。 笔记本不会像其他文件类型一样序列化。 请参阅笔记本格式
文件夹 Azure Databricks工作区和 CLI 中显示为文件夹的文件的逻辑分组。
查询(公共预览版) Azure Databricks SQL 查询保存为 .dbquery.ipynb 文件。 需要 新的 SQL 编辑器。 不能提交使用旧版 SQL 编辑器创建的查询。
仪表板 (公共预览版) Azure Databricks保存为 .lvdash.json 文件的 AI/BI 仪表板草稿。 不会跟踪发布和计划配置。
警报 (公共预览版) 保存为 .dbalert.json 文件的警报。 Git 文件夹跟踪警报计划,但克隆的警报开始暂停,必须手动恢复它们。

文件命名要求

在 Git 文件夹中处理资产时,请遵循以下文件命名规则:

  • 唯一的笔记本名称:文件夹不能包含与另一个笔记本、文件或文件夹同名的笔记本,即使扩展名不同。 例如,源格式的笔记本 test1.py 和格式的 .ipynb 笔记本无法共存,因为两者都序列化为 test1
  • 无正斜杠:文件名不能包含 / 字符。 例如, i/o.py 不是有效的文件名。
  • 最大名称长度:路径中的每个文件或文件夹名称不能超过 255 字节。

如果违反这些规则,Git 操作会失败并显示错误消息。 若要解决此错误,请重命名存储库中的冲突文件。

不支持的资产类型

Git 文件夹中不支持以下资产类型:

注释

可以将不受支持的资产移动到 Git 文件夹中,但无法将更改提交到远程存储库。

笔记本格式

有关源代码管理笔记本格式的信息,请参阅 笔记本格式