Git 文件夹仅支持某些 Azure Databricks 资产类型。 本文详细介绍了受支持的资产类型以及如何将其与 Git 文件夹配合使用。 当 Git 文件夹中支持资产类型时,这意味着它可以序列化、版本控制并推送到支持 Git 存储库。
Git 文件夹支持的资产类型
支持的资产类型包括:
资产类型 | 详细信息 |
---|---|
文件 | 文件是序列化数据,可以包含从库到二进制文件到代码到图像的任何内容。 有关详细信息,请参阅什么是工作区文件? |
笔记本 | 笔记本专指 Databricks 支持的笔记本文件格式。 笔记本未序列化,因此它们被视为独立于文件的 Azure Databricks 资产类型。 Git 文件夹通过文件扩展名(例如 .ipynb )或文件扩展名与文件内容中特殊标记的组合(例如 # Databricks notebook source 源文件开头的 .py 注释)来确定笔记本。 |
文件夹 | 文件夹是一个特定于 Azure Databricks 的结构,它表示有关 Git 中文件逻辑分组的序列化信息。 与预期一样,在查看 Azure Databricks Git 文件夹或使用 Azure Databricks CLI 访问该文件夹时,用户会将其当作“文件夹”。 |
查询(公共预览版) | 可以将 Databricks SQL (DBSQL) 查询(.dbquery.ipynb )提交为 IPYNB 笔记本。 使用禁用的新 SQL 编辑器功能创建的查询可以放置在 Git 文件夹中,但不能提交到远程存储库。 |
仪表板 (公共预览版) | Databricks AI/BI 仪表板 (.lvdash.json ) 草稿可以作为 JSON 文件提交。 不会跟踪发布和排程配置,例如仓库选择和日程创建。 |
在 Git 中使用资产时,请观察文件命名的以下限制:
- 即使文件扩展名不同,文件夹也不能包含与同一 Git 存储库中另一个笔记本、文件或文件夹同名的笔记本。 (对于源格式笔记本,扩展适用于
.py
Python、.scala
Scala、.sql
SQL 和.r
R。对于 IPYNB 格式的笔记本,扩展为.ipynb.
)例如,不能使用同一 Git 文件夹中命名test1.py
的源格式笔记本和 IPYNB 笔记本,test1
因为源格式 Python 笔记本文件(test1.py
)将序列化为test1
,并且会发生冲突。 - 文件名不支持字符
/
。 例如,在 Git 文件夹中不能有一个名为i/o.py
的文件。
如果尝试对具有这些模式的名称的文件执行 Git作,将收到“提取 Git 状态时出错”消息。 如果意外收到此错误,请查看 Git 存储库中资产的文件名。 如果找到了名称具有这些冲突模式的文件,请重命名它们,然后重试操作。
不支持的资产类型
注释
可以将现有不受支持的资产移动到 Git 文件夹中,但无法将对它们所做的任何更改提交到远程存储库。
Git 文件夹中不支持的 Azure Databricks 资产类型包括:
- 旧警报
- 旧仪表板
- 实验
- Genie 空间
笔记本格式
有关 Git 文件夹的笔记本格式的详细信息,请参阅 笔记本格式。