Databricks 资产捆绑包教程

Databricks 资产捆绑包描述 Databricks 资源(例如作业和管道)作为源文件,使你能够包含元数据以及这些源文件来预配基础结构和其他资源,并提供项目的端到端定义,这些定义全部打包为单个可部署项目。 请参阅什么是 Databricks 资产捆绑包?

本页概述了可用于帮助你了解如何开发 Databricks 资产捆绑包的教程。

教程 DESCRIPTION
使用 Databricks 资产捆绑包开发作业 创建捆绑包以编程方式管理作业。 捆绑包是使用用于 Python 的 Databricks 资产捆绑包默认捆绑模板创建的,该模板由笔记本和要运行作业的定义组成。 然后,在 Databricks 工作区中验证、部署和运行已部署的作业。
使用 Databricks 资产捆绑包开发 DLT 管道 创建捆绑包以编程方式管理 DLT 管道。 捆绑包通过 Databricks 资产捆绑包的 Python 默认捆绑包模板创建,该模板包含一个笔记本以及用于运行该笔记本的管道和作业定义。 然后,在 Databricks 工作区中验证、部署和运行部署的管道。
使用 Databricks 资产捆绑生成 Python 滚轮文件 生成、部署和运行 Python 滚轮作为 Databricks 资产捆绑项目的一部分。
使用 Databricks 资产捆绑构建 Scala JAR 生成、部署和运行 Scala JAR 作为 Databricks 资产捆绑项目的一部分。
适用于MLOps架构的Databricks资产包 创建 MLOps Stacks 套件。 MLOps Stack 是 Databricks 上的 MLOps 项目,遵循现成的生产最佳做法。
手动创建捆绑包 从头开始创建捆绑包,而无需使用模板。 此简单捆绑包包含两个笔记本,以及用于运行这些笔记本的 Databricks 作业定义。 然后,在 Databricks 工作区中验证、部署和运行作业。
创建自定义 Databricks 资产捆绑模板 创建自定义 Databricks 资产捆绑包模板,用于创建捆绑包,以在特定 Docker 容器映像的群集上运行具有特定 Python 任务的作业。 有关自定义捆绑模板的信息,请参阅 自定义捆绑模板