在 Databricks 笔记本之间共享代码

本文介绍如何使用文件来模块化代码,包括如何创建和导入 Python 文件。

Databricks 还支持多任务作业,它让你可以将笔记本合并到具有复杂依赖性的工作流中。 有关详细信息,请参阅创建并运行 Azure Databricks 作业

使用文件将代码模块化

使用 Databricks Runtime 11.2 及更高版本,可以在 Azure Databricks 工作区中创建和管理源代码文件,然后根据需要将这些文件导入到笔记本中。 还可以使用 Databricks 存储库将文件与 Git 存储库同步。 有关详细信息,请参阅使用 Python 和 R 模块

创建文件

若要创建文件,请执行以下操作:

  1. 导航到工作区中的某个文件夹
  2. 右键单击文件夹名称,然后选择“创建 > 文件”。
  3. 输入文件的名称,然后单击“创建文件”或按 Enter。 该文件将在编辑器窗口中打开。 更改会自动保存。

打开文件

导航到工作区中的文件并单击它。 将鼠标悬停在文件名上会显示文件路径。

将文件导入笔记本

可以使用标准 Python import 命令将文件导入笔记本:

假设有以下文件:

用于定义函数的文件

可以将该文件导入笔记本,并调用文件中定义的函数:

将文件导入笔记本

运行文件

可以在编辑器中运行文件。 这可以方便进行测试。 若要运行文件,请将光标置于代码区域,然后按 Shift + Enter 以运行所在的单元格;或者,突出显示单元格中的代码,然后按 Shift + Ctrl + Enter 以便仅运行选定的代码。

删除文件

请参阅文件夹工作区对象操作,了解如何访问工作区菜单,以及如何删除工作区中的文件或其他项。

重命名文件

若要更改已打开的文件的标题,请单击标题并进行内联编辑,或单击“文件”>“重命名”。

控制对文件的访问

如果 Azure Databricks 帐户有高级计划,你可以使用工作区访问控制来控制谁有权访问文件。