从卷安装库

本文将指导你完成将库或 requirements.txt 文件上传到卷,并将其安装到 Azure Databricks 中的群集所要执行的步骤。 可以将库安装到全用途计算或作业计算上。

有关卷的详细信息,请参阅“什么是 Unity Catalog 卷?”。 有关使用 Unity Catalog(包括控制访问和创建对象)的信息,请参阅什么是 Unity Catalog?

有关完整的库兼容性详细信息,请参阅群集范围的库

将库加载到卷

要将库加载到卷,请执行以下操作:

  1. 单击左侧边栏中的 “目录”图标目录”。
  2. 在目录资源管理器树中,导航到卷。
  3. 单击“+添加”,然后选择“上传到此卷”
  4. 将显示“将文件上传到卷”对话框。 拖放或浏览到要上传的文件,然后单击“上传”。

将卷中的库安装到群集

将库安装到群集上时,在该群集上运行的所有笔记本都有权访问该库。

若要将卷中的库安装到群集上,请执行以下操作:

  1. 单击左侧边栏中的 计算图标计算”。
  2. 在群集列表中单击群集的名称。
  3. 单击“库”选项卡。
  4. 单击“新安装”。 将显示“安装库”对话框。
  5. 对于“库源”,请选择“卷”
  6. 上传库或 requirements.txt 文件,在“卷”浏览器中浏览到该库或 requirements.txt 文件,或者在“卷文件路径”字段中输入其位置,如下所示:/Volumes/<catalog>/<schema>/<volume>/<path-to-library>/<file-name>.<ext>
  7. 单击“安装” 。

从卷向工作流任务添加依赖库

若要从卷配置具有从属库的工作流任务,请执行以下操作:

  1. 选择工作流中的现有任务或创建新任务。
  2. 请在“依赖库”旁边单击“+ 添加”。
  3. 在“添加依赖库”对话框中,为“库源”选择“卷”
  4. 上传库或 requirements.txt 文件,在“卷”浏览器中浏览到该库或 requirements.txt 文件,或者在“卷文件路径”字段中输入其位置,如下所示:/Volumes/<catalog>/<schema>/<volume>/<path-to-library>/<file-name>.<ext>
  5. 单击“安装” 。

将卷中的库安装到笔记本

可以将 Python 库直接安装到笔记本,以创建特定于该笔记本的自定义 Python 环境。 例如,可以在笔记本中使用特定版本的库,而不会影响群集上可能需要相同库的不同版本的其他用户。 有关详细信息,请参阅笔记本范围内的库

向笔记本安装库时,只有当前笔记本以及与该笔记本关联的任何作业有权访问该库。 附加到同一群集的其他笔记本不受影响。

以下代码演示如何将卷中的 Python wheel 文件作为笔记本范围内的库安装到笔记本中。

%pip install /Volumes/<catalog>/<schema>/<volume>/<path-to-library>/mypackage-0.0.1-py3-none-any.whl

%pip install /Volumes/<catalog>/<schema>/<volume>/<path-to-project>/requirements.txt