从卷安装库
本文将指导你完成将库或 requirements.txt 文件上传到卷,并将其安装到 Azure Databricks 中的群集所要执行的步骤。 可以将库安装到全用途计算或作业计算上。
有关卷的详细信息,请参阅“什么是 Unity Catalog 卷?”。 有关使用 Unity Catalog(包括控制访问和创建对象)的信息,请参阅什么是 Unity Catalog?。
有关完整的库兼容性详细信息,请参阅群集范围的库。
将库加载到卷
要将库加载到卷,请执行以下操作:
- 单击左侧边栏中的 “目录”。
- 在目录资源管理器树中,导航到卷。
- 单击“+添加”,然后选择“上传到此卷”。
- 将显示“将文件上传到卷”对话框。 拖放或浏览到要上传的文件,然后单击“上传”。
将卷中的库安装到群集
将库安装到群集上时,在该群集上运行的所有笔记本都有权访问该库。
若要将卷中的库安装到群集上,请执行以下操作:
- 单击左侧边栏中的 “计算”。
- 在群集列表中单击群集的名称。
- 单击“库”选项卡。
- 单击“新安装”。 将显示“安装库”对话框。
- 对于“库源”,请选择“卷”。
- 上传库或 requirements.txt 文件,在“卷”浏览器中浏览到该库或 requirements.txt 文件,或者在“卷文件路径”字段中输入其位置,如下所示:
/Volumes/<catalog>/<schema>/<volume>/<path-to-library>/<file-name>.<ext>
。 - 单击“安装” 。
从卷向工作流任务添加依赖库
若要从卷配置具有从属库的工作流任务,请执行以下操作:
- 选择工作流中的现有任务或创建新任务。
- 请在“依赖库”旁边单击“+ 添加”。
- 在“添加依赖库”对话框中,为“库源”选择“卷”。
- 上传库或 requirements.txt 文件,在“卷”浏览器中浏览到该库或 requirements.txt 文件,或者在“卷文件路径”字段中输入其位置,如下所示:
/Volumes/<catalog>/<schema>/<volume>/<path-to-library>/<file-name>.<ext>
。 - 单击“安装” 。
将卷中的库安装到笔记本
可以将 Python 库直接安装到笔记本,以创建特定于该笔记本的自定义 Python 环境。 例如,可以在笔记本中使用特定版本的库,而不会影响群集上可能需要相同库的不同版本的其他用户。 有关详细信息,请参阅笔记本范围内的库。
向笔记本安装库时,只有当前笔记本以及与该笔记本关联的任何作业有权访问该库。 附加到同一群集的其他笔记本不受影响。
以下代码演示如何将卷中的 Python wheel 文件作为笔记本范围内的库安装到笔记本中。
%pip install /Volumes/<catalog>/<schema>/<volume>/<path-to-library>/mypackage-0.0.1-py3-none-any.whl
或
%pip install /Volumes/<catalog>/<schema>/<volume>/<path-to-project>/requirements.txt