Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
本页介绍如何跨工作区创建和管理工作区基础环境。 工作区基础环境允许工作区管理员为无服务器笔记本创建和管理预构建的缓存环境。
Permissions
- 只有工作区管理员可以创建和管理工作区的基本环境。
- 所有工作区用户都有权访问工作区的基本环境。
- 所有工作区用户可以创建自定义无服务器环境规范。
Azure Databricks中工作区的基本环境如何工作
在 Azure Databricks 中,基本环境是一个可共享的 YAML 规范,用于定义 无服务器环境版本 和一组适用于无服务器笔记本的其他 Python 依赖项。 工作区管理员创建和管理基本环境,以便用户可以从一致的缓存环境快速开始,并选择性地添加自己的库。
使用工作区基础环境
用户可以从“环境”侧面板中的“基本环境”下拉列表中选择工作区基础环境。 工作区基础环境与 标准、 AI 和 自定义等其他选项一起显示在下拉列表中。
选择工作区基础环境后,预生成的缓存环境会快速加载,从而减少笔记本和作业的启动时间。 对于作业,使用工作区基础环境可提高性能,因为已缓存依赖项。
有关在笔记本中配置基本环境的说明,请参阅 “选择基础环境”。 有关在作业中使用托管基础环境的说明,请参阅 作业中的托管基础环境。
创建和导出环境规范
创建有效的 YAML 规范的最简单方法是在 “环境 ”端面板中生成环境,然后使用 “导出环境 ”按钮下载 YAML 文件。
- 打开笔记本并连接到无服务器计算。
- 在笔记本的侧面板中单击“ 环境
按钮。
- 在 “基本环境”下,选择“ 标准 ”或使用 “更多 ”选择特定环境版本。 Databricks 建议使用工作区支持的最新无服务器环境版本。
- 在 “依赖项 ”字段中,添加希望基本环境具有的任何依赖项。 输入每个依赖项后,单击 “添加 依赖项”。 有关添加依赖项的更多说明,请参阅 向笔记本添加依赖项。
- 单击环境面板底部的 “应用 ”,确保规范有效。
- 单击“烤肉”菜单
在环境面板底部,然后单击“ 导出环境”。
- 为 YAML 文件命名并添加到工作区文件夹或 Unity 目录卷。
示例环境规范
以下示例 YAML 基于 MLflow 项目环境规范。 它定义了一个基本环境,其中包含一些库依赖项:
environment_version: '5'
dependencies:
- --index-url https://pypi.org/simple
- -r "/Workspace/Shared/requirements.txt"
- my-library==6.1
- /Workspace/Shared/Path/To/simplejson-3.19.3-py3-none-any.whl
- git+https://github.com/databricks/databricks-cli
将基础环境添加到工作区
若要将环境规格作为基础环境添加到工作区,请执行以下操作:
- 在工作区中,转到“设置”。
- 在 “工作区管理员”下,选择“ 计算”。
- 在 用于无服务器计算的基本环境旁边,单击“ 管理”。
- 单击“ 创建新环境”。
- 为基本环境命名。 这是用户在 “基本环境” 下拉菜单中看到的名称。
- 使用文件选取器选择环境规范 YAML 文件。 可以浏览工作区文件或 Unity 目录卷。
- 单击 “创建” 。
基础环境将开始构建。 在基本环境列表中检查 “状态 ”列。 它将在准备就绪时更改为 “准备使用 ”。
设置工作区的默认基础环境
默认情况下,工作区中的无服务器笔记本不使用基本环境。 工作区管理员可以选择默认应用于所有新笔记本的基本环境。
- 在工作区中,转到“设置”。
- 在 “工作区管理员”下,选择“ 计算”。
- 在 用于无服务器计算的基本环境旁边,单击“ 管理”。
- 单击基础环境旁边的星形图标将其设置为默认值。
所有新的无服务器笔记本现在都将默认为所选的基础环境。
更新基础环境
可能需要编辑基本环境文件以更新版本号,或者添加或删除依赖项。 若要更改环境版本或依赖项,请直接编辑源 YAML 文件。
在基本环境列表中,单击要更新的基本环境的 YAML 文件路径。 这会在新选项卡中打开该文件。可以在其中查看或更新文件内容。 更改会自动保存。
更新 YAML 规范后,必须刷新基本环境,以便笔记本和作业选取最新的配置。
- 在要刷新的基本环境旁边,单击烤肉串菜单
然后选择“ 刷新”。
- 单击“确认”。
新会话现在使用更新的基本环境。 必须重启现有笔记本会话才能获取更新。
局限性
基本环境具有以下限制:
- 作业中的基本环境仅支持笔记本、Python脚本和Python轮任务类型。 不支持其他任务类型。 对作业中的工作区基础环境的支持处于 Beta 阶段。
- Lakeflow Spark 声明性管道不支持基本环境。
- 运行时仅安装依赖项列表下的 Python 依赖项。
- 不支持无服务器环境版本 1。 使用版本 2 或更高版本。
- 基本环境适用于所有工作区用户。
- 工作区限制为 10 个基本环境。