使用全局 init 脚本

重要

全局 init 脚本仅在配置了单用户或旧版无隔离共享访问模式的群集上运行,因此 Databricks 建议将所有 init 脚本配置为群集范围的 init 脚本,并使用群集策略跨工作区管理这些脚本。

全局 init 脚本在工作区中创建的每个群集上运行。 如果希望强制执行组织范围的库配置或安全屏幕,建议使用全局 init 脚本。 只有工作区管理员才能创建全局 init 脚本。 你可以使用 UI 或 REST API 来创建它们。

重要

由于全局 init 脚本在所有群集上运行,因此请考虑以下潜在影响:

  • 可以轻松地添加库,或者进行其他可能造成意外影响的修改。 应尽可能使用群集范围 init 脚本。
  • 创建群集并启用群集日志传送的任何用户都可以查看全局 init 脚本的 stderrstdout 输出。 应确保全局 init 脚本不输出任何敏感信息。

可通过配置日志传送并检查 init 脚本日志来排查全局 init 脚本问题。 请参阅 init 脚本日志记录

注意

全局 init 脚本不在提供群集的模型上运行。

使用 UI 添加全局 init 脚本

若要使用管理员设置来配置全局 init 脚本,请执行以下操作:

  1. 转到管理员设置,然后单击“计算”选项卡

  2. 单击“全局初始化脚本”旁边的“管理”

  3. 单击“+ 添加”。

  4. 通过在“脚本”字段中键入内容、粘贴或拖动文本文件,为脚本命名。

    注意

    Init 脚本不能大于 64KB。 如果脚本超过该大小,则尝试保存时将出现错误消息。

  5. 如果为工作区配置了多个全局 init 脚本,请设置新脚本的运行顺序。

  6. 要在保存后为所有新群集和重启的群集启用脚本,请切换为“启用”。

    重要

    添加全局 init 脚本或对 init 脚本的名称、运行顺序或启用状态进行更改时,这些更改在重启群集后才会生效。

  7. 单击“添加” 。

使用 Terraform 添加全局 init 脚本

可以使用 Databricks Terraform 提供程序databricks_global_init_script 添加全局 init 脚本。

使用 UI 编辑全局 init 脚本

  1. 转到管理员设置,然后单击“计算”选项卡
  2. 单击“全局初始化脚本”旁边的“管理”
  3. 单击一个脚本。
  4. 编辑该脚本。
  5. 单击“确认” 。

使用 API 配置全局 init 脚本

工作区管理员可以使用全局 Init 脚本 API 在工作区中添加、删除、重新排序并获取有关全局 init 脚本的信息。