可以使用 Terraform 和 databricks_repo Terraform 资源在完全自动化的环境中管理 Databricks Git 文件夹。 在 Terraform 配置文件(.tf
)中,将 databricks_repo
设置为用于 Git 文件夹的 Git 存储库的 URL。
resource "databricks_repo" "this" {
url = "https://github.com/user/demo.git"
}
若要使用具有特定 Git 凭据的 Azure Databricks 服务主体,请配置以下提供程序和资源。
将提供程序
databricks
设置为 Azure Databricks 工作区的 URL。 你将在另一步中定义访问令牌databricks_obo_token
。provider "databricks" { # Configuration options } # Example 'databricks' provider configuration provider "databricks" { alias = "sp" host = "https://....cloud.databricks.com" token = databricks_obo_token.this.token_value }
定义 Azure Databricks 服务主体和授权令牌的资源。 可以在 Azure Databricks 帐户控制台的用户管理>服务主体下找到服务主体名称。
resource "databricks_service_principal" "sp" { display_name = "<service_principal_name_here>" }
使用应用程序 ID 为你的 Azure Databricks 服务主体帐户设置授权令牌。 可以在 Azure Databricks 帐户控制台的用户管理>服务主体中找到服务主体的应用程序 ID。
resource "databricks_obo_token" "this" { application_id = databricks_service_principal.sp.application_id comment = "PAT on behalf of ${databricks_service_principal.sp.display_name}" lifetime_seconds = 3600 }
设置服务主体用于访问 Azure Databricks 工作区的 Git 凭据。
resource "databricks_git_credential" "sp" { provider = databricks.sp depends_on = [databricks_obo_token.this] git_username = "<the_git_user_account_used_by_the_servcie_principal>" git_provider = "<your_git_provider_string here>" personal_access_token = "<auth_token_string_for_git_user>" }