使用 Terraform 自动执行 Unity 目录设置
可以使用 Databricks Terraform 提供程序自动设置 Unity Catalog。 本文提供了 Terraform 提供程序 Unity Catalog 部署指南和资源参考文档的链接,以及要求(“开始之前”)和验证与部署提示。
开始之前
要使用 Terraform 自动执行 Unity Catalog 设置,必须具备以下条件:
- Azure Databricks 帐户必须使用高级计划。
- 在 Azure 租户中,必须有权创建:
- 与 Azure Data Lake Storage Gen2 配合使用的存储帐户。 请参阅创建用于 Azure Data Lake Storage Gen2 的存储帐户。
- 用于保存系统分配的托管标识的新资源。 这要求你是租户中任何订阅中的资源组的
Contributor
或Owner
。
要使用 Databricks Terraform 提供程序为 Unity Catalog 配置元存储、元存储的存储、任何外部存储及其所有相关访问凭据,必须具备以下条件:
- 一个 Azure 帐户。
- Azure 帐户中的帐户级管理员用户。
- 在本地开发计算机上,需要配备以下组件:
Terraform CLI。 请查看 Terraform 网站上的下载 Terraform。
Azure CLI,使用对订阅拥有
Contributor
或Owner
权限的用户通过az login
命令登录。 请参阅如何安装 Azure CLI。 若要使用 Microsoft Entra ID 服务主体进行登录,请参阅使用 Microsoft Entra ID 服务主体登录 Azure CLI。 若要使用 Azure Databricks 用户帐户登录,请参阅使用 Azure Databricks 用户帐户登录 Azure CLI。注意
在对自动化工具、系统、脚本和应用进行身份验证时,安全性方面的最佳做法是使用 Microsoft Entra ID 服务主体通过
az login
命令登录。 请参阅使用服务主体登录和使用 Azure 服务主体进行身份验证。
要使用 Databricks Terraform 提供程序来配置所有其他 Unity Catalog 基础结构组件,必须具备以下条件:
- 一个 Azure Databricks 工作区。
- 在本地开发计算机上,需要配备以下组件:
- Terraform CLI。 请查看 Terraform 网站上的下载 Terraform。
- 以下项之一:
Databricks CLI 0.205 或更高版本,通过运行
databricks configure --host <workspace-url> --profile <some-unique-profile-name>
使用 Azure Databricks 个人访问令牌进行配置。 请参阅安装或更新 Databricks CLI 和 Azure Databricks 个人访问令牌身份验证。Azure CLI,通过
az login
命令登录。 请参阅如何安装 Azure CLI。 若要使用 Microsoft Entra ID 服务主体进行登录,请参阅使用 Microsoft Entra ID 服务主体登录 Azure CLI。 若要使用 Azure Databricks 用户帐户登录,请参阅使用 Azure Databricks 用户帐户登录 Azure CLI。注意
在对自动化工具、系统、脚本和应用进行身份验证时,安全性方面的最佳做法是使用 Microsoft Entra ID 服务主体通过
az login
命令登录。 请参阅使用服务主体登录和使用 Azure 服务主体进行身份验证。以下两个 Azure Databricks 环境变量:
DATABRICKS_HOST
,设置为工作区实例 URL 的值,例如https://dbc-1234567890123456.cloud.databricks.com
DATABRICKS_TOKEN
,设置为 Azure Databricks 个人访问令牌或 Microsoft Entra ID(以前称为 Azure Active Directory)令牌的值。 另请参阅监视和撤销个人访问令牌。
若要设置这些环境变量,请参阅操作系统文档。
Terraform 提供程序 Unity 目录部署指南和资源参考文档
若要了解如何部署所有先决条件并为工作区启用 Unity 目录,请参阅 Databricks Terraform 提供程序文档中 部署先决资源和启用 Unity 目录。
如果已有一些 Unity Catalog 基础结构组件,可以根据需要使用 Terraform部署其他 Unity Catalog 基础结构组件。 查看前一段落中提到的指南的各部分,以及 Databricks Terraform 提供程序文档的 Unity 目录部分。
验证、计划、部署或销毁资源
- 要在不部署 Terraform 配置的情况下验证其语法,请运行
terraform validate
命令。 - 若要显示 Terraform 部署配置需要执行的操作,请运行
terraform plan
命令。 此命令实际上并不会部署配置。 - 要部署配置,请运行
terraform deploy
命令。 - 要删除已部署的资源,请运行
terraform destroy
命令。