计算配置参考

项目
2025-04-22

注意

本文的结构假定你使用的是简单形式的计算用户界面。有关简单窗体更新的概述，请参阅 “使用简单窗体管理计算”。

本文介绍创建新的用途或作业计算资源时可用的配置设置。大多数用户使用分配的策略创建计算资源，这会限制可配置的设置。如果在 UI 中看不到特定设置，这是因为你选择的策略不允许你配置该设置。

简单计算表单

本文中所述的配置和管理工具适用于通用计算和作业计算。有关配置作业计算的更多注意事项，请参阅配置作业的计算。

创建新的通用计算资源

若要创建新的通用计算资源：

单击工作区侧栏中的“计算”。
单击“创建计算”按钮。
配置计算资源。
单击 “创建” 。

新的计算资源将自动启动，很快即可使用。

计算策略

策略是用于限制用户在创建计算资源时可用的配置选项的一组规则。如果用户没有不受限制的群集创建权利，则他们只能使用已授予的策略创建计算资源。

若要根据策略创建计算资源，请从“策略”下拉菜单中选择一个策略。

默认情况下，所有用户都有权访问个人计算策略，通过该策略可以创建单个计算机的计算资源。如果需要访问个人计算或任何其他策略，请联系你的工作区管理员。

性能设置

以下设置显示在简单窗体计算 UI 的 “性能 ”部分下：

Databricks Runtime 版本
使用 Photon 加速
工作器节点类型
单节点计算
启用自动缩放
高级性能设置

Databricks Runtime 版本

Databricks Runtime 是在计算环境中运行的核心组件集。使用“Databricks Runtime 版本”下拉菜单选择运行时。有关具体 Databricks Runtime 版本的详细信息，请参阅 Databricks Runtime 发行说明版本和兼容性。所有版本都包含 Apache Spark。 Databricks 建议如下：

对于通用计算，请使用最新版本来确保代码和预加载包之间的最新优化和兼容性。
对于运行操作工作负载的作业计算，请考虑使用长期支持 (LTS) Databricks Runtime 版本。使用 LTS 版本可确保不会遇到兼容性问题，并且可以在升级之前全面测试工作负载。
对于数据科学和机器学习用例，可考虑使用 Databricks Runtime ML 版本。

使用 Photon 加速

默认情况下，在运行 Databricks Runtime 9.1 LTS 及更高版本的计算上启用 Photon。

要启用或禁用 Photon 加速，请选择“使用 Photon 加速”复选框。若要详细了解 Photon，请参阅什么是 Photon？。

工作器节点类型

计算资源由一个驱动程序节点和零个或多个工作器节点组成。你可以为驱动程序节点和工作器节点分别选取不同的云提供程序实例类型，虽然默认情况下驱动程序节点使用与工作器节点相同的实例类型。驱动程序节点设置位于 “高级性能 ”部分下。

不同的实例类型系列适用于不同的用例，例如内存密集型工作负荷或计算密集型工作负荷。还可以选择要用作辅助角色或驱动程序节点的池。

重要

不要将具有现成实例的池用作驱动程序类型。请选择按需驱动程序类型，以防止驱动程序被回收。请参阅连接到池。

在多节点计算中，工作器节点运行 Spark 执行程序和正常运行计算资源所需的其他服务。通过 Spark 分配工作负载时，所有分布式处理都在工作器节点上进行。 Azure Databricks 每个工作节点运行一个执行器。因此，“执行程序”和“工作器”这两个术语可在 Databricks 体系结构的上下文中互换使用。

提示

若要运行 Spark 作业，至少需要一个工作器节点。如果计算资源没有工作器，你可以在驱动程序节点上运行非 Spark 命令，但 Spark 命令会失败。

工作器节点 IP 地址

Azure Databricks 启动工作器节点，每个节点有两个专用 IP 地址。节点的主要专用 IP 地址托管 Azure Databricks 内部流量。 Spark 容器使用辅助专用 IP 地址进行群集内通信。此模型使 Azure Databricks 能够在同一工作区中的多个计算资源之间提供隔离。

GPU 实例类型

对于在计算方面富有挑战性并且对性能要求很高的任务（例如与深度学习相关的任务），Azure Databricks 支持通过图形处理单元 (GPU) 进行加速的计算资源。有关详细信息，请参阅支持 GPU 的计算。

单节点计算

使用 “单节点 ”复选框可以创建单个节点计算资源。

单节点计算适用于使用少量数据或非分布式工作负载（例如单节点机器学习库）的作业。多节点计算应用于具有分布式工作负载的大型作业。

单节点属性

单节点计算资源具有以下属性：

在本地运行 Spark。
在没有工作器节点的情况下，驱动程序既充当主节点又充当工作器节点。
为计算资源中的每个逻辑核心生成一个执行程序线程，并为驱动程序减去 1 个核心。
将所有 stderr、stdout 和 log4j 日志输出保存在驱动程序日志中。
不能转换为多节点计算资源。

选择单节点或多节点

在决定是要选择单节点还是多节点计算时，请考虑你的用例：

大规模数据处理将耗尽单节点计算资源上的资源。对于这些工作负载，Databricks 建议使用多节点计算。
单节点计算并非旨在用于共享。为了避免资源冲突，Databricks 建议在必须共享计算时使用多节点计算资源。
多节点计算资源无法缩放为 0 个工作器。请改用单节点计算。
单节点计算与进程隔离不兼容。
单节点计算未启用 GPU 调度。

在单节点计算中，Spark 无法读取具有 UDT 列的 Parquet 文件。将出现以下错误消息：

The Spark driver has stopped unexpectedly and is restarting. Your notebook will be automatically reattached.

若要解决此问题，请禁用本机 Parquet 读取器：

spark.conf.set("spark.databricks.io.parquet.nativeReader.enabled", False)

启用自动缩放

选中“启用自动缩放”后，可以为计算资源指定工作器的最小数目和最大数目。然后，Databricks 会选择运行作业所需的适当工作器数量。

若要设置计算资源的工作器数量的最小值和最大值，以便自动调整规模，请使用工作器类型下拉列表旁边的Min和Max字段。

如果未启用自动缩放，则必须在“工作器类型”下拉列表旁边的“工作器”字段中输入固定数量的工作器。

注释

当计算资源正在运行时，计算详细信息页将显示分配的工作器数量。可以将分配的工作人员数量与工作人员配置进行比较，并根据需要进行调整。

自动缩放的优点

使用自动缩放，Azure Databricks 可以根据作业特征动态地重新分配工作节点。在计算方面，管道的某些部分可能比其他部分的要求更高，Databricks 会自动在作业的这些阶段添加额外的工作器（并在不再需要它们时将其删除）。

通过自动缩放，可更轻松地实现高利用率，因为无需预配计算以匹配工作负载。这特别适用于其需求随时间变化的工作负荷（例如在一天的过程中浏览数据集），但也可能适用于预配要求未知的、时间较短的一次性工作负荷。因此，自动缩放有两个优点：

与大小恒定且未充分预配的计算资源相比，工作负载的运行速度更快。
与静态大小的计算资源相比，自动缩放可以降低总体成本。

自动缩放可以提供这两个优点之一，也可以同时提供这两个优点，具体取决于计算资源和工作负载的恒定大小。当云服务提供商终止实例时，计算大小可能会小于所选工作器的最小数目。在这种情况下，Azure Databricks 会通过连续重试来重新预配实例，以便保持最小数量的工作器。

注意

自动缩放不适用于 spark-submit 作业。

注意

计算自动缩放在缩减结构化流式处理工作负载的群集大小方面存在限制。 Databricks 建议将 DLT 与增强式自动缩放用于流式处理工作负载。请参阅使用增强的自动缩放优化 DLT 管道的群集利用率。

自动缩放的行为方式

基于高级计划的工作区使用优化的自动缩放。标准定价计划上的工作区使用标准自动缩放。

优化的自动缩放具有以下特征：

通过 2 个步骤从最小值纵向扩展到最大值。
即使计算资源未处于空闲状态，也可以通过查看 shuffle 文件状态进行纵向缩减。
按当前节点数的某个百分比进行纵向缩减。
在计算作业中，如果在过去 40 秒内计算资源未得到充分利用，请纵向缩减。
在通用计算中，如果在过去 150 秒内计算资源未得到充分利用，请纵向缩减。
spark.databricks.aggressiveWindowDownS Spark 配置属性以秒为单位指定计算做出纵向缩减决策的频率。增大此值会导致计算资源缩减的速度更加缓慢。最大值为 600。

标准自动缩放用于标准计划工作区。标准自动缩放具有以下特征：

从添加 8 个节点开始。然后以指数级方式纵向扩展，执行达到最大值所需的任意步骤。
当 90% 的节点 10 分钟不繁忙且计算已空闲至少 30 秒时，纵向缩减。
从 1 个节点开始，以指数方式进行纵向缩减。

通过池实现自动缩放

如果您要将计算资源连接到池中，请考虑以下事项：

请确保请求的计算大小小于或等于池中空闲实例的最小数目。如果它较大，计算启动时间与不使用池时的计算启动时间相当。
请确保计算最大大小不超过池的最大容量。如果时间更长，则无法创建群集。

自动缩放示例

如果将静态计算资源重新配置为自动缩放，Azure Databricks 会立即在最小值和最大值边界内重设计算资源的大小，然后开始自动缩放。例如，下表展示了在将计算资源重新配置为在 5 到 10 个节点之间进行自动缩放时，具有特定初始大小的计算资源会发生什么情况。

初始大小	重新配置后的大小
6	6
12	10
3	5

高级性能设置

以下设置显示在简单格式计算 UI 的 “高级性能 ”部分下。

自动终止
驱动程序类型

自动终止

可以在 “高级性能 ”部分下为计算设置自动终止。在创建计算资源时，请指定一个以分钟为单位的不活动期，在该不活动期后计算资源将被终止。

如果当前时间与计算资源上运行的最后一个命令之间的差值大于处于不活动状态指定时间，则 Azure Databricks 会自动终止该计算资源。有关计算终止的详细信息，请参阅终止计算。

驱动程序类型

可以在 “高级性能 ”部分下选择驱动程序类型。驱动程序节点保留附加到计算资源的所有笔记本的状态信息。驱动程序节点还维护 SparkContext，解释从笔记本或计算资源上的库中运行的所有命令，并运行与 Spark 执行程序协同工作的 Apache Spark 主节点。

驱动程序节点类型的默认值与工作器节点类型相同。如果计划使用 collect() 从 Spark 工作器处收集大量数据，并在笔记本中分析这些数据，则可以选择具有更多内存的更大驱动程序节点类型。

提示

由于驱动程序节点保留附加的笔记本的所有状态信息，因此，请务必将未使用的笔记本与驱动程序节点分离。

标记

通过标记，可以轻松监视组织中各种组使用的计算资源成本。在创建计算时将标记指定为键值对，Azure Databricks 会将这些标记应用于 VM 和磁盘卷等云资源以及 DBU 使用情况报告。

对于从池启动的计算，自定义标记仅适用于 DBU 使用情况报告，不会传播到云资源。

若要详细了解池和计算标记类型如何协同工作，请参阅使用标记来归因使用情况

若要将标记添加到计算资源中，请执行以下操作：

在“标记”部分中，为每个自定义标记添加一个键值对。
单击“添加”。

高级设置

以下设置显示在简单表单计算 UI 的“高级”部分下：

访问模式
启用自动缩放本地存储
本地磁盘加密
Spark 配置
SSH 访问计算机
环境变量
计算日志传输

访问模式

访问模式是一项安全功能，用于确定谁可以使用计算资源以及他们可以使用计算资源访问的数据。 Azure Databricks 中的每个计算资源都具有访问模式。访问模式设置位于简单窗体计算 UI 的 “高级 ”部分下。

默认情况下，访问模式选择为 “自动 ”，这意味着根据所选的 Databricks Runtime 自动选择访问模式。机器学习运行时和低于 14.3 的 Databricks 运行时默认使用专用，否则使用标准。

Databricks 建议对所有工作负荷使用标准访问模式。仅当标准访问模式不支持所需的功能时，才使用专用访问模式。

访问模式	对用户可见	UC 支持	支持的语言	说明
专用（以前是单个用户）	始终	是	Python、SQL、Scala、R	可以分配给单个用户或组并使用。
标准（以前为“共享”）	始终	是	Python、SQL、Scala（在使用 Databricks Runtime 13.3 LTS 及更高版本的已启用 Unity Catalog 的计算上）	可由多个用户使用，在用户之间进行数据隔离。

有关每种访问模式的功能支持的详细信息，请参阅 Unity 目录的计算访问模式限制。

注意

在 Databricks Runtime 13.3 LTS 及更高版本中，所有访问模式都支持初始化脚本和库。要求和支持级别各不相同。请参阅初始化脚本可以安装在哪里？和计算范围库。

启用自动缩放本地存储

通常，估算特定作业会占用的磁盘空间量十分困难。为了让您在创建计算时不必估算需要附加的托管磁盘的 GB 数，Azure Databricks 自动在所有 Azure Databricks 计算上启用本地存储自动缩放功能。

在自动缩放本地存储时，Azure Databricks 会监视计算节点上 Spark 工作器的可用磁盘空间量。如果工作器开始出现磁盘空间严重不足的情况，则 Databricks 会在该工作器的磁盘空间耗尽之前自动将新的托管磁盘附加到该工作器。附加磁盘时，每个虚拟机的总磁盘空间（包括虚拟机的初始本地存储）存在 5 TB 的限制。

仅当虚拟机返回到 Azure 时，才会拆离附加到虚拟机的托管磁盘。也就是说，只要托管磁盘是某个正在运行的计算的一部分，就永远不会从虚拟机中拆离。若要纵向缩减托管磁盘使用量，Azure Databricks 建议在配置了自动缩放计算或自动终止的计算中使用此功能。

本地磁盘加密

重要

此功能目前以公共预览版提供。

用于运行计算的某些实例类型可能有本地附加的磁盘。 Azure Databricks 可以在这些本地附加的磁盘上存储 shuffle 数据或临时数据。为了确保针对所有存储类型加密所有静态数据（包括在计算资源的本地磁盘上暂时存储的 shuffle 数据），可以启用本地磁盘加密。

重要

工作负载的运行速度可能会更慢，因为在本地卷中读取和写入加密的数据会影响性能。

启用本地磁盘加密时，Azure Databricks 会在本地生成一个加密密钥，该密钥特定于每个计算节点，可以用来加密存储在本地磁盘上的所有数据。此密钥的作用域是每个计算节点的本地，会与计算节点本身一起销毁。在其生存期内，密钥驻留在内存中进行加密和解密，并以加密形式存储在磁盘上。

若要启用本地磁盘加密，必须使用群集 API。在计算创建或编辑期间，将 enable_local_disk_encryption 设为 true。

Spark 配置

若要微调 Spark 作业，可以提供自定义 Spark 配置属性。

在计算配置页上，单击“ 高级 ”开关。
单击“Spark”选项卡。

在“Spark 配置”中，以每行一对键值对的形式输入配置属性。

使用群集 API 配置计算时，请在spark_conf 或更新群集 API 的字段中设置 Spark 属性。

若要在计算上强制实施 Spark 配置，工作区管理员可以使用计算策略。

从机密中检索 Spark 配置属性

Databricks 建议在机密而不是纯文本中存储敏感信息（例如密码）。若要在 Spark 配置中引用机密，请使用以下语法：

spark.<property-name> {{secrets/<scope-name>/<secret-name>}}

例如，将一个名为 password 的 Spark 配置属性设置为 secrets/acme_app/password 中存储的机密值：

spark.password {{secrets/acme-app/password}}

有关详细信息，请参阅管理机密。

通过 SSH 访问计算资源

出于安全原因，Azure Databricks 中的 SSH 端口默认处于关闭状态。如果要启用通过 SSH 访问 Spark 群集，请参阅通过 SSH 连接到驱动程序节点。

注意

仅当你的工作区部署在你自己的 Azure 虚拟网络中时，才能启用 SSH。

环境变量

配置可从计算资源上运行的 Init 脚本访问的自定义环境变量。 Databricks 还提供你可在 init 脚本中使用的预定义环境变量。不能替代这些预定义的环境变量。

在计算配置页上，单击“ 高级 ”开关。
单击“Spark”选项卡。
在“环境变量”字段中设置 环境变量 。

此外，还可以使用spark_env_vars 或更新群集 API 中的字段设置环境变量。

计算日志传送

创建通用或作业计算时，可以指定一个位置，以便为 Spark 驱动程序节点、工作器节点和事件传送群集日志。日志每五分钟传递一次，并在所选目标中每小时存档一次。 Databricks 将传送生成的所有日志，直到计算资源终止。

若要配置日志传送位置，请执行以下步骤：

在计算页上，单击“ 高级 ”开关。
单击“日志记录”选项卡。
选择目标类型。
输入 日志路径。

为了存储日志，Databricks 会在所选日志路径中创建一个子文件夹，以计算 cluster_id名称命名。

例如，如果指定的日志路径为 /Volumes/catalog/schema/volume，则会将 06308418893214 的日志传递到 /Volumes/catalog/schema/volume/06308418893214。

注意

“将日志传输到卷”功能现为公共预览版，并且仅支持用于使用“标准”或“专用”访问模式的已启用 Unity-Catalog 的计算。如果选择卷作为路径，请确保你对该卷具有 READ VOLUME 和 WRITE VOLUME 权限。请参阅卷有哪些权限？。

注意

此功能在 REST API 中也可用。请参阅群集 API。

通过