在 Azure 机器学习中附加和管理 Synapse Spark 池

适用范围:Azure CLI ml 扩展 v2(最新版)Python SDK azure-ai-ml v2(最新版)

本文介绍如何在 Azure 机器学习中附加 Synapse Spark 池。 可以通过以下方式之一在 Azure 机器学习中附加 Synapse Spark 池:

  • 使用 Azure 机器学习工作室 UI
  • 使用 Azure 机器学习 CLI
  • 使用 Azure 机器学习 Python SDK

先决条件

在 Azure 机器学习中附加 Synapse Spark 池

Azure 机器学习提供了用于附加和管理 Synapse Spark 池的不同方法。

若要使用工作室“计算”选项卡附加 Synapse Spark 池:

显示创建新 Synapse Spark 池的屏幕截图。

  1. 在左侧窗格中的“管理”部分,选择“计算”。
  2. 选择“附加的计算”。
  3. 在“附加的计算”屏幕上,选择“新建”以查看用于附加不同类型的计算的选项。
  4. 选择“Synapse Spark 池”。

“附加 Synapse Spark 池”面板将在屏幕右侧打开。 在此面板中:

  1. 输入一个名称,该名称引用 Azure 机器学习资源中附加的 Synapse Spark 池

  2. 从下拉菜单中选择一个 Azure 订阅。

  3. 从下拉菜单中选择一个 Synapse 工作区。

  4. 从下拉菜单中选择一个 Spark 池。

  5. 切换“分配托管标识”选项以启用它。

  6. 选择要与此附加的 Synapse Spark 池一起使用的托管标识类型。

  7. 选择“更新”,完成 Synapse Spark 池附加过程。

在 Azure Synapse Analytics 中添加角色分配

若要确保附加的 Synapse Spark 池正常工作,请从 Azure Synapse Analytics 工作室 UI 为其分配管理员角色。 以下步骤显示如何执行此操作:

  1. 在 Azure 门户中打开 Synapse 工作区。

  2. 在左窗格中,选择“概述”。

    显示打开 Synapse Studio 的屏幕截图。

  3. 选择“打开 Synapse Studio”。

  4. 在 Azure Synapse Analytics 工作室中,选择左窗格中的“管理”。

  5. 在左窗格的“安全性”部分中选择“访问控制”(左起第二个)。

  6. 选择 添加

  7. 随后会在屏幕右侧打开“添加角色分配”面板。 在此面板中:

    1. 为“范围”选择“工作区项”。

    2. 在“项目类型”下拉菜单中,选择“Apache Spark 池”。

    3. 在“项”下拉菜单中,选择你的 Apache Spark 池。

    4. 在“角色”下拉菜单中,选择“Synapse 管理员”。

    5. 在“选择用户”搜索框中,开始键入 Azure 机器学习工作区的名称。 它会为你显示附加的 Synapse Spark 池的列表。 从列表中选择所需的 Synapse Spark 池。

    6. 选择“应用”。

      显示“添加角色分配”的屏幕截图。

更新 Synapse Spark 池

可以从 Azure 机器学习工作室 UI 管理附加的 Synapse Spark 池。 Spark 池管理功能包括附加的 Synapse Spark 池的相关托管标识更新。 可以在更新 Synapse Spark 池时分配系统分配的标识或用户分配的标识。 在将用户分配的托管标识分配给 Synapse Spark 池之前,应在 Azure 门户中创建一个用户分配的托管标识

若要更新附加的 Synapse Spark 池的托管标识:

显示 Synapse Spark 池托管标识更新的屏幕截图。

  1. 在 Azure 机器学习工作室中打开 Synapse Spark 池的“详细信息”页。

  2. 找到位于“托管标识”部分右侧的编辑图标。

  3. 若要首次分配托管标识,请切换“分配托管标识”以启用它。

  4. 若要分配系统分配的托管标识:

    1. 选择“系统分配”作为“标识类型”。
    2. 选择“更新”。
  5. 若要分配用户分配的托管标识:

    1. 选择“用户分配”作为“标识类型”。
    2. 从下拉菜单中选择一个 Azure 订阅。
    3. 在显示文本“按名称搜索”的框中键入用户分配的托管标识名称的前几个字母。 此时会显示具有匹配的用户分配的托管标识名称的列表。 从该列表中选择所需的用户分配的托管标识。 可以选择多个用户分配的托管标识,并将其分配给附加的 Synapse Spark 池。
    4. 选择“更新”

分离 Synapse Spark 池

我们可能需要分离附加的 Synapse Spark 池,以清理工作区。


Azure 机器学习工作室 UI 还提供了一种用于分离附加的 Synapse Spark 池的方法。 为此,请按照下列步骤进行操作:

  1. 在 Azure 机器学习工作室中打开 Synapse Spark 池的“详细信息”页。

  2. 选择“分离”以分离附加的 Synapse Spark 池。

Azure 机器学习中的无服务器 Spark 计算

某些用户方案可能需要在提交 Azure 机器学习作业期间访问无服务器 Spark 计算资源,而无需附加 Spark 池。 Azure Synapse Analytics 与 Azure 机器学习的集成还提供无服务器 Spark 计算体验。 这让用户能访问作业中的 Spark 池,而无需先将计算附加到工作区。 详细了解无服务器 Spark 计算体验

后续步骤