“应用转换”组件

本文介绍 Azure 机器学习设计器中的一个组件。

使用此组件可以基于之前计算的转换来修改输入数据集。 如果需要更新推理管道中的转换,则需要此组件。

例如,如果借助“规范化数据”组件,使用 z 分数规范化训练数据,则可能还需要使用在评分阶段为训练计算的 z 分数值。 在 Azure 机器学习中,可以将规范化方法另存为转换,然后使用“应用转换”在评分之前将 z 分数应用于输入数据。

如何保存转换

设计器允许你将数据转换保存为“数据集”,以便在其他管道中使用它们。

  1. 选择已成功运行的数据转换组件。

  2. 选择“输出 + 日志”选项卡。

  3. 找到转换输出,然后选择“注册数据集”,并在组件面板的“数据集”类别下,将其保存为组件。

如何使用“应用转换”

  1. 将“应用转换”组件添加到管道。 可以在组件面板的“模型评分和评估”部分中找到此组件。

  2. 在组件面板的“数据集”下查找要使用的已保存转换。

  3. 将已保存转换的输出连接到“应用转换”组件的左侧输入端口。

    数据集应具有与首次为其设计了转换的数据集相同的架构(列数、列名、数据类型)。

  4. 将所需组件的数据集输出连接到“应用转换”组件的右侧输入端口。

  5. 若要将转换应用于新数据集,请提交管道。

重要

若要确保在训练管道中更新的转换也适用于推理管道,你需要在训练管道中每次有更新转换时执行以下步骤:

  1. 在训练管道中,将 Select Columns Transform 的输出注册为数据集。 Register dataset of component output
  2. 在推理管道中,删除 TD 组件,并将其替换为上一步中已注册的数据集。 Replace TD component

后续步骤

请参阅 Azure 机器学习可用的组件集