训练聚类分析模型

本文介绍 Azure 机器学习设计器中的一个组件。

使用此组件训练聚类分析模型。

此组件采用已使用 K 均值聚类分析组件配置的未训练聚类分析模型,使用标记的或未标记的数据集来训练该模型。 此组件创建一个可用于预测的已训练模型,并为训练数据中的每个案例创建一组群集分配。

注意

聚类分析模型不能使用训练模型组件(这是用于训练机器学习模型的通用组件)进行训练, 因为训练模型仅适用于监督式学习算法。 K-means 和其他聚类分析算法允许非监督式学习,这意味着算法可以从非标记的数据进行学习。

如何使用“训练聚类分析模型”

  1. 在设计器中向管道添加“训练聚类分析模型”组件。 可以在“机器学习组件”下的“训练”类别中找到此组件。

  2. 添加 K 均值聚类分析组件,或添加另一个可创建兼容聚类分析模型的自定义组件,并设置聚类分析模型的参数。

  3. 将训练数据集附加到训练聚类分析模型的右侧输入。

  4. 在“列集”中,从数据集选择用于构建群集的列。 确保选择可以生成良好特征的列:例如,避免使用有唯一值的 ID 或其他列,或者所有值都相同的列。

    如果某个标签可用,则可将它用作特征,或者不用它。

  5. 如果需要输出训练数据和新的群集标签,请选择“选中以便进行追加,或者取消选中以便只获取结果”选项。

    如果取消选择此选项,则只输出群集分配。

  6. 提交管道,或单击“训练聚类分析模型”组件,然后选择“运行所选项” 。

结果

在训练完成后:

  • 若要保存已训练模型的快照,请选择“训练模型”组件右侧面板中的“输出”选项卡。 选择“注册数据集”图标以将模型保存为可重用组件。

  • 若要从模型生成分数,请使用将数据分配到群集

注意

如果需要在设计器中部署训练的模型,请确保将将数据分配到群集(而不是“为模型评分”)连接到推理管道中“Web 服务输出”组件的输入端口。

后续步骤

请参阅 Azure 机器学习可用的组件集