训练聚类分析模型
本文介绍 Azure 机器学习设计器中的一个组件。
使用此组件训练聚类分析模型。
此组件采用已使用 K 均值聚类分析组件配置的未训练聚类分析模型,使用标记的或未标记的数据集来训练该模型。 此组件创建一个可用于预测的已训练模型,并为训练数据中的每个案例创建一组群集分配。
注意
聚类分析模型不能使用训练模型组件(这是用于训练机器学习模型的通用组件)进行训练, 因为训练模型仅适用于监督式学习算法。 K-means 和其他聚类分析算法允许非监督式学习,这意味着算法可以从非标记的数据进行学习。
如何使用“训练聚类分析模型”
在设计器中向管道添加“训练聚类分析模型”组件。 可以在“机器学习组件”下的“训练”类别中找到此组件。
添加 K 均值聚类分析组件,或添加另一个可创建兼容聚类分析模型的自定义组件,并设置聚类分析模型的参数。
将训练数据集附加到训练聚类分析模型的右侧输入。
在“列集”中,从数据集选择用于构建群集的列。 确保选择可以生成良好特征的列:例如,避免使用有唯一值的 ID 或其他列,或者所有值都相同的列。
如果某个标签可用,则可将它用作特征,或者不用它。
如果需要输出训练数据和新的群集标签,请选择“选中以便进行追加,或者取消选中以便只获取结果”选项。
如果取消选择此选项,则只输出群集分配。
提交管道,或单击“训练聚类分析模型”组件,然后选择“运行所选项” 。
结果
在训练完成后:
若要保存已训练模型的快照,请选择“训练模型”组件右侧面板中的“输出”选项卡。 选择“注册数据集”图标以将模型保存为可重用组件。
若要从模型生成分数,请使用将数据分配到群集。
注意
如果需要在设计器中部署训练的模型,请确保将将数据分配到群集(而不是“为模型评分”)连接到推理管道中“Web 服务输出”组件的输入端口。
后续步骤
请参阅 Azure 机器学习可用的组件集。