对 Vowpal Wabbit 模型评分

本文介绍如何使用 Azure 机器学习设计器中的“为 Vowpal Wabbit 模型评分”组件,借助经过训练的现有 Vowpal Wabbit 模型针对一组输入数据生成分数。

此组件提供 Vowpal Wabbit 框架的最新版本 - 版本 8.8.1。 使用此组件,借助以 VW 版本 8 格式保存的经过训练的模型对数据进行评分。

如何配置“评分 Vowpal Wabbit 模型”

  1. 将“为 Vowpal Wabbit 模型评分”组件添加到试验。

  2. 添加经过训练的 Vowpal Wabbit 模型,并将其连接到左侧输入端口。 可以使用在同一试验中创建的训练模型,或在设计器的左侧导航窗格的“数据集”类别中找到保存的模型。 但是,模型必须在 Azure 机器学习设计器中可用。

    注意

    仅支持 Vowpal Wabbit 8.8.1 模型;无法连接使用其他算法训练的已保存模型。

  3. 添加测试数据集,并将其连接到右侧输入端口。 如果测试数据集是一个包含测试数据文件的目录,请使用“测试数据文件的名称”指定测试数据文件名。 如果测试数据集是一个文件,请将测试数据文件的名称保留为空。

  4. 在 VW 参数文本框中,键入一组有效的 Vowpal Wabbit 可执行文件命令行参数。

    有关 Azure 机器学习中支持和不支持哪些 Vowpal Wabbit 参数的信息,请参阅技术说明部分。

  5. 测试数据文件的名称:键入包含输入数据的文件的名称。 此参数仅在测试数据集是目录时使用。

  6. 指定文件类型:指示训练数据使用的格式。 Vowpal Wabbit 支持以下两种输入文件格式:

    • VW 表示 Vowpal Wabbit 使用的内部格式。 有关详细信息,请参阅 Vowpal Wabbit Wiki 页面
    • SVMLight 是某些其他机器学习工具使用的格式。
  7. 如果要将标签与分数一起输出,请选择选项“包括含标签的额外列”。

    通常,在处理文本数据时,Vowpal Wabbit 不需要标签,并且仅返回每行数据的分数。

  8. 如果要将原始分数和结果与一起输出,请选择选项“包括含原始分数的额外列”。

  9. 提交管道。

结果

在训练完成后:

  • 若要直观显示结果,请右键单击为 Vowpal Wabbit 模型评分组件的输出。 输出会显示一个标准化为 0 到 1 范围内数字的预测分数。

  • 若要评估结果,输出数据集应包含符合“评估模型”组件要求的特定分数列名称。

    • 对于回归任务,要计算的数据集必须设一个列,名为 Regression Scored Labels,表示评分标签。
    • 对于二进制分类任务,要计算的数据集必须具有两列,名为 Binary Class Scored LabelsBinary Class Scored Probabilities,分别表示评分标签和概率。
    • 对于多分类任务,要计算的数据集必须设一个列,名为 Multi Class Scored Labels,表示评分标签。

    请注意,无法直接评估“为 Vowpal Wabbit 模型评分”组件的结果。 在计算之前,应根据上述要求修改数据集。

技术说明

本部分包含实现详情、使用技巧和常见问题解答。

参数

Vowpal Wabbit 具有许多用于选择和优化算法的命令行选项。 这里不对这些选项做全面介绍;建议查看 Vowpal Wabbit wiki 页面

在 Azure 机器学习工作室(经典)中,不支持以下参数。

上述参数以外的其他所有参数都可以使用。

后续步骤

请参阅 Azure 机器学习可用的组件集