在工作室 UI 中生成负责任 AI 见解

在本文中,你将使用 Azure 机器学习工作室 UI 中的无代码体验创建负责任 AI 仪表板和记分卡(预览版)。

重要

此功能目前处于公开预览状态。 此预览版在提供时没有附带服务级别协议,我们不建议将其用于生产工作负荷。 某些功能可能不受支持或者受限。

有关详细信息,请参阅适用于 Azure 预览版的补充使用条款

若要访问仪表板生成向导并生成负责任 AI 仪表板,请执行以下操作:

  1. 在 Azure 机器学习中注册模型,以便能够访问无代码体验。

  2. 在 Azure 机器学习工作室的左侧窗格中选择“模型”选项卡。

  3. 选择要为其创建负责任 AI 见解的已注册模型,然后选择“详细信息”选项卡。

  4. 选择“创建负责任 AI 仪表板(预览版)”。

    Screenshot of the wizard details pane with 'Create Responsible AI dashboard (preview)' tab highlighted.

若要详细了解负责任 AI 仪表板中支持的模型类型和限制,请参阅支持的方案和限制

该向导提供一个界面用于输入所有必要的参数,使你无需改动代码即可创建负责任 AI 仪表板。 该体验完全在 Azure 机器学习工作室 UI 中进行。 工作室提供引导式流程和说明文本,以帮助将填充在仪表板中的负责任 AI 组件的各种选项上下文化。

该向导划分为五个部分:

  1. 训练数据集
  2. 测试数据集
  3. 建模任务
  4. 仪表板组成部分
  5. 组件参数
  6. 试验配置

选择数据集

在前两个部分,你将选择训练模型时使用的训练和测试数据集,以生成模型调试见解。 对于不需要模型的因果分析等组件,可使用训练数据集训练因果模型以生成因果见解。

注意

仅支持 ML 表中的表格数据集格式。

  1. 选择用于训练的数据集:在 Azure 机器学习工作区中已注册数据集的列表中,选择要用来为组件(例如模型解释和错误分析)生成负责任 AI 见解的数据集。

    Screenshot of the train dataset tab.

  2. 选择用于测试的数据集:在已注册数据集的列表中,选择要用于填充负责任 AI 仪表板可视化效果的数据集。

    Screenshot of the test dataset tab.

  3. 如果你要使用的训练或测试数据集未列出,请选择“创建”以上传数据集。

选择建模任务

选择数据集后,选择建模任务类型,如下图所示:

Screenshot of the modeling task tab.

选择仪表板组件

负责任 AI 仪表板提供两个配置文件,其中包含可生成的建议工具集:

  • 模型调试:使用错误分析、反事实假设示例和模型可解释性来了解和调试机器学习模型中错误的数据队列。

  • 现实干预:使用因果分析来了解和调试机器学习模型中错误的数据队列。

    注意

    多类分类不支持现实干预分析配置文件。

Screenshot of the dashboard components tab, showing the 'Model debugging' and 'Real-life interventions' profiles.

  1. 选择要使用的配置文件。
  2. 选择“下一步”。

为仪表板组件配置参数

选择配置文件后,会显示相应组件的“用于模型调试的组件参数”配置窗格。

Screenshot of the component parameter tab, showing the 'Component parameters for model debugging' configuration pane.

用于模型调试的组件参数:

  1. 目标特征(必需):指定训练的模型要预测的特征。

  2. 分类特征:指明哪些特征是分类的,以便在仪表板 UI 中正确地将其呈现为分类值。 将会根据数据集元数据预先加载此字段。

  3. 生成错误树和热度地图:切换为打开或关闭,以便为负责任 AI 仪表板生成错误分析组件。

  4. 错误热度地图的特征:最多选择两个要为其预生成错误热度地图的特征。

  5. 高级配置:指定其他参数,例如“错误树的最大深度”、“错误树中的叶数”和“每个叶节点中的最小样本数”。

  6. 生成反事实假设示例:切换为打开或关闭,以便为负责任 AI 仪表板生成反事实假设组件。

  7. 反事实条件数(必需):指定要为每个数据点生成的反事实示例数。 应至少生成 10 个以启用特征的条形图视图,在一般情况下,对这些特征进行最大扰动才实现了所需的预测结果。

  8. 值预测范围(必需):为回归方案指定希望反事实示例从中获取预测值的范围。 对于二元分类方案,范围将自动设置为对每个数据点的对立类生成反事实条件。 对于多分类方案,请使用下拉列表来指定要将每个数据点预测为哪个类。

  9. 指定要扰动的特征:默认将扰动所有特征。 但是,如果你想要扰动特定的特征,请选择“指定要扰动哪些特征来生成反事实解释”以显示一个包含可选择的特征列表的窗格。

    选择“指定要扰动的特征”时,可以指定允许扰动的范围。 例如:对于特征 YOE(工作经验),指定反事实条件应该仅包括 10 到 21(而不是默认值 5 到 21)范围内的特征值。

    Screenshot of the wizard, showing a pane of features you can specify to perturb.

  10. 生成解释:切换为打开或关闭,以便为负责任 AI 仪表板生成模型解释组件。 无需进行配置,因为默认的不透明盒模拟解释器将用于生成特征重要性。

或者,如果选择“现实干预”配置文件,则会看到以下屏幕生成了因果分析。 这可以帮助你了解要根据所要优化的特定结果“处理”的特征的因果效应。

Screenshot of the wizard, showing the 'Component parameters for real-life interventions' pane.

现实干预的组件参数使用因果分析。 请执行以下操作:

  1. 目标特征(必需):选择要为其计算因果效应的结果。
  2. 处理特征(必需):选择要更改(“处理”)的一个或多个特征以优化目标结果。
  3. 分类特征:指明哪些特征是分类的,以便在仪表板 UI 中正确地将其呈现为分类值。 将会根据数据集元数据预先加载此字段。
  4. 高级设置:为因果分析指定其他参数,例如异构特征(即,除处理特征以外,用于了解分析中因果分割的其他特征)以及要使用的因果模型。

配置试验

最后,配置试验以启动一个作业来生成负责任 AI 仪表板。

Screenshot of the Experiment configuration tab, showing the 'Training job or experiment configuration' pane.

在“训练作业或试验配置”窗格中执行以下操作:

  1. 名称:为仪表板指定唯一的名称,以便在查看给定模型的仪表板列表时可以区分该仪表板。
  2. 试验名称:选择一个现有试验来运行作业,或创建新的试验。
  3. 现有试验:在下拉列表中选择现有试验。
  4. 选择计算类型:指定用于执行作业的计算类型。
  5. 选择计算:在下拉列表中选择要使用的计算。 如果没有现有的计算资源,请选择加号 (+) 创建新的计算资源,然后刷新列表。
  6. 说明:为负责任 AI 仪表板添加较长的说明。
  7. 标记:将任何标记添加到此负责任 AI 仪表板。

配置完试验后,选择“创建”开始生成负责任 AI 仪表板。 你将重定向到试验页,在其中可以跟踪作业进度。作业完成后,作业页中会提供生成的负责任 AI 仪表板的链接。

若要了解如何查看和使用负责任 AI 仪表板,请参阅在 Azure 机器学习工作室中使用负责任 AI 仪表板

如何生成负责任 AI 记分卡(预览版)

创建仪表板后,可以使用 Azure 机器学习工作室中的无代码 UI 来自定义和生成负责任 AI 记分卡。 这样,你便可以与非技术和技术利益干系人分享模型负责任部署的关键见解,例如公平性和特征重要性。 如同创建仪表板一样,可以使用以下步骤访问记分卡生成向导:

  • 从 Azure 机器学习工作室的左侧导航栏中导航到“模型”选项卡。
  • 选择要为其创建记分卡的已注册模型,然后选择“负责任 AI”选项卡。
  • 在顶部面板中选择“创建负责任 AI 见解(预览版)”,然后选择“生成新的 PDF 记分卡”。

该向导允许自定义 PDF 记分卡,而无需改动代码。 该体验完全在 Azure 机器学习工作室 UI 中进行,它提供引导式流程来帮助你将各种 UI 元素上下文化,并提供说明文本来帮助你选择用于填充记分卡的组件。 该向导划分为七个步骤,第八个步骤(公平性评估)仅针对具有以下分类特征的模型显示:

  1. PDF 记分卡摘要
  2. 模型性能
  3. 工具选择
  4. 数据分析(以前称为数据资源管理器)
  5. 因果分析
  6. 可解释性
  7. 试验配置
  8. 公平性评估(仅当存在分类特征时)

配置记分卡

  1. 首先,输入记分卡的描述性标题。 还可以输入有关模型功能、用于训练和评估模型的数据、体系结构类型等的可选说明。

    Screenshot of the wizard on scorecard summary configuration.

  2. 在“模型性能”部分,可以将行业标准模型评估指标纳入记分卡,同时还可为所选指标设置所需的目标值。 使用下拉菜单选择所需的性能指标(最多三个)和目标值。

    Screenshot of the wizard on scorecard model performance configuration.

  3. 使用“工具选择”步骤可以选择要包含在记分卡中的后续组件。 选中“包含在记分卡中”以包含所有组件,或单独选中/取消选中每个组件。 选择组件旁边的信息图标(带圆圈的“i”)可详细了解每个选项。

    Screenshot of the wizard on scorecard tool selection configuration.

  4. 在“数据分析”部分(以前称为数据资源管理器)可以进行队列分析。 在此处,可以识别代表性过度和代表性不足的问题,了解数据如何在数据集中聚集,以及模型预测如何影响特定的数据队列。 使用下拉菜单中的复选框在下面选择所需的特征,以识别模型在处理其基础队列时的性能。

    Screenshot of the wizard on scorecard data analysis configuration.

  5. “公平性评估”部分可以帮助评估哪些人员组可能会受到机器学习模型预测的负面影响。 此部分有两个字段。

    • 敏感特征:通过优先处理你想要探索和比较的最多 20 个子组来识别所选的敏感属性(例如年龄、性别)。

    • 公平性指标:选择适合你的设置的公平性指标(例如准确度差异、误差率),并在所选的公平性指标中识别所需的目标值。 所选的公平性指标(与通过切换开关选择的差异或比率配对)将捕获子组中极端值之间的差异或比率。 (最大值 - 最小值或最大值/最小值)。

    Screenshot of the wizard on scorecard fairness assessment configuration.

    注意

    公平性评估目前仅适用于分类敏感属性,例如性别。

  6. “因果分析”部分回答有关处理方式的变化如何影响实际结果的实际“what if”问题。 如果你正在为其生成记分卡的负责任 AI 仪表板中已激活因果组件,则无需进行更多配置。

    Screenshot of the wizard on scorecard causal analysis configuration.

  7. “可解释性”部分为机器学习模型做出的预测生成人类可理解的说明。 使用模型解释可以理解模型做出决策的理由。 选择下面的数字 (K) 以查看影响整体模型预测的前 K 个重要特征。 K 的默认值为 10。

    Screenshot of the wizard on scorecard feature importance configuration.

  8. 最后,配置试验以启动生成记分卡的作业。 这些配置与负责任 AI 仪表板的配置相同。

    Screenshot of the wizard on scorecard experiment configuration.

  9. 最后,检查配置并选择“创建”以启动作业!

    Screenshot of the wizard on scorecard configuration review.

    启用作业后,你将重定向到试验页,可在其中跟踪作业进度。 若要了解如何查看和使用负责任 AI 记分卡,请参阅使用负责任 AI 记分卡(预览版)

后续步骤