教程：使用 AutoML 和 Python 训练物体检测模型

项目
09/14/2024

适用范围：Azure CLI ml 扩展 v2（最新版）Python SDK azure-ai-ml v2（最新版）

本教程介绍如何通过 Azure 机器学习 CLI 扩展 v2 或 Azure 机器学习 Python SDK v2 使用 Azure 机器学习自动化 ML 训练物体检测模型。此物体检测模型可识别图像是否包含对象（如罐、纸箱、奶瓶或水瓶）。

自动化 ML 接受训练数据和配置设置，并自动循环访问不同特征规范化/标准化方法、模型和超参数设置的组合，以实现最佳模型。

在本教程中，你将使用 Python SDK 编写代码，并了解以下任务：

下载和转换数据
训练自动化机器学习物体检测模型
为模型指定超参数值
执行超参数扫描
部署模型
直观呈现检测结果

先决条件

要使用 Azure 机器学习，你需要一个工作区。如果没有工作区，请完成创建开始使用所需的资源以创建工作区并详细了解如何使用它。

重要

如果你的 Azure 机器学习工作区配置了托管虚拟网络，则可能需要添加出站规则以允许访问公共 Python 包存储库。有关详细信息，请参阅应用场景：访问公共机器学习包。
此功能支持 Python 3.6 或 3.7
下载并解压缩 odFridgeObjects.zip 数据文件*。数据集以 Pascal VOC 格式进行注释，其中每个图像对应一个 xml 文件。每个 xml 文件都包含有关其对应图像文件所在位置的信息，还包含有关边界框和对象标签的信息。若要使用此数据，首先需要将其转换为所需的 JSONL 格式，如笔记本的将下载的数据转换为 JSONL 部分中所示。
使用计算实例来学习本教程，无需安装其他软件。（请参阅如何创建计算实例。）或者安装 CLI/SDK 以使用你自己的本地环境。
- Azure CLI
- Python SDK
适用于：Azure CLI ml 扩展 v2（当前）

还可以在 GitHub 上的 azureml-examples 存储库中找到本教程。如果你希望在自己的本地环境中运行计算实例：
- 安装并设置 CLI (v2)，并确保安装 ml 扩展。
适用范围：Python SDK azure-ai-ml v2（最新版）

还可以在 GitHub 上的 azureml-examples 存储库中找到本教程。如果你希望在自己的本地环境中运行计算实例：
- 使用以下命令安装 Azure 机器学习 Python SDK v2：
  - 卸载以前的预览版：
```
pip uninstall azure-ai-ml
```
  - 安装 Azure 机器学习 Python SDK v2：
```
pip install azure-ai-ml azure-identity
```
  注意
  
  只有 Python 3.6 和 3.7 与计算机视觉任务的自动化 ML 支持兼容。

计算目标设置

注意

要尝试无服务器计算（预览版），请跳过此步骤并继续进行实验设置。

首先需要设置用于自动化 ML 模型训练的计算目标。用于图像任务的自动化 ML 模型需要 GPU SKU。

本教程将使用 NCsv3 系列（具有 V100 GPU），因为此类计算目标会使用多个 GPU 来加速训练。此外，还可以设置多个节点，以在优化模型的超参数时利用并行度。

以下代码创建一个大小为 Standard_NC24s_v3 的 GPU 计算，其中包含四个节点。

通过

教程：使用 AutoML 和 Python 训练物体检测模型

先决条件

计算目标设置

试验设置

直观呈现输入数据

上传数据并创建 MLTable

配置物体检测试验

适用于图像任务的自动超参数扫描 (AutoMode)

适用于图像任务的手动超参数扫描

作业限制

注册和部署模型

获取最佳试用版

注册模型

配置联机终结点

创建终结点

配置联机部署

创建部署

更新流量：

测试部署

直观呈现检测结果

清理资源

后续步骤

其他资源