设置 AutoML 以训练计算机视觉模型

适用于：Azure CLI ml 扩展 v2（当前版本）Python SDK azure-ai-ml v2（当前版本）

本文介绍如何使用自动化 ML 训练有关图像数据的计算机视觉模型。可以使用 Azure 机器学习 CLI 扩展 v2 或 Azure 机器学习 Python SDK v2 训练模型。

自动化 ML 支持将模型训练用于图像分类、物体检测和实例分段等计算机视觉任务。目前，Azure 机器学习 Python SDK 支持为计算机视觉任务创作 AutoML 模型。可以从 Azure 机器学习工作室 UI 访问生成的试验试验、模型和输出。详细了解用于基于图像数据的计算机视觉任务的自动化 ML。

任务类型	AutoML 作业语法
图像分类	CLI v2：`image_classification` SDK v2：`image_classification()`
多标签图像分类	CLI v2：`image_classification_multilabel` SDK v2：`image_classification_multilabel()`
图像物体检测	CLI v2：`image_object_detection` SDK v2：`image_object_detection()`
图像实例分段	CLI v2：`image_instance_segmentation` SDK v2：`image_instance_segmentation()`

字段	说明
`image_url`	包含文件路径作为 StreamInfo 对象
`image_details`	图像元数据信息由高度、宽度和格式组成。此字段可选。
`label`	图像标签的 json 表示形式，基于任务类型。

参数	详细信息
`max_trials`	要扫描的最大试用数量的参数。必须是介于 1 和 1,000 之间的整数。仅浏览给定模型体系结构的默认超参数时，请将此参数设置为 1。默认值为 1。
`max_concurrent_trials`	并发运行的最大试验数。如果指定了此项，则必须是 1 和 100 之间的整数。默认值为 1。注意：并发试用次数取决于指定计算目标中可用的资源。请确保计算目标能够为所需的并发性提供足够的可用资源。在内部，`max_concurrent_trials` 的最大值为 `max_trials`。例如，如果设置 `max_concurrent_trials=4` 和 `max_trials=2`，这些值在内部更新为 `max_concurrent_trials=2` 和 `max_trials=2`。
`timeout_minutes`	在试验终止之前所花的时间（以分钟为单位）。如果未指定值，默认的实验超时时间 timeout_minutes 为 7 天（最长 60 天）。

任务	模型体系结构	字符串字面量语法 `default_model`* 用 * 表示
图像分类（多类和多标签）	MobileNet：适用于移动应用程序的轻型模型 ResNet：残差网络 ResNeSt：拆分注意力网络 SE-ResNeXt50：压缩奖惩网络 ViT：视觉变换器网络	`mobilenetv2` `resnet18` `resnet34` `resnet50` `resnet101` `resnet152` `resnest50` `resnest101` `seresnext` `vits16r224`（小） `vitb16r224`*（基本） `vitl16r224`（大）
对象检测	YOLOv5：单阶段物体检测模型 Faster RCNN ResNet FPN：双阶段物体检测模型 RetinaNet ResNet FPN：使用聚焦损失函数解决类不平衡问题注意：有关 YOLOv5 模型大小，请参阅 `model_size` 超参数。	`yolov5`* `fasterrcnn_resnet18_fpn` `fasterrcnn_resnet34_fpn` `fasterrcnn_resnet50_fpn` `fasterrcnn_resnet101_fpn` `fasterrcnn_resnet152_fpn` `retinanet_resnet50_fpn`
实例分段	MaskRCNN ResNet FPN	`maskrcnn_resnet18_fpn` `maskrcnn_resnet34_fpn` `maskrcnn_resnet50_fpn`* `maskrcnn_resnet101_fpn` `maskrcnn_resnet152_fpn`

采样类型	AutoML 作业语法
随机采样	`random`
网格采样	`grid`
贝叶斯采样	`bayesian`

提前终止策略	AutoML 作业语法
老虎机策略	CLI v2：`bandit` SDK v2：`BanditPolicy()`
中间值停止策略	CLI v2：`median_stopping` SDK v2：`MedianStoppingPolicy()`
截断选择策略	CLI v2：`truncation_selection` SDK v2：`TruncationSelectionPolicy()`

任务	受影响的数据集	应用的数据扩充技术
图像分类（多类和多标签）	培训验证和测试	随机调整大小和裁剪、水平翻转、颜色抖动（亮度、对比度、饱和度和色调），使用通道方向 ImageNet 的平均值和标准偏差进行规范化调整大小、中心裁剪、规范化
物体检测、实例分段	培训验证和测试	围绕边界框随机裁剪、展开、水平翻转、规范化、调整大小规范化、调整大小
使用 yolov5 进行物体检测	培训验证和测试	马赛克、随机仿射（旋转、平移、缩放、剪切）、水平翻转上下黑边调整大小

任务	参数名称	默认
图像分类（多类和多标签）	`valid_resize_size` `valid_crop_size`	256 224
对象检测	`min_size` `max_size` `box_score_thresh` `nms_iou_thresh` `box_detections_per_img`	600 1333 0.3 0.5 100
使用 `yolov5` 进行物体检测	`img_size` `model_size` `box_score_thresh` `nms_iou_thresh`	640 中 0.1 0.5
实例分段	`min_size` `max_size` `box_score_thresh` `nms_iou_thresh` `box_detections_per_img` `mask_pixel_score_threshold` `max_number_of_polygon_points` `export_as_image` `image_type`	600 1333 0.3 0.5 100 0.5 100 False JPG

XAI 算法	算法特定的参数	默认值
`xrai`	1. `n_steps`：求近似值方法使用的步数。增加步骤数量会导致更好地近似归因（解释）。 n_steps的范围为 [2， inf），但属性的性能在 50 个步骤后开始收敛。 `Optional, Int` 2. `xrai_fast`：是否使用更快的 XRAI 版本。如果为 `True`，则解释的计算时间更快，但会导致解释（属性）的准确度更低 `Optional, Bool`	`n_steps = 50` `xrai_fast = True`
`integrated_gradients`	1. `n_steps`：求近似值方法使用的步数。更多的步骤会导致更好的归属（解释）。 n_steps的范围为 [2， inf），但属性的性能在 50 个步骤后开始收敛。 `Optional, Int` 2. `approximation_method`：求整数近似值的方法。可用的求近似值方法是 `riemann_middle` 和 `gausslegendre`。 `Optional, String`	`n_steps = 50` `approximation_method = riemann_middle`

通过

设置 AutoML 以训练计算机视觉模型

先决条件

选择任务类型

训练和验证数据

JSONL 架构示例

使用数据

用于运行试验的计算环境

配置试验

主要指标

作业限制

自动扫描模型超参数 (AutoMode)

触发 AutoMode

单独试用

支持的模型体系结构

手动扫描模型超参数

定义参数搜索空间

扫描的采样方法

提前终止策略

固定设置

数据增强

增量训练（可选）

通过作业 ID 传递检查点

提交 AutoML 作业

输出和评估指标

注册和部署模型

获取最佳试用

注册模型

配置联机终结点

创建终结点

配置联机部署

创建部署

更新流量

更新推理设置

测试部署

生成预测解释

说明

解释可视化效果

解读归因

大型数据集

多 GPU 和多节点训练

从存储中流式传输图像文件

示例笔记本

代码示例

后续步骤

其他资源