共用方式為

使用 Azure 机器学习 (v1) 训练模型

适用于:适用于 Python 的 Azure 机器学习 SDK v1

重要

本文提供有关使用 Azure 机器学习 SDK v1 的信息。 SDK v1 自 2025 年 3 月 31 日起弃用。 对它的支持将于 2026 年 6 月 30 日结束。 可以在该日期之前安装和使用 SDK v1。

建议在 2026 年 6 月 30 日之前过渡到 SDK v2。 有关 SDK v2 的详细信息,请参阅 什么是 Azure 机器学习 CLI 和 Python SDK v2? 以及 SDK v2 参考

Azure 机器学习提供了多种训练模型的方法,包括 SDK 的代码优先解决方案,以及自动化机器学习和可视化设计器等低代码选项。 使用以下列表确定哪种训练方法符合你的需求:

  • 适用于 Python 的 Azure 机器学习 SDK:Python SDK 提供多种方法来训练模型,每个模型都具有不同功能。

    训练方法 说明
    运行配置 训练模型的常见方法是使用训练脚本和作业配置。 作业配置定义训练环境,包括脚本、计算目标和 Azure 机器学习环境。 可以通过指定这些详细信息来运行训练作业。
    自动化机器学习 借助自动化机器学习,无需 深度数据科学或编程专业知识即可训练模型。 对于经验丰富的用户,它通过自动选择算法和超参数优化来节省时间。 使用自动化机器学习时不需要作业配置。
    机器学习管道 管道不是单独的训练方法,而是使用可包括训练的 模块化可重用步骤定义工作流的方法 。 管道支持自动化机器学习和运行配置。 想要以下情况下使用管道:
    * 计划无人值守的进程,如长时间运行的训练作业或数据准备。
    * 跨不同的计算资源和存储位置协调 多个步骤
    * 为重新训练或批量评分等方案创建 可重用模板
    * 对工作流的数据源、输入和输出进行跟踪和版本控制。
    * 使 不同的团队能够独立处理特定步骤 ,并将其合并到管道中。
  • 设计器:Azure 机器学习设计器是构建概念证明或具有有限编码体验的用户的简单入口点。 使用拖放 Web UI 训练模型。 可以包括 Python 代码或训练模型,而无需编写任何代码。

  • Azure CLI:机器学习 CLI 为常见的 Azure 机器学习任务提供命令,通常用于 脚本和自动化。 例如,创建训练脚本或管道后,可以使用 CLI 按计划或更新训练数据时启动训练作业。 CLI 可以使用运行配置或管道提交作业。

每个训练方法都可以使用不同类型的计算资源,称为 计算目标。 计算目标可以是本地计算机或云资源,例如 Azure 机器学习计算、Azure HDInsight 或远程虚拟机。

Python SDK

使用用于 Python 的 Azure 机器学习 SDK,可以生成和运行机器学习工作流。 可以通过交互式式 Python 会话、Jupyter Notebook、Visual Studio Code 或其他 IDE 与服务进行交互。

运行配置

Azure 机器学习中的典型训练作业是使用 ScriptRunConfig 定义的。 脚本运行配置以及训练脚本(s)用于在计算目标上训练模型。

可以从本地计算机的运行配置开始,并根据需要切换到基于云的计算目标。 若要更改计算目标,请更新运行配置。 每个运行都会记录有关训练作业的信息,包括输入、输出和日志。

自动化机器学习

定义迭代、超参数设置、特征化和其他选项。 在训练期间,Azure 机器学习并行测试不同的算法和参数。 训练在满足设置的退出条件时停止。

提示

除了 Python SDK 之外,还可以通过 Azure 机器学习工作室使用自动化 ML。

机器学习管道

机器学习管道可以使用上述训练方法。 流水线侧重于创建工作流,因此它们不仅仅限于模型训练。 在管道中,你可以使用自动化机器学习或运行配置来训练模型。

了解提交训练作业时会发生的情况

Azure 培训生命周期包括:

  1. 将项目文件夹中的文件压缩,忽略那些在 .amlignore 或 .gitignore 中指定的文件
  2. 纵向扩展计算群集
  3. 生成或下载 Docker 映像到计算节点
    1. 系统会计算以下各项的哈希:
    2. 系统使用此哈希查找工作区 Azure 容器注册表 (ACR)
    3. 如果未找到,它将检查全局 ACR
    4. 如果仍未找到,系统将生成一个新映像(该映像已缓存并注册到工作区 ACR)
  4. 将压缩的项目文件下载到计算节点上的临时存储
  5. 解压缩项目文件
  6. 计算节点执行 python <entry script> <arguments>
  7. 将写入到 ./outputs 的日志、模型文件和其他文件保存到与工作区关联的存储帐户
  8. 纵向缩减计算,包括删除临时存储

如果在本地计算机上训练(“配置为本地运行”),则不需要 Docker。 如果需要,可以在本地使用 Docker(有关示例 ,请参阅配置 ML 管道 )。

Azure 机器学习设计器

借助设计器,可以在 Web 浏览器中使用拖放界面训练模型。

Azure CLI

机器学习 CLI 是 Azure CLI 的扩展。 它提供用于使用 Azure 机器学习的跨平台命令。 通常,可以使用 CLI 来自动执行任务,如训练机器学习模型。

后续步骤

了解如何 配置训练任务