Batch 服务工作流和资源

这篇 Azure Batch 服务核心组件的概述,将介绍 Batch 开发人员可用来构建大规模并发计算解决方案的高级工作流,以及使用的主要服务资源。

不管是在开发可发出直接 REST API 调用的分布式计算应用程序或服务,还是使用某个 Batch SDK,都可以使用此处介绍的多种资源和功能。

提示

有关 Batch 服务的更全面介绍,请参阅 Basics of Azure Batch(Azure Batch 基础知识)。 另请参阅最新的 Batch 服务更新

基本工作流

几乎所有使用 Batch 服务处理并行工作负荷的应用程序和服务都使用以下典型高级工作流:

  1. 将要处理的 数据文件 上传到 Azure 存储帐户。 Batch 包含访问 Azure Blob 存储的内置支持,在运行任务时,任务可以将这些文件下载到计算节点
  2. 上传任务所要运行的 应用程序文件 。 这些文件可能是二进制文件或脚本及其依赖项,并由作业中的任务执行。 任务可以从存储帐户下载这些文件,也可使用 Batch 的 应用程序包 功能来管理和部署应用程序。
  3. 创建计算节点的 。 创建池时,可以指定池的计算节点数目、其大小和操作系统。 运行作业中的每个任务时,会将任务分配到池中的某个节点以执行。
  4. 创建 作业。 作业管理任务的集合。 可将每个作业关联到要运行该作业的任务的特定池。
  5. 任务添加到作业。 每个任务将运行上传的应用程序或脚本,以处理它从存储帐户下载的数据文件。 当每个任务完成时,可将其输出上传到 Azure 存储。
  6. 监视作业进度并从 Azure 存储检索任务输出。

备注

需要有批处理帐户才能使用批处理服务。 此外,大多数 Batch 解决方案都可以使用关联的 Azure 存储帐户存储和检索文件。

Batch 服务资源

以下主题介绍可启用分布式计算方案的 Batch 资源。

后续步骤

  • 了解适用于生成批处理解决方案的批处理 API 和工具
  • 了解使用批处理 .NET 客户端库Python 开发支持批处理的应用程序的基本概念。 这些快速入门介绍了使用 Batch 服务在多个计算节点上执行工作负荷的示例应用程序,并说明了如何使用 Azure 存储进行工作负荷文件暂存和检索。
  • 下载并安装 Batch Explorer,供开发 Batch 解决方案时使用。 借助 Batch Explorer 来创建、调试和监视 Azure Batch 应用程序。
  • 请参阅社区资源,包括 Stack OverflowBatch 社区存储库Azure Batch 论坛