快速入门：使用 Synapse Studio 创建无服务器 Apache Spark 池

Azure Synapse Analytics 提供了各种分析引擎，可帮助你引入、转换、分析和提供数据，以及对数据建模。 Apache Spark 池提供开源大数据计算功能。在 Synapse 工作区中创建 Apache Spark 池后，可以加载、处理和提供数据以及为数据建模，以获取见解。

本快速入门介绍了使用 Synapse Studio 在 Synapse 工作区中创建 Apache Spark 池的步骤。

重要

不管是否正在使用 Spark 实例，它们都会按分钟按比例计费。请务必在用完 Spark 实例后将其关闭，或设置较短的超时。有关详细信息，请参阅本文的清理资源部分。

备注

Synapse Studio 将继续支持基于 terraform 或 bicep 的配置文件。

如果没有 Azure 订阅，可在开始前创建一个试用帐户。

先决条件

从工作区概述中，选择“工作区 Web URL”以打开 Synapse Studio。

重要

适用于 Apache Spark 2.4 的 Azure Synapse 运行时已弃用，自 2023 年 9 月起官方不再提供支持。鉴于 Spark 3.1 和 Spark 3.2 也宣布结束支持，我们建议客户迁移到 Spark 3.3。

在“基本信息”选项卡中输入以下详细信息：

设置	建议值	说明
Apache Spark 池名称	有效的池名称，如 `contosospark`	这是 Apache Spark 池要使用的名称。
节点大小	小 (4 vCPU / 32 GB)	请将此项设置为最小大小，以降低本快速入门的成本
自动缩放	已禁用	使用此快速入门时无需进行自动缩放
节点数	8	在此快速入门中使用小尺寸来限制成本
动态分配执行程序	已禁用	此设置映射到用于 Spark 应用程序执行工具分配的 Spark 配置中的动态分配属性。使用此快速入门时无需进行自动缩放。

重要

请注意，Apache Spark 池可以使用的名称有特定的限制。名称只能包含字母或数字，必须为 15 个或更少的字符，必须以字母开头，不能包含保留字，并且在工作区中必须是独一无二的。

在下一个选项卡（“其他设置”）中，将所有设置保留为默认值。
选择“标记”。考虑使用 Azure 标记。例如，使用“所有者”或“创建者”标记来识别谁创建了资源，以及使用“环境”标记来标识此资源是在生产、开发等环境中。有关详细信息，请参阅为 Azure 资源开发命名和标记策略。准备就绪后，选择“查看 + 创建”。
在“查看 + 创建”选项卡中，根据前面输入的内容，确保详细信息正确，然后按“创建” 。
Apache Spark 池将开始预配过程。
预配完成后，新的 Apache Spark 池将显示在列表中。

以下步骤使用 Synapse Studio 从工作区中删除 Apache Spark 池。

警告

删除 Spark 池会从工作区中删除分析引擎。将不再可以连接到该池，并且使用此 Spark 池的所有查询、管道和笔记本都不再可以正常运行。

若要删除 Apache Spark 池，请执行以下步骤：