为 Azure 数据资源管理器群集选择 SKU

为某个不断变化的工作负荷创建新群集或优化群集时,Azure 数据资源管理器会提供多个虚拟机 (VM) SKU 供你选择。 这些计算 SKU 经过精选,可为任何工作负载提供最佳性价比。

数据管理群集的大小和 VM SKU 完全由 Azure 数据资源管理器服务进行管理。 它们由引擎的 VM 大小和引入工作负载等因素决定。

随时都可通过纵向扩展群集来更改群集的计算 SKU。 最好是从适合初始方案的最小 SKU 大小开始。

可以使用定价计算器,根据工作负载和数据量估算 Azure 数据资源管理器群集的定价。

提示

通过购买预留,可以为群集、群集中所用虚拟机以及存储资源预付一年或三年的费用。 这些预留实例 (RI) 是单独购买的,可节省大量资金,确保获得 Azure 数据资源管理器群集的最佳费率。

选择群集类型

Azure 数据资源管理器提供两种类型的群集:

  • 生产(有 SLA):生产群集至少包含两个用于引擎群集的节点以及两个用于数据管理群集的节点。 这些群集在 Azure 数据资源管理器 SLA 下运行。
  • 开发/测试(无 SLA):开发/测试群集包含一个用于引擎群集的节点和一个用于数据管理群集的节点。 这些群集是成本最低的配置,因为其实例计数较低。 此群集配置不附带冗余或 SLA。

开发与生产

开发群集非常适合服务评估、建立引入管道、进行概念证明 (PoC) 或场景验证。 开发群集与生产群集之间的主要区别包括:

  • 开发群集的规模有限,不能超过单个节点
  • 无需为开发群集支付 Azure 数据资源管理器标记费用
  • 开发群集没有 SLA

计算 SKU 类型

对于不同类型的工作负载,Azure 数据资源管理器群集支持多种 SKU。 每个 SKU 均提供不同的 SSD 存储和 CPU 比率,以帮助正确地调整其部署规模,并为企业分析工作负载构建成本最佳的解决方案。

计算优化

  • 提供高核心缓存比和最低的每核心成本。
  • 可实现低延迟 I/O 的本地 SSD。

存储优化

  • 提供更大的每引擎节点存储(1 TB 到 4 TB)和最低的每千兆字节 (GB) 成本。
  • 适用于需要存储大量数据的工作负载。
  • 某些 SKU 使用附加到引擎节点的高级存储 (PS) 而不是本地 SSD。 访问 PS 的速度比访问本地 SSD 的速度慢,因此具有 PS 的 SKU 比附加本地 SSD 的 SKU 更昂贵且性能更低。

选择并优化计算 SKU

在群集创建过程中选择计算 SKU

创建 Azure 数据资源管理器群集时,请根据计划的工作负荷选择最佳的 VM SKU。 使用以下属性有助于为环境选择正确的 SKU:

属性 详细信息
每 GB 成本 成本高,计算经过优化。 使用存储优化 SKU,成本较低。
每核心成本 成本低,计算经过优化。 使用存储优化 SKU,成本较高。
RI 定价 RI 折扣因区域和 SKU 而异。

注意

计算成本在群集成本中占比最多。

优化群集计算 SKU

若要优化群集计算 SKU,请配置垂直缩放并查看 Azure 顾问建议。

有各种计算 SKU 选项可供选择,因此可根据方案的性能和热缓存要求来优化成本。 查询量很大时,选择计算优化的 SKU 以获得最佳性能。 查询大量需缓存的数据时,选择存储优化的 SKU 以获得最佳性能。

相较于许多小型 VM,最好使用具有更多 RAM 的大型 VM 的一些节点。 某些对 RAM 需求更高的查询类型(例如使用联接的查询)需要更多的 RAM。 因此,缩放群集时,建议纵向扩展为更大的 SKU,并根据需要添加更多节点来进行横向扩展。

注意

更改或纵向扩展群集的 SKU 可能会导致服务中断一到三分钟。 在 SKU 迁移期间,查询性能可能会受到影响,影响程度可能因使用模式而异。

SKU 可用性

SKU 可用性因以下因素而异:

  • 区域:并非所有 SKU 都适用于所有区域或可用性区域。 有关详细信息,请参阅各个 SKU 页面,了解区域可用性。
  • 订阅:某些 SKU 可能仅适用于特定订阅类型。 如果 SKU 不可用于满足业务需求的位置或区域中的订阅,请向 Azure 支持提交 SKU 请求

SKU 选项

以下 SKU 系列可用于 Azure 数据资源管理器群集 VM。 计算和存储优化类别中的 SKU 系列按推荐顺序排列。

存储优化

SKU 系列 可用的 vCPU 配置 SKU 类型 支持高级存储
Lasv3 8、16、32 AMD
Lsv3 8、16、32 Intel
Easv4Easv5、ECasv5 8, 16 AMD
Esv4Esv5 8, 16 Intel
DSv2 8, 16 Intel

计算优化

SKU 系列 可用的 vCPU 配置 SKU 类型 支持高级存储
Eadsv5、ECadsv5 2, 4, 8, 16 AMD
Edv4Edv5 2, 4, 8, 16 Intel
Eav4 2, 4, 8, 16 AMD
Dv2 2, 4, 8, 16 Intel

注意

所有具有 2 个核心的计算优化 SKU 都可以配置为开发群集。

建议仅在下列情况下使用 L32asv3 / L32sv3:非常大的 L16asv3/L16sv3 群集达到 1000 个群集节点限制,或者群集的并发请求速率极高。 ECasv5 和 ECadsv5 是机密计算 SKU。 对于存储优化 ECasv5 SKU,如果你使用自己的客户管理的密钥 (CMK),则会在存储帐户和高级存储磁盘上执行 CMK 加密。

  • 借助 Azure 数据资源管理器计算和存储隔离,你可以先使用成本最优的 SKU,然后在使用模式或数据丢失成熟后改用其他 SKU。
  • 可使用 Azure 数据资源管理器 ListSkus API 查看各区域已更新的计算 SKU 的列表。

缓存大小

Azure 数据资源管理器预留每个 Azure 计算 SKU 规范中显示的磁盘大小的一部分,用于群集操作。 门户中的 SKU 选择部分中给出了每个 SKU 的确切缓存大小。