使用 Azure 顾问降低服务成本

通过识别闲置和未充分利用的资源,Azure 顾问可帮助优化和降低 Azure 总支出。  可在顾问仪表板的“成本”选项卡获取成本建议。

  1. 登录到 Azure 门户

  2. 在任意页面中搜索并选择顾问

  3. 在顾问仪表板中,选择“成本”选项卡 。

通过调整或关闭未充分利用的实例来优化虚拟机花费

虽然某些应用程序方案有意使虚拟机利用率较低,但通过管理虚拟机大小和数量通常可降低成本。

顾问使用机器学习算法来识别低利用率的情况并确定最合适的建议,以确保虚拟机得到最优利用。 建议的操作是关机或重设大小,具体取决于要评估的资源。

关闭建议

顾问会识别过去 7 天内完全未使用的资源,并建议将其关闭。

  • 考虑的指标是 CPU 和出站网络利用率(关闭建议不考虑内存,因为我们发现,凭借 CPU 和网络即可为此建议提供足够的信号)
  • 考虑过去 7 天的利用率数据
  • 每 30 秒对指标采样一次,聚合 1 分钟内的指标,然后再聚合 30 分钟内的指标(聚合 30 分钟内的指标时,取最大值的平均值)
  • 在以下情况下将创建关闭建议:
    • 所有内核汇总的 CPU 利用率最大值的 P95 小于 3%。
    • 过去 3 天内平均 CPU 的 P100(所有内核的总和)<= 2%
    • 7 天内的出站网络利用率小于 2%。

重设 SKU 大小建议

如果可以在成本比当前 SKU 更低的(目前仅在推荐生成时考虑零售价格)、更合适的 SKU 上容纳当前负载,顾问会考虑重设虚拟机大小。

  • 考虑的指标包括 CPU、内存和出站网络利用率
  • 考虑过去 7 天的利用率数据
  • 每 30 秒对指标采样一次,聚合 1 分钟内的指标,然后再聚合 30 分钟内的指标(聚合 30 分钟内的指标时,取最大值的平均值)
  • 根据以下标准确定合适的 SKU:
    • 不应影响新 SKU 上工作负载的性能。
      • 面向用户的工作负载目标:
        • 推荐的 SKU 上 CPU 和出站网络利用率的 P95 不高于 40%
        • 推荐的 SKU 上内存利用率的 P100 不高于 60%
      • 不面向用户的工作负载目标:
        • 新 SKU 上 CPU 和出站网络利用率的 P95 不高于 80%
        • 新 SKU 上内存利用率的 P100 不高于 80%
    • 新 SKU 具有相同的加速网络和高级存储功能
    • 推荐的新 SKU 在虚拟机的当前区域受支持
    • 新 SKU 的成本较低
  • 顾问通过分析工作负载的 CPU 利用率特征来确定工作负载的类型(面向用户/不面向用户)。 其依据是 Microsoft Research 的一些有趣发现。 你可在此处找到更多详细信息:云平台中基于预测的功率过度订阅 - Microsoft Research
  • 根据最适合、成本最低且无性能影响的原则,顾问不仅建议使用同一系列中较小的 SKU(例如 D3v2 到 D2v2),还建议使用较新版本(例如 D3v2 到 D2v3)甚至完全不同的系列中的 SKU(例如 D3v2 到 E3v2)。

可突发建议

这是一种特殊类型的重设大小建议,即顾问会分析工作负载来确定是否有资格在名为“可突发 SKU”的专用 SKU 上运行,可突发 SKU 允许可变的工作负载性能要求,并且通常比常规用途 SKU 更便宜。 在此处详细了解可突发 SKU:B 系列可突发 - Azure 虚拟机

  • 在下述条件下,建议使用可突发 SKU:
  • 平均 CPU 利用率低于可突发 SKU 的基线性能
    • 如果 CPU 的 P95 低于可突发 SKU 基线性能的二分之一
    • 如果当前 SKU 未启用加速网络(可突发 SKU 尚不支持加速网络)
    • 如果确定可突发 SKU 额度足以支持 7 天内的平均 CPU 利用率
  • 结果是一条建议,它提示用户将当前 VM 的大小重设为可突发 SKU(具有相同内核数),以利用低成本和工作负载平均利用率低但在某些情况下峰值高这样的优势,这非常适合使用 B 系列 SKU。

顾问会显示与建议的操作(重设大小或关机)相对应的成本节省估算值。 对于重设大小,顾问提供当前 SKU 信息和目标 SKU 信息。 若要对低利用率虚拟机采取更有选择性的行动,可在每个订阅的基础上调整 CPU 利用率规则。

在某些情况下,建议无法采用或可能不适用,例如一些常见的场景(可能还有其他情况):

  • 虚拟机已进行预配,可容纳即将到来的流量
  • 虚拟机使用重设大小算法未考虑的其他资源,即除 CPU、内存和网络之外的指标
  • 正在当前的 SKU(即使未有效利用)上执行特定测试
  • 需要 VM SKU 属于同一类
  • VM 的用途是灾难恢复

在这种情况下,只需使用与建议关联的“消除/推迟”选项。

我们一直在努力改进这些建议。 欢迎随时在顾问论坛上分享反馈。

后续步骤

若要了解有关顾问建议的详细信息,请参阅以下资源: