使用 Azure 顾问降低服务成本

通过识别闲置和未充分利用的资源,Azure 顾问可帮助优化和降低 Azure 总支出。 可在顾问仪表板的“成本”选项卡获取成本建议。

  1. 登录到 Azure 门户

  2. 在任意页面中搜索并选择顾问

  3. 在顾问仪表板中,选择“成本”选项卡 。

通过调整大小或关闭未充分利用的实例来优化虚拟机 (VM) 或虚拟机规模集 (VMSS) 支出

虽然某些应用程序方案有意使虚拟机利用率较低,但通过管理虚拟机或虚拟机规模集的大小和数量通常可降低成本。

顾问使用机器学习算法来识别低利用率的情况并确定最合适的建议,以确保虚拟机和虚拟机规模集得到最优利用。 建议的操作是关机或重设大小,具体取决于要评估的资源。

关闭建议

Azure 顾问会标识过去 7 天内从未使用过的资源,并建议将它们关闭。

  • 建议条件包括“CPU”和“出站网络利用率”指标。 由于我们发现 CPU 和出站网络利用率足够,所以不考虑内存。

  • 分析了过去 7 天的利用率数据。 可以在配置中更改回溯期。 可用的回溯期为 7、14、21、30、60 和 90 天。 更改回溯期后,可能需要长达 48 小时才能更新建议。

  • 每 30 秒对指标采样一次,聚合 1 分钟内的指标,然后再聚合 30 分钟内的指标(聚合 30 分钟内的指标时,取平均值的最大值)。 在虚拟机规模集上,将使用不同实例的指标平均值聚合各个虚拟机的指标。

  • 在以下情况下将创建关闭建议:

    • 所有核心的CPU利用率总和的最大值 P95 小于 3%
    • 过去 3 天内平均 CPU 的 P100(所有内核的总和)<= 2%
    • 7 天内的出站网络利用率小于 2%

重设 SKU 大小建议

顾问建议在可能的情况下调整虚拟机的大小,以适应更合适的 SKU 上的当前负载,这样成本更低(基于零售价格)。 在虚拟机规模集上,顾问建议在可能的情况下调整大小,以适应更合适且更便宜的 SKU 或者相同 SKU 的更少实例上的当前负载。

  • 建议条件包括“CPU”、“内存”和“出站网络利用率”。

  • 分析了过去 7 天的利用率数据。 请注意,你可以在配置中更改回溯期。 可用的回溯期为 7、14、21、30、60 和 90 天。 更改回溯期后,请注意可能需要长达 48 小时才能更新建议。

  • 每 30 秒对指标采样一次,聚合 1 分钟内的指标,然后再聚合 30 分钟内的指标(聚合 30 分钟内的指标时,取平均值的最大值)。 在虚拟机规模集上,将使用实例计数建议的指标平均值以及 SKU 更改建议的最大指标聚合各个虚拟机的指标。

  • 根据以下条件确定适当的 SKU(对于虚拟机)或实例计数(对于虚拟机规模集资源):

    • 新 SKU 上的工作负载性能不会受到影响。
      • 面向用户的工作负载的目标:
        • 推荐的 SKU 上 CPU 和出站网络利用率的 P95 不高于 40%
        • 推荐的 SKU 上内存利用率的 P100 不高于 60%
      • 非面向用户的工作负载的目标:
        • 新 SKU 上 CPU 和出站网络利用率的 P95 不高于 80%
        • 新 SKU 上内存利用率的 P100 不高于 80%
    • 新 SKU(如果适用)具有相同的加速网络和高级存储功能
    • 建议的新 SKU(如果适用)在虚拟机的当前区域受支持
    • 新 SKU(如果适用)更便宜
    • 实例计数建议还会考虑虚拟机规模集是由 Service Fabric 还是 AKS 管理。 对于 Service Fabric 托管资源,建议考虑到了可靠性和持久性层。
  • 顾问通过分析工作负载的 CPU 使用率特征来确定工作负载是否面向用户。 该方法基于 Microsoft Research 的发现。 你可在此处找到更多详细信息:云平台中基于预测的功率过度订阅 - Microsoft Research

  • 根据最适合、成本最低且无性能影响的原则,顾问不仅建议使用同一系列中较小的 SKU(例如 D3v2 到 D2v2),还建议使用较新版本(例如 D3v2 到 D2v3)或不同系列中的 SKU(例如 D3v2 到 E3v2)。

  • 对于虚拟机规模集资源,顾问将实例计数建议优先于 SKU 更改建议,因为实例计数更改很容易执行,从而可以更快地节省成本。

可突发建议

我们评估工作负载是否适合在称为“可突发 SKU”的专用 SKU 上运行,这些 SKU 支持可变工作负载性能要求,并且比常规用途 SKU 便宜。 在此处详细了解可突发 SKU:B 系列可突发 - Azure 虚拟机

在下述条件下,建议使用可突发 SKU:

  • 平均 CPU 利用率小于可突发 SKU 的基线性能
    • 如果 CPU 的 P95 低于可突发 SKU 基线性能的二分之一
    • 如果当前 SKU 未启用加速网络,因为可突发 SKU 尚不支持加速网络
    • 如果确定可突发 SKU 额度足以支持 7 天内的平均 CPU 利用率。 请注意,你可以在配置中更改回溯期。

生成的建议指出用户应将其当前虚拟机或虚拟机规模集调整为具有相同核心数的可突发 SKU。 提出此建议是为了让用户可以利用低成本和工作负载平均利用率低但在某些情况下峰值高这样的优势,这非常适合使用 B 系列 SKU。

顾问会显示与建议的操作(重设大小或关机)相对应的成本节省估算值。 对于调整大小,顾问提供当前和目标 SKU/实例计数信息。 若要更有选择性地对未充分利用的虚拟机或虚拟机规模集执行操作,可以按订阅调整 CPU 利用率规则。

在某些情况下,建议无法采用或可能不适用,例如一些常见的场景(可能还有其他情况):

  • 预配的虚拟机或虚拟机规模集可以适应将来的流量

  • 虚拟机或虚拟机规模集使用了调整大小算法未考虑的其他资源,例如 CPU、内存和网络以外的指标

  • 正在当前的 SKU(即使未有效利用)上执行特定测试

  • 需要保持虚拟机或虚拟机规模集 SKU 同质化

  • 用于灾难恢复目的的虚拟机或虚拟机规模集

在这种情况下,只需使用与建议关联的“消除/推迟”选项。

限制

  • 与建议相关的节省基于零售费率,不考虑可能适用于你的帐户的任何临时或长期折扣。 因此,列出的节省可能高于实际情况。

  • 建议不考虑预留实例 (RI)/节省计划购买的存在。 因此,列出的节省可能高于实际情况。 在某些情况下,例如,在跨系列建议中,根据已为其购买预留实例的 SKU 类型,遵循优化建议时,成本可能会增加。 我们提醒你在采取适当规模的建议时考虑你的 RI/节省计划购买。

我们一直在努力改进这些建议。 欢迎随时在顾问论坛上分享反馈。

配置 VM/VMSS 建议

可以调整 Azure 顾问虚拟机 (VM) 和虚拟机规模集建议。 具体而言,可以为每个订阅设置一个筛选器,以便仅显示针对特定 CPU 使用率的计算机的建议。 此设置将筛选建议,但不会更改其生成方式。

注意

如果没有所需的权限,则会在用户界面中禁用该选项。 有关权限的信息,请参阅 Azure 顾问中的权限

若要调整 Azure 顾问虚拟机/虚拟机规模集的正确大小调整规则,请执行以下步骤:

  1. 在任何 Azure 顾问页中,单击左侧导航窗格中的“配置”。 此时会打开“顾问配置”页,其中默认选择了“资源”选项卡。

  2. 选择“虚拟机/虚拟机规模集正确大小调整”选项卡。

  3. 选择希望设置平均 CPU 利用率筛选器的订阅,然后单击“编辑”。

  4. 选择所需的平均 CPU 使用率值,然后单击“应用”。 新设置最长可能需要 24 小时才能反映在建议中。

Screenshot of Azure Advisor configuration option for VM/Virtual Machine Scale Sets sizing rules.

后续步骤

若要了解有关顾问建议的详细信息,请参阅以下资源: