流量管理器指标和警报

流量管理器提供了基于 DNS 的负载均衡,这包括多种路由方法和终结点监视选项。 本文介绍了与可供客户使用的警报关联的指标。

流量管理器中提供的指标

流量管理器针对每个配置文件提供了以下指标,客户可用于了解其流量管理器的使用情况以及该配置文件管理的终结点的状态。

按终结点返回的查询

使用此指标可以查看流量管理器配置文件进程在指定的时间段内处理的查询数。 还可以在终结点级别粒度查看同一信息,这可帮助你了解某个终结点在来自流量管理器的查询响应中返回了多少次。

在下面的示例中,图 1 显示了流量管理器配置文件返回的所有查询响应。

Aggregate view of all queries

图 1: 包含所有查询的聚合视图

图 2 显示了同一信息,不过它按终结点进行了拆分。 因此,你可以看到其中返回了某个特定终结点的查询响应的数量。

Traffic Manager metrics - split view of query volume per endpoint

图 2: 其中显示了按终结点返回的查询量的拆分视图

按终结点显示的终结点状态

使用此指标可以了解配置文件中的终结点的运行状况状态。 它采用两个值:

  • 如果终结点正常运行,则使用 1 。
  • 如果终结点发生故障,则使用 0

此指标可以显示为聚合值,表示所有指标的状态(图 3),也可以拆分(参见图 4)来显示特定终结点的状态。 如果为前者,聚合级别选择为“平均值”时,此指标的值是所有终结点的状态的算术平均值 。 例如,如果某个配置文件具有两个终结点并且只有一个终结点正常,则此指标的值将是 0.50,如图 3 所示 。

Traffic Manager metrics - composite view of endpoint status

图 3: 终结点状态指标的组合视图 - 选择了“平均值”聚合

Traffic Manager metrics - split view of endpoint status

图 4: 终结点状态指标的拆分视图

可以通过 Azure Monitor 服务的门户、REST APIAzure CLIAzure PowerShell 或者通过流量管理器的门户体验的指标部分来使用这些指标。

针对流量管理器指标的警报

除了处理和显示来自流量管理器的指标外,Azure Monitor 还允许客户配置和接收与这些指标关联的警报。 你可以选择这些指标需要满足什么条件才会发生警报、需要以何频率监视这些条件,以及应当如何向你发送警报。 有关详细信息,请参阅 Azure Monitor 警报文档

若要确保系统在探测关闭时发出通知,警报监视非常重要。 过于敏感的监视可能会造成干扰。 流量管理器会部署多个探测来提高复原能力。 探测状态的阈值应小于 0.5。 如果 up(打开)状态的平均值小于 0.5(表示打开的探测数不到 50%),则应会有一个警报提示终结点失败。

注意

部署多个探测来提高复原能力。 如果正在发送多个探测,其中一个探测关闭,则不一定表示终结点已关闭。 只有当返回的大多数探测都已关闭时,终结点才分类为“关闭”。

以下配置就是一个警报设置。

Screenshot of probe threshold alert example.

有关探测和监视的详细信息,请参阅流量管理器终结点监视

后续步骤