ExpressRoute 监视、指标和警报
本文可帮助你使用 Azure Monitor 了解 ExpressRoute 监视、指标和警报。 Azure Monitor 是整个 Azure 中所有指标、警报和诊断日志的一站式商店。
注意
建议不要使用经典指标。
ExpressRoute 指标
若要查看“指标”,请转到“Azure Monitor”页,选择“指标”。 若要查看 ExpressRoute 指标,请按资源类型“ExpressRoute 线路”进行筛选 。 若要查看 Global Reach 指标,请按资源类型“ExpressRoute 线路”进行筛选,然后选择一个已启用 Global Reach 的 ExpressRoute 线路资源。 若要查看 ExpressRoute Direct 指标,请按“ExpressRoute 端口”筛选资源类型。
选择指标后,就会应用默认聚合。 (可选)可以应用拆分,其显示具有不同维度的指标。
重要
在 Azure 门户中查看 ExpressRoute 指标时,请选择 5 分钟或更大的时间粒度以获得最佳结果。
聚合类型:
指标资源管理器支持使用总和、最大值、最小值、平均值和计数作为聚合类型。 查看每个 ExpressRoute 指标的见解时,应该使用建议的聚合类型。
- 总和:在聚合间隔期间捕获的所有值的总和。
- 计数:在聚合间隔期间捕获的度量数。
- Average:在聚合间隔期间捕获的指标值的平均值。
- 最小值:在聚合间隔期间捕获的最小值。
- 最大值:在聚合间隔期间捕获的最大值。
ExpressRoute 线路
指标 | 类别 | 计价单位 | 聚合类型 | 说明 | 维度 | 是否可通过诊断设置导出? |
---|---|---|---|---|---|---|
ARP 可用性 | 可用性 | 百分比 | 平均值 | 从 MSEE 到所有对等方的 ARP 可用性。 | 对等互连类型、对等互连 | 是 |
BGP 可用性 | 可用性 | 百分比 | 平均值 | 从 MSEE 到所有对等方的 BGP 可用性。 | 对等互连类型、对等互连 | 是 |
BitsInPerSecond | 交通 | BitsPerSecond | 平均值 | 每秒流入 Azure 的位数 | 对等互连类型 | 是 |
BitsOutPerSecond | 交通 | BitsPerSecond | 平均值 | 每秒流出 Azure 的位数 | 对等互连类型 | 是 |
DroppedInBitsPerSecond | 交通 | BitsPerSecond | 平均值 | 每秒丢弃的数据流入位数 | 对等互连类型 | 是 |
DroppedOutBitsPerSecond | 交通 | BitPerSecond | 平均值 | 每秒丢弃的数据流出位数 | 对等互连类型 | 是 |
ExpressRoute 网关
指标 | 类别 | 计价单位 | 聚合类型 | 说明 | 维度 | 是否可通过诊断设置导出? |
---|---|---|---|---|---|---|
每秒接收的位数 | 性能 | BitsPerSecond | 平均值 | 在 ExpressRoute 网关上每秒接收到的总位数 | roleInstance | 是 |
CPU 使用率 | 性能 | 计数 | 平均值 | ExpressRoute 网关的 CPU 使用率 | roleInstance | 是 |
每秒的数据包数 | 性能 | 每秒计数 | 平均值 | 在 ExpressRoute 网关上每秒接收到的总包数 | roleInstance | 是 |
播发到对等机的路由计数 | 可用性 | 计数 | 最大值 | ExpressRouteGateway 播发到对等方的路由计数 | roleInstance | 是 |
从对等机获知的路由计数 | 可用性 | 计数 | 最大值 | ExpressRouteGateway 从对等方获知的路由计数 | roleInstance | 是 |
路由更改频率 | 可用性 | 计数 | 总计 | ExpressRoute 网关中的路由更改频率 | roleInstance | 是 |
虚拟网络中的 VM 数量 | 可用性 | 计数 | 最大值 | 虚拟网络中估计的 VM 数量 | 无维度 | 是 |
活动流 | 可伸缩性 | 计数 | 平均值 | ExpressRoute 网关上的活动流数 | roleInstance | 是 |
最大每秒创建流数 | 可伸缩性 | FlowsPerSecond | 最大值 | ExpressRoute 网关上最大每秒创建流数 | roleInstance、direction | 是 |
ExpressRoute 网关连接
指标 | 类别 | 计价单位 | 聚合类型 | 说明 | 维度 | 是否可通过诊断设置导出? |
---|---|---|---|---|---|---|
BitsInPerSecond | 交通 | BitsPerSecond | 平均值 | 每秒通过 ExpressRoute 网关流入 Azure 的位数 | ConnectionName | 是 |
BitsOutPerSecond | 交通 | BitsPerSecond | 平均值 | 每秒通过 ExpressRoute 网关流出 Azure 的位数 | ConnectionName | 是 |
ExpressRoute Direct
指标 | 类别 | 计价单位 | 聚合类型 | 说明 | 维度 | 是否可通过诊断设置导出? |
---|---|---|---|---|---|---|
BitsInPerSecond | 交通 | BitsPerSecond | 平均值 | 每秒流入 Azure 的位数 | 链接 | 是 |
BitsOutPerSecond | 交通 | BitsPerSecond | 平均值 | 每秒流出 Azure 的位数 | 链接 | 是 |
DroppedInBitsPerSecond | 交通 | BitsPerSecond | 平均值 | 每秒丢弃的数据流入位数 | 链接 | 是 |
DroppedOutBitsPerSecond | 交通 | BitPerSecond | 平均值 | 每秒丢弃的数据流出位数 | 链接 | 是 |
AdminState | 物理连接 | 计数 | 平均值 | 端口的管理状态 | 链接 | 是 |
LineProtocol | 物理连接 | 计数 | 平均值 | 端口的线路协议状态 | 链接 | 是 |
RxLightLevel | 物理连接 | 计数 | 平均值 | Rx 光能级(以 dBm 为单位) | Link, Lane | 是 |
TxLightLevel | 物理连接 | 计数 | 平均值 | Tx 光能级(以 dBm 为单位) | Link, Lane | 是 |
线路指标
进位和出位 - 所有对等互连的指标
聚合类型:Avg
可以查看给定 ExpressRoute 线路上所有对等互连的指标。
进位和出位 - 每个对等互连的指标
聚合类型:Avg
可以查看专用、公共和 Microsoft 对等互连的指标(以位/秒为单位)。
BGP 可用性 - 按对等机拆分
聚合类型:Avg
可以查看跨对等互连和对等机(主要和辅助 ExpressRoute 路由器)的近实时 BGP(第 3 层连接性)可用性。 此仪表板显示专用对等互连的主 BGP 会话状态为“已启动”,专用对等互连的第二个 BGP 会话状态为“关闭”。
注意
在 Azure 边缘和核心网络之间进行维护的过程中,即使客户边缘和 Azure 边缘之间的 BGP 会话保持可用,BGP 可用性也会出现下降。 若要了解 Azure 边缘和核心网络之间的维护,请确保启用并配置维护警报。
ARP 可用性 - 按对等互连拆分
聚合类型:Avg
可以查看跨对等互连和对等机(主要和辅助 ExpressRoute 路由器)的近实时 ARP(第 2 层连接性)可用性。 此仪表板显示跨两个对等机的专用对等互连 ARP 会话状态为“已启动”,但对于两个对等机的 Microsoft 对等互连,状态则为“关闭”。 已跨两个对等机利用了默认聚合(平均)。
ExpressRoute Direct 指标
管理状态 - 按链路拆分
聚合类型:Avg
可以查看 ExpressRoute Direct 端口对的每个链路的管理状态。 管理状态表示物理端口是打开还是关闭。 跨 ExpressRoute Direct 连接传递流量时需要此状态。
每秒传入位数 - 按链路拆分
聚合类型:Avg
可以查看 ExpressRoute Direct 端口对的跨两个链路的每秒传入位数。 监视此仪表板以比较这两个链接的入站带宽。
每秒传出位数 - 按链路拆分
聚合类型:Avg
还可以查看 ExpressRoute Direct 端口对的跨两个链路的每秒传出位数。 监视此仪表板以比较这两个链接的出站带宽。
线路协议 - 按链路拆分
聚合类型:Avg
可以查看 ExpressRoute Direct 端口对的跨每个链路的线路协议。 “线路协议”指示物理链路是否已启动以及是否通过 ExpressRoute Direct 运行。 监视此仪表板并设置警报以了解物理连接何时断开。
Rx 轻型级别 - 按链路拆分
聚合类型:Avg
可以查看每个端口的 Rx 轻型级别(ExpressRoute Direct 端口的轻型级别是接收)。 正常的 Rx 光能级通常在 -10 dBm 到 0 dBm 范围内。 设置警报,以在 Rx 光能级超出正常范围时接收通知。
注意
ExpressRoute Direct 连接跨不同的设备平台进行托管。 某些 ExpressRoute Direct 连接将支持按通道划分的 Rx 光能级的拆分视图。 但是,所有部署都不支持此操作。
Tx 轻型级别 - 按链路拆分
聚合类型:Avg
可以查看每个端口的 Tx 轻型级别(ExpressRoute Direct 端口的轻型级别为传输)。 正常的 Tx 光能级通常在 -10 dBm 到 0 dBm 范围内。 设置警报,以在 Tx 光能级超出正常范围时接收通知。
注意
ExpressRoute Direct 连接跨不同的设备平台进行托管。 某些 ExpressRoute Direct 连接将支持按通道划分的 Tx 光能级的拆分视图。 但是,所有部署都不支持此操作。
ExpressRoute 虚拟网络网关指标
聚合类型:Avg
部署 ExpressRoute 网关时,Azure 会管理网关的计算和功能。 用户可以使用六个网关指标来更好地了解你的网关的性能:
- 每秒接收的位数
- CPU 使用率
- 每秒数据包数
- 播发到对等机的路由计数
- 从对等机获知的路由计数
- 路由更改频率
- 虚拟网络中的 VM 数量
- 活动流
- 最大每秒创建流数
强烈建议针对其中每个指标设置警报,以便知道网关何时可能出现性能问题。
每秒接收的位数 - 按实例拆分
聚合类型:Avg
此指标捕获 ExpressRoute 虚拟网络网关实例上的入站带宽利用率。 针对带宽利用率超过特定阈值的频率设置警报。 如果需要更多带宽,请增加 ExpressRoute 虚拟网络网关的大小。
CPU 利用率 - 按实例拆分
聚合类型:Avg
用户可以查看每个网关实例的 CPU 利用率。 在日常主机维护期间,CPU 利用率可能会短暂性地出现高峰,但 CPU 利用率长时间过高可能表示网关即将遇到性能瓶颈。 增大 ExpressRoute 网关的大小可能会解决此问题。 针对 CPU 利用率超过特定阈值的频率设置警报。
每秒数据包数 - 按实例拆分
聚合类型:Avg
此指标捕获遍历 ExpressRoute 网关的入站数据包的数目。 如果网关接收来自本地网络的流量,用户应该在这里看到一致的数据流。 针对每秒的数据包数量低于某个阈值时设置警报,指示网关不再接收流量。
播发到对等机的路由计数 - 按实例拆分
聚合类型:Max
此指标显示 ExpressRoute 网关向线路播发的路由数。 地址空间可以包含使用虚拟网络对等互连和远程 ExpressRoute 网关进行连接的虚拟网络。 除非虚拟网络地址空间频繁更改,否则路由数应保持一致。 针对播发的路由数低于所知的虚拟网络地址空间数阈值时设置警报。
从对等机获知的路由计数 - 按实例拆分
聚合类型:Max
此指标显示 ExpressRoute 网关从连接到 ExpressRoute 线路的对等机中获知的路由数。 这些路由可以来自连接到同一线路的另一个虚拟网络,也可以从本地获知。 针对获知的路由数低于特定阈值时设置警报。 此指标可能表示网关出现性能问题,或者远程对等方不再向 ExpressRoute 线路播发路由。
路由更改频率 - 按实例拆分
聚合类型:Sum
此指标显示从远程对等机获知或播发到远程对等机的路由的频率。 应首先调查本地设备,了解网络更改如此频繁的原因。 路由频繁更改可能表示 ExpressRoute 网关出现了性能问题,而纵向扩展网关 SKU 可能会解决此问题。 针对频率阈值设置警报,以在 ExpressRoute 网关检测到异常路由更改时收到通知。
虚拟网络中的 VM 数量
聚合类型:Max
此指标显示使用 ExpressRoute 网关的虚拟机数量。 虚拟机数可以包括使用相同 ExpressRoute 网关的、已建立对等互连的虚拟网络中的 VM。 如果虚拟机数量超过可能会影响网关性能的特定阈值,针对此指标设置警报。
注意
为了维护服务的可靠性,Azure 通常会在网关服务上执行平台或 OS 维护。 在此期间,此指标可能会有波动并报告不准确。
活动流
聚合类型:Avg
拆分依据:网关实例
此指标会显示 ExpressRoute 网关上活动流总数的计数。 对于活动流,仅捕获来自本地的入站流量。 通过实例级别的拆分,可以查看每个网关实例的活动流计数。 有关详细信息,请参阅了解网络流限制。
最大每秒创建流数
聚合类型:Max
拆分依据:网关实例和方向(入站/出站)
此指标显示 ExpressRoute 网关上每秒创建的最大流数。 通过按实例级别和方向拆分,可以分别查看每个网关实例和入站/出站方向上的的最大流创建速率。 有关详细信息,请参阅了解网络流限制。
ExpressRoute 网关连接(以位/秒为单位)
聚合类型:Avg
此指标显示每秒通过 ExpressRoute 网关流入和出口 Azure 的位数。 可以进一步拆分此指标,以查看到 ExpressRoute 线路的特定连接。
ExpressRoute 网关连接的警报
若要配置警报,请导航到“Azure Monitor”,然后选择“警报”。
选择“+ 创建”>“警报规则”,然后选择 ExpressRoute 网关连接资源。 选择“下一步:条件”>以配置信号。
在“选择信号”页上,选择要收到警报的指标、资源运行状况或活动日志。 根据所选信号,可能需要输入其他信息,例如阈值。 还可以将多个信号合并为单个警报。 选择“下一步:操作”>以定义接收通知的人员及通知方式。
选择“+ 选择操作组”以选择之前创建的现有操作组,或者选择“+ 创建操作组”以定义新操作组。 在操作组中,你需确定通知的发送方式以及接收通知的人员。
选择“查看 + 创建”,然后选择“创建”,将警报部署到订阅中。
基于每个对等互连的警报
选择指标后,某些指标允许基于对等互连或特定对等互连(虚拟网络)设置维度。
为线路上的活动日志配置警报
选择要对其发出警报的信号时,可以选择“活动日志”信号类型。
Log Analytics 中的更多指标
还可以通过转到 ExpressRoute 线路资源并选择“日志”选项卡来查看 ExpressRoute 指标。对于查询的任何指标,输出包含以下列。
列 | 类型 | 说明 |
---|---|---|
TimeGrain | 字符串 | PT1M(每分钟推送一次指标值) |
Count | real | 通常是 2(每个 MSEE 每分钟推送一个指标值) |
最低配置 | real | 两个 MSEE 推送的两个指标值中的最小值 |
最大值 | real | 两个 MSEE 推送的两个指标值中的最大值 |
平均值 | real | 等于 (最小值 + 最大值)/2 |
总计 | real | 来自两个 MSEE 的两个指标值的总和(所查询指标的需关注的主要值) |
后续步骤
设置 ExpressRoute 连接。