在 Azure Monitor 工作区中监视指标引入(预览版)

引入错误是在数据引入期间发生的问题。 此类别中的错误情况可能意味着数据丢失,因此监视这些情况很重要。 这些错误可能包括达到 Azure Monitor 工作区引入限制的指示。 有关 Azure Monitor 工作区的服务限制,请参阅 Azure Monitor 服务限制

重要

此功能目前处于预览状态,可能会更改。 对此功能的支持有限。 有关适用于 Beta 版、预览版或尚未正式发布的 Azure 功能的法律条款,请参阅 Azure 预览版补充使用条款

监视引入错误

若要监视 Azure Monitor 工作区指标的数据引入错误,请执行以下步骤:

  1. 在 Azure 门户中导航到你的 Azure Monitor 工作区,然后在“监视”部分下选择“指标”

  2. 在“添加指标”下拉菜单中,选择“使用生成器添加”

  3. 选择“Azure Monitor 工作区”作为范围。

  4. 为“指标命名空间”选择“标准指标”

  5. “指标 ”下拉列表中,选择“ 已删除事件 ”和 “删除时序样本” 以检查数据引入中的任何错误。

  6. 单击“ 应用拆分”,然后在“ ”下拉列表中选择“ 原因”。

    显示 Azure Monitor 工作区中引入错误的指标图表的屏幕截图。

已删除的事件

“已丢弃事件”指标表示已接收但未被 Azure Monitor 工作区接受的事件数量。 它包含 一个“原因” 维度,用于指示不接受事件的原因。 将来可能会更改原因集,以提供更高的保真度。 下表描述了原因集以及导致它们的条件。

原因 DESCRIPTION
OldData 由于事件时间戳超过 20 分钟,因此删除了数据。 仅接受时间戳与引入时间相比不超过过去 20 分钟或未来 20 分钟的事件。
LimitThrottling 因为超过了引入限制,数据被丢弃。 请求增加引入限制
输入格式错误 由于输入格式无效,因此删除了数据。 有关有效的输入格式,请参阅 指标名称、标签名称和标签值
内部错误 由于内部错误,数据已删除。

时间序列样本已丢弃

时序样本丢弃指标表明在处理过程中删除的数据点数量(在接受相应事件之后)。 它包含 一个“原因” 维度,用于指示删除数据点的原因。 将来可能会更改原因集,以提供更高的保真度。 下表描述了原因集以及导致它们的条件。

原因 DESCRIPTION
复制 数据是已接收数据的副本。
OutOfOrder 数据接收顺序错误;时序数据中的某个数据的时间戳早于同一时序中已经引入的其他数据的时间戳。
LimitThrottling 数据因监视帐户级别对新时序进行了限流而被拒绝。 请求增加引入限制
无效时间范围 数据被拒绝,因为其中包含的时间戳过于超前。 仅接受时间戳与引入时间相比不超过未来 20 分钟的事件。
OldData 数据因太旧而被拒绝。 仅接受时间戳与引入时间相比不超过过去 20 分钟的事件。
内部错误 由于内部错误,更新失败。
保留的维度名称 数据被拒绝,因为它包含一个或多个与保留的维度或标签名称冲突的维度键或标签名称。
输入格式错误 数据已删除,因为它包含受支持数据范围之外的值。 有关有效的输入格式,请参阅 指标名称、标签名称和标签值

监视数据收集规则的引入请求(预览版)

设置 Azure Monitor 工作区时,用于将 Prometheus 指标发送到 Azure Monitor 工作区的关联数据收集规则(DCR)有一定的限制。 有关这些限制的信息,请参阅 Prometheus 服务限制

若要查看和监控 DCR 限制是否被限流,请使用以下步骤:

  1. 在 Azure 门户中,导航到 Azure Monitor 工作区,然后单击“概述”页上显示的 数据收集规则
  2. 在“数据收集规则”页上,转到 “监视 ->指标”
  3. 选择指标 下拉列表中,选择 每分钟的指标引入请求数量 以查看每分钟的指标引入请求数。

创建警报以监视 DCR 限制

若要监视 DCR 指标引入是否受到限制,可以针对指标的维度 响应代码 创建警报。 如果发生限流,“响应代码”将包含 429 错误代码。

  1. 在“数据收集规则”页上,转到 “监视 ->警报”。

  2. 单击+ 创建 ->警报规则

  3. 单击“查看所有信号”,然后在“指标”部分下查找每分钟指标引入请求。 单击“应用”

  4. 查看详细信息并输入阈值;在 “按维度拆分 ”部分中,从“维度名称”下拉列表中选择 “响应代码 ”,并输入“429”作为维度值。

  5. 查看其他详细信息并创建警报。

    显示为数据收集规则设置指标限制警报的屏幕截图。

如果收到警报,请考虑创建其他 DCR 和 DCE,以将引入负载分配到多个终结点。 此方法有助于优化性能并确保高效的数据处理。 有关创建 DCR 和 DCE 的详细信息,请参阅 如何为现有 Azure Monitor 工作区创建自定义数据收集终结点(DCE)和自定义数据收集规则(DCR),以引入 Prometheus 指标

注释

这些指标目前处于预览状态,并且对这些指标的支持有限。 如果需要,可以为超出特定阈值的指标创建警报,如果收到此类警报,请查看数据收集配置,了解上述特定条件。

后续步骤