Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 支持的指标
下表列出了可用于 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 资源类型的指标。
表标题
指标 - 在 Azure 门户中显示的指标显示名称。
Rest API 中的名称 - 在 REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认的聚合类型。 有效值:平均值、最小值、最大值、总计、计数。
维度 - 适用于指标的维度。
时间粒度 - 对指标采样的间隔。 例如,PT1M
表示该指标每分钟采样一次,PT30M
表示每 30 分钟一次,PT1H
表示每小时一次,以此类推。
DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。
要了解如何导出指标的信息,请参阅在 Azure Monitor 中创建诊断设置。
有关指标保留的信息,请参阅 Azure Monitor 指标概述。
类别 | 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|---|
资源 | CPU 内存利用率百分比 实例上的内存利用率百分比。 利用率每分钟报告一次。 |
CpuMemoryUtilizationPercentage |
百分比 | 最小值、最大值、平均值 | instanceId |
PT1M | 是 |
资源 | CPU 利用率百分比 实例上的 CPU 利用率百分比。 利用率每分钟报告一次。 |
CpuUtilizationPercentage |
百分比 | 最小值、最大值、平均值 | instanceId |
PT1M | 是 |
资源 | 每分钟数据收集错误数 每分钟删除的数据收集事件数。 |
DataCollectionErrorsPerMinute |
计数 | 最小值、最大值、平均值 | instanceId ,reason ,type |
PT1M | 否 |
资源 | 每分钟数据收集事件数 每分钟处理的数据收集事件数。 |
DataCollectionEventsPerMinute |
计数 | 最小值、最大值、平均值 | instanceId ,type |
PT1M | 否 |
资源 | 部署容量 部署中的实例数。 |
DeploymentCapacity |
计数 | 最小值、最大值、平均值 | instanceId ,State |
PT1M | 否 |
资源 | 磁盘利用率 实例上的磁盘利用率百分比。 利用率每分钟报告一次。 |
DiskUtilization |
百分比 | 最小值、最大值、平均值 | instanceId ,disk |
PT1M | 是 |
资源 | GPU 能量(焦耳) GPU 节点上的间隔功耗(焦耳)。 功耗每分钟报告一次。 |
GpuEnergyJoules |
计数 | 最小值、最大值、平均值 | instanceId |
PT1M | 否 |
资源 | GPU 内存利用率百分比 实例上的 GPU 内存利用率百分比。 利用率每分钟报告一次。 |
GpuMemoryUtilizationPercentage |
百分比 | 最小值、最大值、平均值 | instanceId |
PT1M | 是 |
资源 | GPU 利用率百分比 实例上的 GPU 利用率百分比。 利用率每分钟报告一次。 |
GpuUtilizationPercentage |
百分比 | 最小值、最大值、平均值 | instanceId |
PT1M | 是 |
交通 | P50 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P50 请求延迟 |
RequestLatency_P50 |
毫秒 | 平均值 | <无> | PT1M | 是 |
交通 | P90 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P90 请求延迟 |
RequestLatency_P90 |
毫秒 | 平均值 | <无> | PT1M | 是 |
交通 | P95 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P95 请求延迟 |
RequestLatency_P95 |
毫秒 | 平均值 | <无> | PT1M | 是 |
交通 | P99 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P99 请求延迟 |
RequestLatency_P99 |
毫秒 | 平均值 | <无> | PT1M | 是 |
交通 | 每分钟请求数 在一分钟内发送到联机部署的请求数 |
RequestsPerMinute |
计数 | 平均值 | envoy_response_code |
PT1M | 否 |