下表列出了可用于 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 资源类型的指标。
表标题
指标 - 在 Azure 门户中显示的指标显示名称。
              Rest API 中的名称 - 在 REST API 中引用的指标名称。
单位 - 度量单位。
              聚合 - 默认的聚合类型。 有效值:平均值、最小值、最大值、总计、计数。
              维度 - 适用于指标的维度。
              时间粒度 - 对指标采样的间隔。 例如,PT1M 表示该指标每分钟采样一次,PT30M 表示每 30 分钟一次,PT1H 表示每小时一次,以此类推。
DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。
要了解如何导出指标的信息,请参阅在 Azure Monitor 中创建诊断设置。
有关指标保留的信息,请参阅 Azure Monitor 指标概述。
类别:资源
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| CPU 内存利用率百分比 实例上的内存利用率百分比。 利用率每分钟报告一次。  | 
CpuMemoryUtilizationPercentage | 
百分比 | 最小值、最大值、平均值 | instanceId | 
PT1M | 是 | 
| CPU 利用率百分比 实例上的 CPU 利用率百分比。 利用率每分钟报告一次。  | 
CpuUtilizationPercentage | 
百分比 | 最小值、最大值、平均值 | instanceId | 
PT1M | 是 | 
| 每分钟数据收集错误数 每分钟删除的数据收集事件数。  | 
DataCollectionErrorsPerMinute | 
计数 | 最小值、最大值、平均值 | 
              instanceId,reason,type | 
PT1M | 否 | 
| 每分钟数据收集事件数 每分钟处理的数据收集事件数。  | 
DataCollectionEventsPerMinute | 
计数 | 最小值、最大值、平均值 | 
              instanceId,type | 
PT1M | 否 | 
| 部署容量 部署中的实例数。  | 
DeploymentCapacity | 
计数 | 最小值、最大值、平均值 | 
              instanceId,State | 
PT1M | 否 | 
| 磁盘利用率 实例上的磁盘利用率百分比。 利用率每分钟报告一次。  | 
DiskUtilization | 
百分比 | 最小值、最大值、平均值 | 
              instanceId,disk | 
PT1M | 是 | 
| GPU 能量(焦耳) GPU 节点上的间隔功耗(焦耳)。 功耗每分钟报告一次。  | 
GpuEnergyJoules | 
计数 | 最小值、最大值、平均值 | instanceId | 
PT1M | 否 | 
| GPU 内存利用率百分比 实例上的 GPU 内存利用率百分比。 利用率每分钟报告一次。  | 
GpuMemoryUtilizationPercentage | 
百分比 | 最小值、最大值、平均值 | instanceId | 
PT1M | 是 | 
| GPU 利用率百分比 实例上的 GPU 利用率百分比。 利用率每分钟报告一次。  | 
GpuUtilizationPercentage | 
百分比 | 最小值、最大值、平均值 | instanceId | 
PT1M | 是 | 
类别:交通
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| P50 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P50 请求延迟  | 
RequestLatency_P50 | 
毫秒 | 平均值 | <无> | PT1M | 是 | 
| P90 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P90 请求延迟  | 
RequestLatency_P90 | 
毫秒 | 平均值 | <无> | PT1M | 是 | 
| P95 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P95 请求延迟  | 
RequestLatency_P95 | 
毫秒 | 平均值 | <无> | PT1M | 是 | 
| P99 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P99 请求延迟  | 
RequestLatency_P99 | 
毫秒 | 平均值 | <无> | PT1M | 是 | 
| 每分钟请求数 在一分钟内发送到联机部署的请求数  | 
RequestsPerMinute | 
计数 | 平均值 | envoy_response_code | 
PT1M | 否 |