下表列出了可用于 Microsoft.CognitiveServices/accounts 资源类型的指标。
表标题
指标 - 在 Azure 门户中显示的指标显示名称。
              Rest API 中的名称 - 在 REST API 中引用的指标名称。
单位 - 度量单位。
              聚合 - 默认的聚合类型。 有效值:平均值、最小值、最大值、总计、计数。
              维度 - 适用于指标的维度。
              时间粒度 - 对指标采样的间隔。 例如,PT1M 表示该指标每分钟采样一次,PT30M 表示每 30 分钟一次,PT1H 表示每小时一次,以此类推。
DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。
要了解如何导出指标的信息,请参阅在 Azure Monitor 中创建诊断设置。
有关指标保留的信息,请参阅 Azure Monitor 指标概述。
有关支持的日志列表,请参阅支持的日志类别 - Microsoft.CognitiveServices/accounts
类别:操作
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              操作出现次数 每个操作的出现次数。  | 
ActionIdOccurrences | 
计数 | 总计(总和) | 
              ActionId、Mode、RunId | 
PT1M | 是 | 
| 
              每个事件的操作数量 每个事件的操作数量。  | 
ActionsPerEvent | 
计数 | 平均值 | 
              Mode、RunId | 
PT1M | 是 | 
类别:Azure OpenAI - HTTP 请求
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              Azure OpenAI AvailabilityRate 使用以下公式计算可用性百分比:(调用总数 - 服务器错误数)/调用总数。 服务器错误包括任何 >=500 的 HTTP 响应。  | 
AzureOpenAIAvailabilityRate | 
百分比 | 最小值、最大值、平均值 | 
              ApiName、OperationName、Region、StreamType、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 否 | 
| 
              Azure OpenAI 请求 一段时间内对 Azure OpenAI API 的调用次数。 适用于 PTU、PTU 托管和即用即付部署。 若要细分 API 请求,可以按以下维度添加筛选器或应用拆分:ModelDeploymentName、ModelName、ModelVersion、StatusCode(成功、客户端程序、服务器错误)、IsSpillover 以获取溢出信息、StreamType(流式处理请求和非流式处理请求)和作。  | 
AzureOpenAIRequests | 
计数 | 总计(总和) | 
              ApiName、OperationName、Region、StreamType、ModelDeploymentName、ModelName、ModelVersion、StatusCode、IsSpillover | 
PT1M | 是 | 
类别:Azure OpenAI - 延迟
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              令牌之间的时间 对于流式处理请求,模型令牌生成速率,以毫秒为单位。 适用于 PTU、PTU 管理的部署以及即用即付部署。  | 
AzureOpenAINormalizedTBTInMS | 
毫秒 | 最大值、最小值、平均值 | 
              Region、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 是 | 
| 
              标准化首次字节时间 对于流式处理和非流式处理请求,模型发出请求后,接收第一字节响应数据所需的时间,并通过令牌规范化。 适用于 PTU、PTU 管理的部署以及即用即付部署。  | 
AzureOpenAINormalizedTTFTInMS | 
毫秒 | 最大值、最小值、平均值 | 
              Region、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 是 | 
| 
              响应时间 对于流式处理请求,建议使用延迟(响应能力)度量值。 适用于 PTU、PTU 管理的部署以及即用即付部署。 按用户发送提示后出现第一个响应所需的时间计算,由 API 网关测量。 随着提示大小增加和/或缓存命中大小减小,此数字将增加。 若要细分响应指标的时间,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 ModelVersion。 注意:此指标是一个近似值,因为测量的延迟在很大程度上取决于多个因素,包括并发调用和总体工作负载模式。 此外,它不考虑客户端与 API 终结点之间可能存在的任何客户端延迟。 有关最佳延迟跟踪,请参阅自己的日志记录。  | 
AzureOpenAITimeToResponse | 
毫秒 | 最小值、最大值、平均值 | 
              ApiName、OperationName、Region、StreamType、ModelDeploymentName、ModelName、ModelVersion、StatusCode | 
PT1M | 是 | 
| 
              每秒令牌数 枚举给定 Azure OpenAI 模型响应的生成速度。 生成的令牌总数除以生成令牌的时间(以秒为单位)。 适用于 PTU、PTU 管理的部署以及即用即付部署。  | 
AzureOpenAITokenPerSecond | 
计数 | 最大值、最小值、平均值 | 
              Region、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 是 | 
| 
              
              至最后一字节的时间 对于流式处理和非流式处理请求,模型发出请求后,接收最后一个字节响应数据所需的时间。 适用于 PTU、PTU 管理的部署以及即用即付部署。  | 
AzureOpenAITTLTInMS | 
毫秒 | 最大值、最小值、平均值 | 
              Region、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 是 | 
类别:Azure OpenAI - 使用情况
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              有效令牌 令牌总数减去一段时间内缓存的令牌。 适用于 PTU 和 PTU 托管的部署。 使用此指标可了解 PTU 的基于 TPS 或 TPM 的利用率,并将其与方案的目标 TPS 或 TPM 基准进行比较。 若要细分 API 请求,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 ModelVersion。  | 
ActiveTokens | 
计数 | 最小值、最大值、平均值、总计(求和) | 
              Region、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 是 | 
| 
              
              音频完成令牌 OpenAI 模型上生成的音频提示令牌数(输出)。 适用于 PTU 管理的部署和即用即付模型部署。  | 
AudioCompletionTokens | 
计数 | 总计(总和) | 
              ModelDeploymentName、ModelName、ModelVersion、Region | 
PT1M | 是 | 
| 
              音频提示令牌 在 OpenAI 模型上处理(输入)的音频提示令牌数量。 适用于 PTU 管理的部署和即用即付模型部署。  | 
AudioPromptTokens | 
计数 | 总计(总和) | 
              ModelDeploymentName、ModelName、ModelVersion、Region | 
PT1M | 是 | 
| 
              提示令牌缓存匹配率 命中缓存的提示令牌的百分比。 适用于 PTU 和 PTU 托管的部署。  | 
AzureOpenAIContextTokensCacheMatchRate | 
百分比 | 最小值、最大值、平均值 | 
              Region、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 否 | 
| 
              预配管理利用率(已弃用) 预配管理的部署的利用率百分比,计算公式为 (已使用的 PTU/已部署的 PTU) x 100。 当利用率大于或等于 100% 时,调用将受到限制,并返回错误代码 429。 若要细分此指标,可以添加一个筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName、ModelVersion 和 StreamType(流式处理请求和非流式处理请求)  | 
AzureOpenAIProvisionedManagedUtilization | 
百分比 | 最小值、最大值、平均值 | 
              Region、StreamType、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 否 | 
| 
              预配管理的利用率 V2 预配管理的部署的利用率百分比,计算公式为 (已使用的 PTU/已部署的 PTU) x 100。 当利用率大于或等于 100% 时,调用将受到限制,并返回错误代码 429。 若要细分此指标,可以添加一个筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName、ModelVersion 和 StreamType(流式处理请求和非流式处理请求)  | 
AzureOpenAIProvisionedManagedUtilizationV2 | 
百分比 | 最小值、最大值、平均值 | 
              Region、StreamType、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 否 | 
| 
              已处理的 FineTuned 训练小时数 在 OpenAI FineTuned 模型中处理的训练小时数  | 
FineTunedTrainingHours | 
计数 | 总计(总和) | 
              ApiName、ModelDeploymentName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              生成的完成令牌 从 OpenAI 模型生成(输出)的令牌数。 适用于 PTU、PTU 管理的部署以及即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。  | 
GeneratedTokens | 
计数 | 总计(总和) | 
              ApiName、ModelDeploymentName、FeatureName、UsageChannel、Region、ModelVersion | 
PT1M | 是 | 
| 
              已处理的提示令牌 OpenAI 模型上处理(输入)的提示令牌数。 适用于 PTU、PTU 管理的部署以及即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。  | 
ProcessedPromptTokens | 
计数 | 总计(总和) | 
              ApiName、ModelDeploymentName、FeatureName、UsageChannel、Region、ModelVersion | 
PT1M | 是 | 
| 
              已处理的推理令牌 在 OpenAI 模型上处理的推理令牌数量。 计算公式为提示令牌(输入)加上生成的令牌(输出)。 适用于 PTU、PTU 管理的部署以及即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。  | 
TokenTransaction | 
计数 | 总计(总和) | 
              ApiName、ModelDeploymentName、FeatureName、UsageChannel、Region、ModelVersion | 
PT1M | 是 | 
类别:认知服务 - HTTP 请求
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              阻止的调用数 超过速率或配额限制的调用数。 请勿用于 Azure OpenAI 服务。  | 
BlockedCalls | 
计数 | 总计(总和) | 
              ApiName、OperationName、Region、RatelimitKey | 
PT1M | 是 | 
| 
              客户端错误数 引发客户端错误(HTTP 响应代码 4xx)的调用数。 请勿用于 Azure OpenAI 服务。  | 
ClientErrors | 
计数 | 总计(总和) | 
              ApiName、OperationName、Region、RatelimitKey | 
PT1M | 是 | 
| 
              数据输入 传入数据的大小(字节)。 请勿用于 Azure OpenAI 服务。  | 
DataIn | 
字节 | 总计(总和) | 
              ApiName、OperationName、Region | 
PT1M | 是 | 
| 
              数据输出 传出数据的大小(字节)。 请勿用于 Azure OpenAI 服务。  | 
DataOut | 
字节 | 总计(总和) | 
              ApiName、OperationName、Region | 
PT1M | 是 | 
| 
              延迟 延迟(毫秒)。 请勿用于 Azure OpenAI 服务。  | 
Latency | 
毫秒 | 平均值 | 
              ApiName、OperationName、Region、RatelimitKey | 
PT1M | 是 | 
| 
              Ratelimit ratelimit 键的当前速率限制。 请勿用于 Azure OpenAI 服务。  | 
Ratelimit | 
计数 | 总计(总和) | 
              Region、RatelimitKey | 
PT1M | 是 | 
| 
              服务器错误数 引发服务内部错误(HTTP 响应代码 5xx)的调用数。 请勿用于 Azure OpenAI 服务。  | 
ServerErrors | 
计数 | 总计(总和) | 
              ApiName、OperationName、Region、RatelimitKey | 
PT1M | 是 | 
| 
              成功调用数 成功调用数。 请勿用于 Azure OpenAI 服务。  | 
SuccessfulCalls | 
计数 | 总计(总和) | 
              ApiName、OperationName、Region、RatelimitKey | 
PT1M | 是 | 
| 
              呼叫总数 调用总数。 请勿用于 Azure OpenAI 服务。  | 
TotalCalls | 
计数 | 总计(总和) | 
              ApiName、OperationName、Region、RatelimitKey | 
PT1M | 是 | 
| 
              错误总数 引发错误响应(HTTP 响应代码 4xx 或 5xx)的调用总数。 请勿用于 Azure OpenAI 服务。  | 
TotalErrors | 
计数 | 总计(总和) | 
              ApiName、OperationName、Region、RatelimitKey | 
PT1M | 是 | 
| 
              令牌调用总数 令牌调用的总数。  | 
TotalTokenCalls | 
计数 | 总计(总和) | 
              ApiName、OperationName、Region | 
PT1M | 是 | 
类别:认知服务 - SLI
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              AvailabilityRate 使用以下公式计算可用性百分比:(调用总数 - 服务器错误数)/调用总数。 服务器错误包括任何 >=500 的 HTTP 响应。 请勿用于 Azure OpenAI 服务。  | 
SuccessRate | 
百分比 | 最小值、最大值、平均值 | 
              ApiName、OperationName、Region、RatelimitKey | 
PT1M | 否 | 
类别:内容安全 - 风险与安全
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              潜在的滥用用户计数 在一段时间内检测到的潜在滥用用户数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName。  | 
RAIAbusiveUsersCount | 
计数 | 总计(总和) | 
              Region、ModelDeploymentName | 
PT1M | 是 | 
| 
              检测到有害卷 一段时间内应用的内容筛选器对 Azure OpenAI API 进行的并检测为有害(块模型和注释模式)的调用数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 TextType。  | 
RAIHarmfulRequests | 
计数 | 总计(总和) | 
              Region、ModelDeploymentName、ModelName、ModelVersion、ApiName、TextType、Category、Severity | 
PT1M | 是 | 
| 
              阻止的卷 在一段时间内对 Azure OpenAI API 进行并被应用的内容筛选器拒绝的调用数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 TextType。  | 
RAIRejectedRequests | 
计数 | 总计(总和) | 
              Region、ModelDeploymentName、ModelName、ModelVersion、ApiName、TextType、Category | 
PT1M | 是 | 
| 
              安全系统事件 用于风险与安全监视的系统事件。 可以添加筛选器或按以下维度应用拆分:EventType。  | 
RAISystemEvent | 
计数 | 平均值 | 
              Region、EventType | 
PT1M | 是 | 
| 
              为安全检查发送的总卷 在一段时间内对 Azure OpenAI API 进行并被应用的内容筛选器检测的调用数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName。  | 
RAITotalRequests | 
计数 | 总计(总和) | 
              Region、ModelDeploymentName、ModelName、ModelVersion、ApiName | 
PT1M | 是 | 
类别:内容安全 - 使用
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              用于图像审查的调用计数 用于图像审查的调用数。  | 
ContentSafetyImageAnalyzeRequestCount | 
计数 | 总计(总和) | ApiVersion | 
PT1M | 是 | 
| 
              用于文本审查的调用计数 用于文本审查的调用数。  | 
ContentSafetyTextAnalyzeRequestCount | 
计数 | 总计(总和) | ApiVersion | 
PT1M | 是 | 
类别:估计
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              基线随机事件计数 基线随机事件计数的估算值。  | 
BaselineRandomEventCount | 
计数 | 总计(总和) | 
              Mode、RunId | 
PT1M | 是 | 
| 
              基线随机奖励 基线随机奖励的估算值。  | 
BaselineRandomReward | 
计数 | 总计(总和) | 
              Mode、RunId | 
PT1M | 是 | 
| 
              联机事件计数 联机事件计数的估算值。  | 
OnlineEventCount | 
计数 | 总计(总和) | 
              Mode、RunId | 
PT1M | 是 | 
| 
              联机奖励 联机奖励的估算值。  | 
OnlineReward | 
计数 | 总计(总和) | 
              Mode、RunId | 
PT1M | 是 | 
| 
              用户基线事件计数 用户定义的基线事件计数的估算值。  | 
UserBaselineEventCount | 
计数 | 总计(总和) | 
              Mode、RunId | 
PT1M | 是 | 
| 
              用户基线奖励 用户定义的基线奖励的估算值。  | 
UserBaselineReward | 
计数 | 总计(总和) | 
              Mode、RunId | 
PT1M | 是 | 
类别:功能出现情况
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              操作特征出现次数 每个操作特征的出现次数。  | 
ActionFeatureIdOccurrences | 
计数 | 总计(总和) | 
              FeatureId、Mode、RunId | 
PT1M | 是 | 
| 
              上下文特征出现次数 每个上下文特征的出现次数。  | 
ContextFeatureIdOccurrences | 
计数 | 总计(总和) | 
              FeatureId、Mode、RunId | 
PT1M | 是 | 
| 
              槽特征出现次数 每个槽特征的出现次数。  | 
SlotFeatureIdOccurrences | 
计数 | 总计(总和) | 
              FeatureId、Mode、RunId | 
PT1M | 是 | 
类别:FeatureCardinality
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              按操作列出的特征基数 基于操作的特征基数。  | 
FeatureCardinality_Action | 
计数 | 平均值 | 
              FeatureId、Mode、RunId | 
PT1M | 是 | 
| 
              按上下文列出的特征基数 基于上下文的特征基数。  | 
FeatureCardinality_Context | 
计数 | 平均值 | 
              FeatureId、Mode、RunId | 
PT1M | 是 | 
| 
              按槽列出的特征基数 基于槽的特征基数。  | 
FeatureCardinality_Slot | 
计数 | 平均值 | 
              FeatureId、Mode、RunId | 
PT1M | 是 | 
类别:每个事件的特点
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              每个事件的操作特征数 每个事件的平均操作特征数量。  | 
ActionFeaturesPerEvent | 
计数 | 平均值 | 
              Mode、RunId | 
PT1M | 是 | 
| 
              每个事件的上下文特征数 每个事件的上下文特征数量。  | 
ContextFeaturesPerEvent | 
计数 | 平均值 | 
              Mode、RunId | 
PT1M | 是 | 
| 
              每个事件的槽特征数 每个事件的平均槽特征数量。  | 
SlotFeaturesPerEvent | 
计数 | 平均值 | 
              Mode、RunId | 
PT1M | 是 | 
类别:语言 - 作业
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              作业工期(预览版) 注意:此值在很大程度上取决于输入大小、文档数量和任务的复杂性。 这是所有作业任务的聚合值。  | 
JobDuration | 
毫秒 | 最小值、最大值、平均值 | 
              JobStatus、JobType | 
PT1M | 是 | 
类别:模型 - HTTP 请求
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              模型可用性率 使用以下公式计算可用性百分比:(调用总数 - 服务器错误数)/调用总数。 服务器错误包括任何 >=500 的 HTTP 响应。  | 
ModelAvailabilityRate | 
百分比 | 最小值、最大值、平均值 | 
              Region、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 否 | 
| 
              模型请求 在一段时间内对模型 API 进行的调用数。 适用于 PTU、PTU 托管和即用即付部署。  | 
ModelRequests | 
计数 | 总计(总和) | 
              ApiName、OperationName、Region、StreamType、ModelDeploymentName、ModelName、ModelVersion、StatusCode | 
PT1M | 是 | 
类别:模型 - 延迟
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              令牌之间的时间 对于流式处理请求;模型令牌生成速率,以毫秒为单位。 适用于 PTU 和 PTU 托管的部署。  | 
NormalizedTimeBetweenTokens | 
毫秒 | 最大值、最小值、平均值 | 
              ApiName、OperationName、Region、StreamType、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 是 | 
| 
              标准化首次字节时间 对于流式处理和非流式处理请求,模型发出请求后,接收第一字节响应数据所需的时间,并通过令牌规范化。 适用于 PTU、PTU 管理的部署以及即用即付部署。  | 
NormalizedTimeToFirstToken | 
毫秒 | 最大值、最小值、平均值 | 
              ApiName、OperationName、Region、StreamType、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 是 | 
| 
              
              至最后一字节的时间 对于流式处理和非流式处理请求,模型发出请求后,接收最后一个字节响应数据所需的时间。 适用于 PTU、PTU 管理的部署以及即用即付部署。  | 
TimeToLastByte | 
毫秒 | 最大值、最小值、平均值 | 
              ApiName、OperationName、Region、StreamType、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 是 | 
| 
              响应时间 对于流式处理请求,建议使用延迟(响应能力)度量值。 适用于 PTU 和 PTU 托管的部署。 按用户发送提示后出现第一个响应所需的时间计算,由 API 网关测量。 随着提示大小增加和/或缓存命中大小减小,此数字将增加。 若要细分响应指标的时间,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 ModelVersion。 注意:此指标是一个近似值,因为测量的延迟在很大程度上取决于多个因素,包括并发调用和总体工作负载模式。 此外,它不考虑客户端与 API 终结点之间可能存在的任何客户端延迟。 有关最佳延迟跟踪,请参阅自己的日志记录。  | 
TimeToResponse | 
毫秒 | 最小值、最大值、平均值 | 
              ApiName、OperationName、Region、StreamType、ModelDeploymentName、ModelName、ModelVersion、StatusCode | 
PT1M | 是 | 
| 
              每秒令牌数 枚举给定模型响应的生成速度。 生成的令牌总数除以生成令牌的时间(以秒为单位)。 适用于 PTU 和 PTU 托管的部署。  | 
TokensPerSecond | 
计数 | 最大值、最小值、平均值 | 
              ApiName、OperationName、Region、StreamType、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 是 | 
类别:模型 - 使用情况
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              输入标记 在模型上处理(输入)的提示标记数量。 适用于 PTU、PTU 托管和即用即付部署。  | 
InputTokens | 
计数 | 总计(总和) | 
              ApiName、Region、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 是 | 
| 
              输出令牌 从 OpenAI 模型生成(输出)的令牌数。 适用于 PTU、PTU 托管和即用即付部署。  | 
OutputTokens | 
计数 | 总计(总和) | 
              ApiName、Region、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 是 | 
| 
              预配利用率 预配管理的部署的利用率百分比,计算公式为 (已使用的 PTU/已部署的 PTU) x 100。 当利用率大于或等于 100% 时,调用将受到限制,并返回错误代码 429。  | 
ProvisionedUtilization | 
百分比 | 最小值、最大值、平均值 | 
              Region、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 否 | 
| 
              令牌总数 在模型上处理的推理标记数量。 计算公式为提示令牌(输入)加上生成的令牌(输出)。 适用于 PTU、PTU 托管和即用即付部署。  | 
TotalTokens | 
计数 | 总计(总和) | 
              ApiName、Region、ModelDeploymentName、ModelName、ModelVersion | 
PT1M | 是 | 
类别:每个事件的命名空间数
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              每个事件的操作命名空间数 每个事件的平均操作命名空间数量。  | 
ActionNamespacesPerEvent | 
计数 | 平均值 | 
              Mode、RunId | 
PT1M | 是 | 
| 
              每个事件的上下文命名空间数 每个事件的上下文命名空间数量。  | 
ContextNamespacesPerEvent | 
计数 | 平均值 | 
              Mode、RunId | 
PT1M | 是 | 
| 
              每个事件的槽命名空间数 每个事件的平均槽命名空间数量。  | 
SlotNamespacesPerEvent | 
计数 | 平均值 | 
              Mode、RunId | 
PT1M | 是 | 
类别:奖励
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              每个事件的平均奖励 每个事件的平均奖励。  | 
Reward | 
计数 | 平均值 | 
              BaselineAction、ChosenActionId、MatchesBaseline、NonDefaultReward、Mode、RunId | 
PT1M | 是 | 
| 
              槽奖励 每个槽的奖励。  | 
SlotReward | 
计数 | 平均值 | 
              BaselineActionId、ChosenActionId、MatchesBaseline、NonDefaultReward、SlotId、SlotIndex、Mode、RunId | 
PT1M | 是 | 
类别:槽
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              基线估算器总奖励 基线估算器总奖励。  | 
BaselineEstimatorOverallReward | 
计数 | 平均值 | 
              Mode、RunId | 
PT1M | 是 | 
| 
              基线估算器槽奖励 按槽列出的基线估算器奖励。  | 
BaselineEstimatorSlotReward | 
计数 | 平均值 | 
              SlotId、SlotIndex、Mode、RunId | 
PT1M | 是 | 
| 
              基线随机估算器总奖励 基线随机估算器总奖励。  | 
BaselineRandomEstimatorOverallReward | 
计数 | 平均值 | 
              Mode、RunId | 
PT1M | 是 | 
| 
              基线随机估算器槽奖励 按槽列出的基线随机估算器奖励。  | 
BaselineRandomEstimatorSlotReward | 
计数 | 平均值 | 
              SlotId、SlotIndex、Mode、RunId | 
PT1M | 是 | 
| 
              槽 每个事件的槽数。  | 
NumberOfSlots | 
计数 | 平均值 | 
              Mode、RunId | 
PT1M | 是 | 
| 
              联机估算器总奖励 联机估算器总奖励。  | 
OnlineEstimatorOverallReward | 
计数 | 平均值 | 
              Mode、RunId | 
PT1M | 是 | 
| 
              联机估算器槽奖励 按槽列出的联机估算器奖励。  | 
OnlineEstimatorSlotReward | 
计数 | 平均值 | 
              SlotId、SlotIndex、Mode、RunId | 
PT1M | 是 | 
| 
              槽出现次数 每个槽的出现次数。  | 
SlotIdOccurrences | 
计数 | 总计(总和) | 
              SlotId、SlotIndex、Mode、RunId | 
PT1M | 是 | 
类别:SpeechServices - 用法
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              音频秒批处理转录 转录的秒批数  | 
AudioSecondsBatchTranscribed | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              音频秒批低音听录 批耳语听录秒数  | 
AudioSecondsBatchWhisperTranscribed | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              音频秒快速转录 转录的秒数快  | 
AudioSecondsFastTranscribed | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              音频秒快耳语转录 听录的快速低语秒数  | 
AudioSecondsFastWhisperTranscribed | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              转录的音频秒数 转录的秒数  | 
AudioSecondsTranscribed | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              转换的音频秒数 转换的秒数  | 
AudioSecondsTranslated | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 虚拟形象模型托管秒数 秒数。  | 
AvatarModelHostingSeconds | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              虚拟人物模型训练时间秒 秒数。  | 
AvatarModelTrainingSeconds | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              说话人配置文件数 注册的说话人配置文件数。 每小时按比例计算。  | 
NumberofSpeakerProfiles | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              说话人辨识事务 说话人辨识事务数  | 
SpeakerRecognitionTransactions | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              语音模型托管时间 语音模型托管时间数  | 
SpeechModelHostingHours | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 合成字符数 字符数。  | 
SynthesizedCharacters | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 合成视频秒数 合成的秒数  | 
VideoSecondsSynthesized | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 语音模型托管小时数 小时数。  | 
VoiceModelHostingHours | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 语音模型训练分钟数 分钟数。  | 
VoiceModelTrainingMinutes | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
类别:使用情况
| 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 | 
|---|---|---|---|---|---|---|
| 
              推理计数 Carnegie Frontdoor 服务的推理计数  | 
CarnegieInferenceCount | 
计数 | 总计(总和) | 
              Region、Modality、Category、Language、SeverityLevel、UseCustomList | 
PT1M | 是 | 
| 
              训练的字符数(已弃用) 训练的字符总数。  | 
CharactersTrained | 
计数 | 总计(总和) | 
              ApiName、OperationName、Region | 
PT1M | 是 | 
| 
              转换的字符数(已弃用) 传入的文本请求中的字符总数。  | 
CharactersTranslated | 
计数 | 总计(总和) | 
              ApiName、OperationName、Region | 
PT1M | 是 | 
| 
              计算机视觉事务 计算机视觉事务数  | 
ComputerVisionTransactions | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              自定义视觉训练时间 自定义视觉训练时间  | 
CustomVisionTrainingTime | 
秒 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              自定义视觉事务 自定义视觉预测事务数  | 
CustomVisionTransactions | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              转换的文档字符数 文档翻译请求中的字符数。  | 
DocumentCharactersTranslated | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              转换的文档自定义字符数 自定义文档翻译请求中的字符数。  | 
DocumentCustomCharactersTranslated | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              训练的人脸图像 训练的图像数。 每个事务训练 1,000 个图像。  | 
FaceImagesTrained | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              存储的人脸 存储的人脸数,每日按比例计算。 每日报告存储的人脸数。  | 
FacesStored | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              人脸事务 对人脸服务进行 API 调用的数量  | 
FaceTransactions | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              存储的图像 存储的自定义视觉图像数。  | 
ImagesStored | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              已了解的事件数 已了解的事件数。  | 
LearnedEvents | 
计数 | 总计(总和) | 
              IsMatchBaseline、Mode、RunId | 
PT1M | 是 | 
| 
              LUIS 语音请求 LUIS 语音转意向理解请求数  | 
LUISSpeechRequests | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              LUIS 文本请求 LUIS 文本请求数  | 
LUISTextRequests | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              匹配的奖励数 匹配的奖励数。  | 
MatchedRewards | 
计数 | 总计(总和) | 
              Mode、RunId | 
PT1M | 是 | 
| 
              未激活的事件数 跳过的事件数量。  | 
NonActivatedEvents | 
计数 | 总计(总和) | 
              Mode、RunId | 
PT1M | 是 | 
| 
              观察到的奖励数 观察到的奖励数。  | 
ObservedRewards | 
计数 | 总计(总和) | 
              Mode、RunId | 
PT1M | 是 | 
| 
              转换的同步字符数 文档翻译(同步)请求中的字符数。  | 
OneDocumentCharactersTranslated | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              转换的文档同步自定义字符数 自定义文档翻译(同步)请求中的字符数。  | 
OneDocumentCustomCharactersTranslated | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              已处理的字符数 沉浸式阅读器处理的字符数。  | 
ProcessedCharacters | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              处理的运行状况文本记录 处理的运行状况文本记录数  | 
ProcessedHealthTextRecords | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              已处理的图像 处理的图像数  | 
ProcessedImages | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              处理的页面 处理的页面数  | 
ProcessedPages | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              已处理的文本记录数 文本记录的计数。  | 
ProcessedTextRecords | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              QA 文本记录 处理的文本记录数  | 
QuestionAnsweringTextRecords | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              语音会话持续时间(已弃用) 语音会话的总持续时间(以秒计)。  | 
SpeechSessionDuration | 
秒 | 总计(总和) | 
              ApiName、OperationName、Region | 
PT1M | 是 | 
| 
              转换的文本字符数 传入的文本翻译请求中的字符数。  | 
TextCharactersTranslated | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              转换的文本自定义字符数 传入的自定义文本翻译请求中的字符数。  | 
TextCustomCharactersTranslated | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              训练的文本字符数 使用文本翻译训练的字符数。  | 
TextTrainedCharacters | 
计数 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 | 
| 
              事件总数 事件数量。  | 
TotalEvents | 
计数 | 总计(总和) | 
              Mode、RunId | 
PT1M | 是 | 
| 
              总事务(已弃用) 事务总数。  | 
TotalTransactions | 
计数 | 总计(总和) | <无> | PT1M | 是 | 
| 
              Translator Pro 应用程序秒数 Translator Pro应用使用秒数。  | 
TranslatorProAppSeconds | 
秒 | 总计(总和) | 
              ApiName、FeatureName、UsageChannel、Region | 
PT1M | 是 |