Microsoft.CognitiveServices/accounts 支持的指标
下表列出了可用于 Microsoft.CognitiveServices/accounts 资源类型的指标。
表标题
指标 - 在 Azure 门户中显示的指标显示名称。
Rest API 中的名称 - 在 REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认的聚合类型。 有效值:平均值、最小值、最大值、总计、计数。
维度 - 适用于指标的维度。
时间粒度 - 对指标采样的间隔。 例如,PT1M
表示该指标每分钟采样一次,PT30M
表示每 30 分钟一次,PT1H
表示每小时一次,以此类推。
DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。
要了解如何导出指标的信息,请参阅在 Azure Monitor 中创建诊断设置。
有关指标保留的信息,请参阅 Azure Monitor 指标概述。
有关支持的日志列表,请参阅支持的日志类别 - Microsoft.CognitiveServices/accounts
类别 | 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|---|
功能出现次数 | 操作特征出现次数 每个操作特征的出现次数。 |
ActionFeatureIdOccurrences |
计数 | 总计(总和) | FeatureId 、Mode 、RunId |
PT1M | 是 |
每个事件的功能数 | 每个事件的操作特征数 每个事件的平均操作特征数量。 |
ActionFeaturesPerEvent |
计数 | 平均值 | Mode 、RunId |
PT1M | 是 |
操作 | 操作出现次数 每个操作的出现次数。 |
ActionIdOccurrences |
计数 | 总计(总和) | ActionId 、Mode 、RunId |
PT1M | 是 |
每个事件的命名空间数 | 每个事件的操作命名空间数 每个事件的平均操作命名空间数量。 |
ActionNamespacesPerEvent |
计数 | 平均值 | Mode 、RunId |
PT1M | 是 |
操作 | 每个事件的操作数量 每个事件的操作数量。 |
ActionsPerEvent |
计数 | 平均值 | Mode 、RunId |
PT1M | 是 |
Azure OpenAI - 用法 | 有效令牌 令牌总数减去一段时间内缓存的令牌。 适用于 PTU 和 PTU 托管的部署。 使用此指标可了解 PTU 的基于 TPS 或 TPM 的利用率,并将其与方案的目标 TPS 或 TPM 基准进行比较。 若要细分 API 请求,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 ModelVersion。 |
ActiveTokens |
计数 | 最小值、最大值、平均值、总计(求和) | Region 、ModelDeploymentName 、ModelName 、ModelVersion |
PT1M | 是 |
SpeechServices - 用法 | 转录的音频秒数 转录的秒数 |
AudioSecondsTranscribed |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
SpeechServices - 用法 | 转换的音频秒数 转换的秒数 |
AudioSecondsTranslated |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
SpeechServices - 用法 | 虚拟形象模型托管秒数 秒数。 |
AvatarModelHostingSeconds |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
Azure OpenAI - HTTP 请求 | 提示令牌缓存匹配率 提示令牌命中缓存的百分比,适用于 PTU 管理的令牌。 |
AzureOpenAIContextTokensCacheMatchRate |
百分比 | 最小值、最大值、平均值 | Region 、ModelDeploymentName 、ModelName 、ModelVersion |
PT1M | 否 |
Azure OpenAI - 用法 | 预配管理的利用率 预配管理的部署的利用率百分比,计算公式为 (已使用的 PTU/已部署的 PTU) x 100。 当利用率大于或等于 100% 时,调用将受到限制,并返回错误代码 429。 若要细分此指标,可以添加一个筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName、ModelVersion 和 StreamType(流式处理请求和非流式处理请求) |
AzureOpenAIProvisionedManagedUtilization |
百分比 | 最小值、最大值、平均值 | Region 、StreamType 、ModelDeploymentName 、ModelName 、ModelVersion |
PT1M | 否 |
Azure OpenAI - 用法 | 预配管理的利用率 V2 预配管理的部署的利用率百分比,计算公式为 (已使用的 PTU/已部署的 PTU) x 100。 当利用率大于或等于 100% 时,调用将受到限制,并返回错误代码 429。 若要细分此指标,可以添加一个筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName、ModelVersion 和 StreamType(流式处理请求和非流式处理请求) |
AzureOpenAIProvisionedManagedUtilizationV2 |
百分比 | 最小值、最大值、平均值 | Region 、StreamType 、ModelDeploymentName 、ModelName 、ModelVersion |
PT1M | 否 |
Azure OpenAI - HTTP 请求 | Azure OpenAI 请求 一段时间内对 Azure OpenAI API 的调用次数。 适用于 PTU、PTU 托管和即用即付部署。 若要细分 API 请求,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName、ModelVersion、StatusCode(成功、客户端程序、服务器错误)、StreamType(流式处理请求和非流式处理请求)和操作。 |
AzureOpenAIRequests |
计数 | 总计(总和) | ApiName 、OperationName 、Region 、StreamType 、ModelDeploymentName 、ModelName 、ModelVersion 、StatusCode |
PT1M | 是 |
Azure OpenAI - HTTP 请求 | 响应时间 对于流式处理请求,建议使用延迟(响应能力)度量值。 适用于 PTU 和 PTU 托管的部署。 按用户发送提示后出现第一个响应所需的时间计算,由 API 网关测量。 随着提示大小增加和/或缓存命中大小减小,此数字将增加。 若要细分响应指标的时间,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 ModelVersion。 注意:此指标是一个近似值,因为测量的延迟在很大程度上取决于多个因素,包括并发调用和总体工作负载模式。 此外,它不考虑客户端与 API 终结点之间可能存在的任何客户端延迟。 有关最佳延迟跟踪,请参阅自己的日志记录。 |
AzureOpenAITimeToResponse |
毫秒 | 最小值、最大值、平均值 | ApiName 、OperationName 、Region 、StreamType 、ModelDeploymentName 、ModelName 、ModelVersion 、StatusCode |
PT1M | 是 |
槽 | 基线估算器总奖励 基线估算器总奖励。 |
BaselineEstimatorOverallReward |
计数 | 平均值 | Mode 、RunId |
PT1M | 是 |
槽 | 基线估算器槽奖励 按槽列出的基线估算器奖励。 |
BaselineEstimatorSlotReward |
计数 | 平均值 | SlotId 、SlotIndex 、Mode 、RunId |
PT1M | 是 |
槽 | 基线随机估算器总奖励 基线随机估算器总奖励。 |
BaselineRandomEstimatorOverallReward |
计数 | 平均值 | Mode 、RunId |
PT1M | 是 |
槽 | 基线随机估算器槽奖励 按槽列出的基线随机估算器奖励。 |
BaselineRandomEstimatorSlotReward |
计数 | 平均值 | SlotId 、SlotIndex 、Mode 、RunId |
PT1M | 是 |
估计 | 基线随机事件计数 基线随机事件计数的估算值。 |
BaselineRandomEventCount |
计数 | 总计(总和) | Mode 、RunId |
PT1M | 是 |
估计 | 基线随机奖励 基线随机奖励的估算值。 |
BaselineRandomReward |
计数 | 总计(总和) | Mode 、RunId |
PT1M | 是 |
认知服务 - HTTP 请求 | 阻止的调用数 超过速率或配额限制的调用数。 请勿用于 Azure OpenAI 服务。 |
BlockedCalls |
计数 | 总计(总和) | ApiName 、OperationName 、Region 、RatelimitKey |
PT1M | 是 |
使用情况 | 推理计数 Carnegie Frontdoor 服务的推理计数 |
CarnegieInferenceCount |
计数 | 总计(总和) | Region 、Modality 、Category 、Language 、SeverityLevel 、UseCustomList |
PT1M | 是 |
使用情况 | 训练的字符数(已弃用) 训练的字符总数。 |
CharactersTrained |
计数 | 总计(总和) | ApiName 、OperationName 、Region |
PT1M | 是 |
使用情况 | 转换的字符数(已弃用) 传入的文本请求中的字符总数。 |
CharactersTranslated |
计数 | 总计(总和) | ApiName 、OperationName 、Region |
PT1M | 是 |
认知服务 - HTTP 请求 | 客户端错误数 引发客户端错误(HTTP 响应代码 4xx)的调用数。 请勿用于 Azure OpenAI 服务。 |
ClientErrors |
计数 | 总计(总和) | ApiName 、OperationName 、Region 、RatelimitKey |
PT1M | 是 |
使用情况 | 计算机视觉事务 计算机视觉事务数 |
ComputerVisionTransactions |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
ContentSafety - 用法 | 用于图像审查的调用计数 用于图像审查的调用数。 |
ContentSafetyImageAnalyzeRequestCount |
计数 | 总计(总和) | ApiVersion |
PT1M | 是 |
ContentSafety - 用法 | 用于文本审查的调用计数 用于文本审查的调用数。 |
ContentSafetyTextAnalyzeRequestCount |
计数 | 总计(总和) | ApiVersion |
PT1M | 是 |
功能出现次数 | 上下文特征出现次数 每个上下文特征的出现次数。 |
ContextFeatureIdOccurrences |
计数 | 总计(总和) | FeatureId 、Mode 、RunId |
PT1M | 是 |
每个事件的功能数 | 每个事件的上下文特征数 每个事件的上下文特征数量。 |
ContextFeaturesPerEvent |
计数 | 平均值 | Mode 、RunId |
PT1M | 是 |
每个事件的命名空间数 | 每个事件的上下文命名空间数 每个事件的上下文命名空间数量。 |
ContextNamespacesPerEvent |
计数 | 平均值 | Mode 、RunId |
PT1M | 是 |
使用情况 | 自定义视觉训练时间 自定义视觉训练时间 |
CustomVisionTrainingTime |
秒 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | 自定义视觉事务 自定义视觉预测事务数 |
CustomVisionTransactions |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
认知服务 - HTTP 请求 | 数据输入 传入数据的大小(字节)。 请勿用于 Azure OpenAI 服务。 |
DataIn |
字节 | 总计(总和) | ApiName 、OperationName 、Region |
PT1M | 是 |
认知服务 - HTTP 请求 | 数据输出 传出数据的大小(字节)。 请勿用于 Azure OpenAI 服务。 |
DataOut |
字节 | 总计(总和) | ApiName 、OperationName 、Region |
PT1M | 是 |
使用情况 | 转换的文档字符数 文档翻译请求中的字符数。 |
DocumentCharactersTranslated |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | 转换的文档自定义字符数 自定义文档翻译请求中的字符数。 |
DocumentCustomCharactersTranslated |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | 训练的人脸图像 训练的图像数。 每个事务训练 1,000 个图像。 |
FaceImagesTrained |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | 存储的人脸 存储的人脸数,每日按比例计算。 每日报告存储的人脸数。 |
FacesStored |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | 人脸事务 对人脸服务进行 API 调用的数量 |
FaceTransactions |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
FeatureCardinality | 按操作列出的特征基数 基于操作的特征基数。 |
FeatureCardinality_Action |
计数 | 平均值 | FeatureId 、Mode 、RunId |
PT1M | 是 |
FeatureCardinality | 按上下文列出的特征基数 基于上下文的特征基数。 |
FeatureCardinality_Context |
计数 | 平均值 | FeatureId 、Mode 、RunId |
PT1M | 是 |
FeatureCardinality | 按槽列出的特征基数 基于槽的特征基数。 |
FeatureCardinality_Slot |
计数 | 平均值 | FeatureId 、Mode 、RunId |
PT1M | 是 |
Azure OpenAI - 用法 | 已处理的 FineTuned 训练小时数 在 OpenAI FineTuned 模型中处理的训练小时数 |
FineTunedTrainingHours |
计数 | 总计(总和) | ApiName 、ModelDeploymentName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
Azure OpenAI - 用法 | 生成的完成令牌 从 OpenAI 模型生成(输出)的令牌数。 适用于 PTU、PTU 托管和即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。 |
GeneratedTokens |
计数 | 总计(总和) | ApiName 、ModelDeploymentName 、FeatureName 、UsageChannel 、Region 、ModelVersion |
PT1M | 是 |
使用情况 | 存储的图像 存储的自定义视觉图像数。 |
ImagesStored |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
认知服务 - HTTP 请求 | 延迟 延迟(毫秒)。 请勿用于 Azure OpenAI 服务。 |
Latency |
毫秒 | 平均值 | ApiName 、OperationName 、Region 、RatelimitKey |
PT1M | 是 |
使用情况 | 已了解的事件数 已了解的事件数。 |
LearnedEvents |
计数 | 总计(总和) | IsMatchBaseline 、Mode 、RunId |
PT1M | 是 |
使用情况 | LUIS 语音请求 LUIS 语音转意向理解请求数 |
LUISSpeechRequests |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | LUIS 文本请求 LUIS 文本请求数 |
LUISTextRequests |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | 匹配的奖励数 匹配的奖励数。 |
MatchedRewards |
计数 | 总计(总和) | Mode 、RunId |
PT1M | 是 |
使用情况 | 未激活的事件数 跳过的事件数量。 |
NonActivatedEvents |
计数 | 总计(总和) | Mode 、RunId |
PT1M | 是 |
槽 | 槽 每个事件的槽数。 |
NumberOfSlots |
计数 | 平均值 | Mode 、RunId |
PT1M | 是 |
SpeechServices - 用法 | 说话人配置文件数 注册的说话人配置文件数。 每小时按比例计算。 |
NumberofSpeakerProfiles |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | 观察到的奖励数 观察到的奖励数。 |
ObservedRewards |
计数 | 总计(总和) | Mode 、RunId |
PT1M | 是 |
使用情况 | 转换的同步字符数 文档翻译(同步)请求中的字符数。 |
OneDocumentCharactersTranslated |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
槽 | 联机估算器总奖励 联机估算器总奖励。 |
OnlineEstimatorOverallReward |
计数 | 平均值 | Mode 、RunId |
PT1M | 是 |
槽 | 联机估算器槽奖励 按槽列出的联机估算器奖励。 |
OnlineEstimatorSlotReward |
计数 | 平均值 | SlotId 、SlotIndex 、Mode 、RunId |
PT1M | 是 |
估计 | 联机事件计数 联机事件计数的估算值。 |
OnlineEventCount |
计数 | 总计(总和) | Mode 、RunId |
PT1M | 是 |
估计 | 联机奖励 联机奖励的估算值。 |
OnlineReward |
计数 | 总计(总和) | Mode 、RunId |
PT1M | 是 |
使用情况 | 已处理的字符数 沉浸式阅读器处理的字符数。 |
ProcessedCharacters |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | 处理的运行状况文本记录 处理的运行状况文本记录数 |
ProcessedHealthTextRecords |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | 已处理的图像 处理的图像数 |
ProcessedImages |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | 处理的页面 处理的页面数 |
ProcessedPages |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
Azure OpenAI - 用法 | 已处理的提示令牌 OpenAI 模型上处理(输入)的提示令牌数。 适用于 PTU、PTU 托管和即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。 |
ProcessedPromptTokens |
计数 | 总计(总和) | ApiName 、ModelDeploymentName 、FeatureName 、UsageChannel 、Region 、ModelVersion |
PT1M | 是 |
使用情况 | 已处理的文本记录数 文本记录的计数。 |
ProcessedTextRecords |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | QA 文本记录 处理的文本记录数 |
QuestionAnsweringTextRecords |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
ContentSafety - 风险与安全 | 潜在的滥用用户计数 在一段时间内检测到的潜在滥用用户数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName。 |
RAIAbusiveUsersCount |
计数 | 总计(总和) | Region 、ModelDeploymentName |
PT1M | 是 |
ContentSafety - 风险与安全 | 检测到有害卷 一段时间内应用的内容筛选器对 Azure OpenAI API 进行的并检测为有害(块模型和注释模式)的调用数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 TextType。 |
RAIHarmfulRequests |
计数 | 总计(总和) | Region 、ModelDeploymentName 、ModelName 、ModelVersion 、ApiName 、TextType 、Category 、Severity |
PT1M | 是 |
ContentSafety - 风险与安全 | 阻止的卷 在一段时间内对 Azure OpenAI API 进行并被应用的内容筛选器拒绝的调用数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 TextType。 |
RAIRejectedRequests |
计数 | 总计(总和) | Region 、ModelDeploymentName 、ModelName 、ModelVersion 、ApiName 、TextType 、Category |
PT1M | 是 |
ContentSafety - 风险与安全 | 安全系统事件 用于风险与安全监视的系统事件。 可以添加筛选器或按以下维度应用拆分:EventType。 |
RAISystemEvent |
计数 | 平均值 | Region 、EventType |
PT1M | 是 |
ContentSafety - 风险与安全 | 为安全检查发送的总卷 在一段时间内对 Azure OpenAI API 进行并被应用的内容筛选器检测的调用数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName。 |
RAITotalRequests |
计数 | 总计(总和) | Region 、ModelDeploymentName 、ModelName 、ModelVersion 、ApiName |
PT1M | 是 |
认知服务 - HTTP 请求 | Ratelimit ratelimit 键的当前速率限制。 请勿用于 Azure OpenAI 服务。 |
Ratelimit |
计数 | 总计(总和) | Region 、RatelimitKey |
PT1M | 是 |
奖励 | 每个事件的平均奖励 每个事件的平均奖励。 |
Reward |
计数 | 平均值 | BaselineAction 、ChosenActionId 、MatchesBaseline 、NonDefaultReward 、Mode 、RunId |
PT1M | 是 |
认知服务 - HTTP 请求 | 服务器错误数 引发服务内部错误(HTTP 响应代码 5xx)的调用数。 请勿用于 Azure OpenAI 服务。 |
ServerErrors |
计数 | 总计(总和) | ApiName 、OperationName 、Region 、RatelimitKey |
PT1M | 是 |
功能出现次数 | 槽特征出现次数 每个槽特征的出现次数。 |
SlotFeatureIdOccurrences |
计数 | 总计(总和) | FeatureId 、Mode 、RunId |
PT1M | 是 |
每个事件的功能数 | 每个事件的槽特征数 每个事件的平均槽特征数量。 |
SlotFeaturesPerEvent |
计数 | 平均值 | Mode 、RunId |
PT1M | 是 |
槽 | 槽出现次数 每个槽的出现次数。 |
SlotIdOccurrences |
计数 | 总计(总和) | SlotId 、SlotIndex 、Mode 、RunId |
PT1M | 是 |
每个事件的命名空间数 | 每个事件的槽命名空间数 每个事件的平均槽命名空间数量。 |
SlotNamespacesPerEvent |
计数 | 平均值 | Mode 、RunId |
PT1M | 是 |
奖励 | 槽奖励 每个槽的奖励。 |
SlotReward |
计数 | 平均值 | BaselineActionId 、ChosenActionId 、MatchesBaseline 、NonDefaultReward 、SlotId 、SlotIndex 、Mode 、RunId |
PT1M | 是 |
SpeechServices - 用法 | 说话人辨识事务 说话人辨识事务数 |
SpeakerRecognitionTransactions |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
SpeechServices - 用法 | 语音模型托管时间 语音模型托管时间数 |
SpeechModelHostingHours |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | 语音会话持续时间(已弃用) 语音会话的总持续时间(以秒计)。 |
SpeechSessionDuration |
秒 | 总计(总和) | ApiName 、OperationName 、Region |
PT1M | 是 |
认知服务 - HTTP 请求 | 成功调用数 成功调用数。 请勿用于 Azure OpenAI 服务。 |
SuccessfulCalls |
计数 | 总计(总和) | ApiName 、OperationName 、Region 、RatelimitKey |
PT1M | 是 |
认知服务 - SLI | AvailabilityRate 使用以下公式计算可用性百分比:(调用总数 - 服务器错误数)/调用总数。 服务器错误包括任何 >=500 的 HTTP 响应。 请勿用于 Azure OpenAI 服务。 |
SuccessRate |
百分比 | 最小值、最大值、平均值 | ApiName 、OperationName 、Region 、RatelimitKey |
PT1M | 否 |
SpeechServices - 用法 | 合成字符数 字符数。 |
SynthesizedCharacters |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | 转换的文本字符数 传入的文本翻译请求中的字符数。 |
TextCharactersTranslated |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | 转换的文本自定义字符数 传入的自定义文本翻译请求中的字符数。 |
TextCustomCharactersTranslated |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
使用情况 | 训练的文本字符数 使用文本翻译训练的字符数。 |
TextTrainedCharacters |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
Azure OpenAI - 用法 | 已处理的推理令牌 在 OpenAI 模型上处理的推理令牌数量。 计算公式为提示令牌(输入)加上生成的令牌(输出)。 适用于 PTU、PTU 托管和即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。 |
TokenTransaction |
计数 | 总计(总和) | ApiName 、ModelDeploymentName 、FeatureName 、UsageChannel 、Region 、ModelVersion |
PT1M | 是 |
认知服务 - HTTP 请求 | 呼叫总数 调用总数。 请勿用于 Azure OpenAI 服务。 |
TotalCalls |
计数 | 总计(总和) | ApiName 、OperationName 、Region 、RatelimitKey |
PT1M | 是 |
认知服务 - HTTP 请求 | 错误总数 引发错误响应(HTTP 响应代码 4xx 或 5xx)的调用总数。 请勿用于 Azure OpenAI 服务。 |
TotalErrors |
计数 | 总计(总和) | ApiName 、OperationName 、Region 、RatelimitKey |
PT1M | 是 |
使用情况 | Total Events 事件数量。 |
TotalEvents |
计数 | 总计(总和) | Mode 、RunId |
PT1M | 是 |
认知服务 - HTTP 请求 | 令牌调用总数 令牌调用的总数。 |
TotalTokenCalls |
计数 | 总计(总和) | ApiName 、OperationName 、Region |
PT1M | 是 |
使用情况 | 总事务(已弃用) 事务总数。 |
TotalTransactions |
计数 | 总计(总和) | <无> | PT1M | 是 |
估计 | 用户基线事件计数 用户定义的基线事件计数的估算值。 |
UserBaselineEventCount |
计数 | 总计(总和) | Mode 、RunId |
PT1M | 是 |
估计 | 用户基线奖励 用户定义的基线奖励的估算值。 |
UserBaselineReward |
计数 | 总计(总和) | Mode 、RunId |
PT1M | 是 |
SpeechServices - 用法 | 合成视频秒数 合成的秒数 |
VideoSecondsSynthesized |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
SpeechServices - 用法 | 语音模型托管小时数 小时数。 |
VoiceModelHostingHours |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |
SpeechServices - 用法 | 语音模型训练分钟数 分钟数。 |
VoiceModelTrainingMinutes |
计数 | 总计(总和) | ApiName 、FeatureName 、UsageChannel 、Region |
PT1M | 是 |