为 Azure AI 服务启用诊断日志记录

本指南逐步说明如何为 Azure AI 服务启用诊断日志记录。 这些日志提供频繁生成的有关资源操作的丰富数据用于识别问题和调试。 在继续之前,你必须拥有至少订阅了一个 Azure AI 服务(例如语音服务)的 Azure 帐户。

先决条件

若要启用诊断日志记录,需要指定某个位置用于存储日志数据。 本教程使用 Azure 存储和 Log Analytics。

  • Azure 存储 - 保留策略审核、静态分析或备份的诊断日志。 只要配置设置的用户同时拥有两个订阅的相应 Azure RBAC 访问权限,存储帐户就不必位于发出日志的资源所在的订阅中。
  • Log Analytics - 灵活的日志搜索和分析工具,可用于分析 Azure 资源生成的原始日志。

注意

启用诊断日志收集

首先,让我们使用 Azure 门户启用诊断日志记录。

注意

若要使用 PowerShell 或 Azure CLI 启用此功能,请参考从 Azure 资源收集和使用日志数据中提供的说明。

  1. 导航到 Azure 门户。 然后找到并选择某个 Azure AI 服务资源。 例如,语音服务订阅。
  2. 接下来,在左侧导航菜单中找到“监视”,然后选择“诊断设置”。 此屏幕包含以前为此资源创建的所有诊断设置。
  3. 如果你想要使用以前创建的某个资源,现在可以选择它。 否则,请选择“+ 添加诊断设置”。
  4. 输入设置名称。 依次选择“存档到存储帐户”、“发送到 Log Analytics”。
  5. 出现配置提示时,请选择你要用来存储诊断日志的存储帐户和 OMS 工作区。 注意:如果你没有存储帐户或 OMS 工作区,请按提示创建一个。
  6. 依次选择“审核” 、RequestResponseAllMetrics。 然后设置诊断日志数据的保留期。 如果将保留策略设置为零,则会无限期存储该日志类别的事件。
  7. 选择“保存” 。

最长可能需要在两个小时之后,日志数据才可供查询和分析。 因此,如果当前未显示任何内容,请不要担心。

从 Azure 存储查看和导出诊断数据

Azure 存储是一个可靠的对象存储解决方案,它已经过优化,适合存储大量的非结构化数据。 本部分介绍如何在存储帐户中查询 30 天时间范围内的事务总数,并将数据导出到 Excel。

  1. 在 Azure 门户中,找到在上一部分创建的 Azure 存储资源。
  2. 在左侧导航菜单中找到“监视”,然后选择“指标”。
  3. 使用提供的下拉列表配置查询。 对于本示例,我们将时间范围设置为“过去 30 天”,并将指标设置为“事务”。
  4. 查询完成后,你将看到过去 30 天的事务的可视化效果。 若要导出此数据,请使用页面顶部的“导出到 Excel”按钮。

详细了解可对 Azure 存储中的诊断数据执行哪些操作。

在 Log Analytics 中查看日志

请遵照以下说明浏览资源的 Log Analytics 数据。

  1. 在 Azure 门户上的左侧导航菜单中,找到并选择“Log Analytics”。
  2. 找到并选择启用诊断时创建的资源。
  3. 在“常规”下,找到并选择“日志”。 在此页中,可以针对日志运行查询。

示例查询

下面是可用于浏览日志数据的几个基本 Kusto 查询。

针对指定时间段内来自 Azure AI 服务的所有诊断日志运行此查询:

AzureDiagnostics
| where ResourceProvider == "MICROSOFT.COGNITIVESERVICES"

运行此查询可查看最近的 10 条日志:

AzureDiagnostics
| where ResourceProvider == "MICROSOFT.COGNITIVESERVICES"
| take 10

运行此查询可按资源将操作分组:

AzureDiagnostics
| where ResourceProvider == "MICROSOFT.COGNITIVESERVICES" |
summarize count() by Resource

运行此查询可以确定执行某个操作平均花费的时间:

AzureDiagnostics
| where ResourceProvider == "MICROSOFT.COGNITIVESERVICES"
| summarize avg(DurationMs)
by OperationName

运行此查询可以查看不同时间按 OperationName 划分的操作量,以及每隔 10 秒装箱的操作计数。

AzureDiagnostics
| where ResourceProvider == "MICROSOFT.COGNITIVESERVICES"
| summarize count()
by bin(TimeGenerated, 10s), OperationName
| render areachart kind=unstacked

后续步骤