在 Azure AI 搜索中监视查询请求

Artículo
16/12/2024

本文介绍如何使用内置指标与资源日志来度量查询性能和查询量。它还介绍如何获取应用程序用户输入的查询字符串。

Azure 门户显示有关查询延迟、查询负载 (QPS) 和限制的基本指标。可在 Azure 门户中访问馈送到这些指标的历史数据 30 天。若要延长保留期或者要基于操作数据和查询字符串进行报告，必须添加诊断设置，该设置指定用于保留记录的操作和指标的存储选项。我们建议将“Log Analytics 工作区”作为已记录操作的目标。 Kusto 查询和数据浏览面向 Log Analytics 工作区。

可最大程度地提高数据度量完整性的条件包括：

使用可计费服务（在“基本”或“标准”层创建的服务）。免费服务由多个订阅者共享，当负载变化时，这会造成某种程度的波动。
如果可能，请使用单个副本和分区创建包容性的隔离环境。如果使用多个副本，将会计算多个节点中的查询指标的平均值，这可能会降低结果的精确度。同样，使用多个分区意味着数据将被分割，如果同时正在进行索引编制，则某些分区有可能包含不同的数据。优化查询性能时，单个节点和分区就能提供更稳定的环境用于测试。

Sugerencia

使用附加的客户端代码和 Application Insights，还可以捕获点击率数据，以更深入地了解哪些内容引起了应用程序用户的兴趣。有关详细信息，请参阅搜索流量分析。

查询量 (QPS)

查询量以每秒搜索查询数 (QPS) 度量。QPS 是一个内置指标，可按一分钟时间范围内执行的查询数的平均、计数、最小或最大值来报告。指标的一分钟间隔 (TimeGrain = "PT1M") 在系统中是固定的。

要详细了解 SearchQueriesPerSecond 指标，请参阅每秒搜索查询数。

查询性能

服务范围内的查询性能按搜索延迟和受限查询进行测量。

搜索延迟

搜索延迟表示完成查询需要使用的时长。要了解有关 SearchLatency 指标的详细信息，请参阅搜索延迟。

考虑以下“搜索延迟”指标示例：已采样 86 个查询，平均持续时间为 23.26 毫秒。最小值 0 表示丢弃了某些查询。运行时间最长的查询花费了 1000 毫秒才完成。总执行时间为 2 秒。

受限制的查询

受限制的查询是指已丢弃而未处理的查询。在大多数情况下，限制是运行服务的正常组成部分。发生限制并不一定表示出现了问题。要了解有关 ThrottledSearchQueriesPercentage 指标的详细信息，请参阅受限搜索查询百分比。

在以下屏幕截图中，第一个数字是计数（或发送到日志的指标数）。显示在顶部或者将鼠标悬停在指标上显示的其他聚合包括平均值、最大值和总计。在此示例中，未丢弃任何请求。

在 Azure 门户中浏览指标

为了让用户快速查看当前数字，服务“概述”页上的“监视”选项卡会显示三个按固定间隔以小时、天和周度量的指标（“搜索延迟”、“每秒搜索查询数(每搜索单位)”和“受限制的搜索查询百分比”），并提供用于更改聚合类型的选项。

若要进行更深入的浏览，请从“监视”菜单中打开指标资源管理器，以便可以分层、放大和可视化数据，从而浏览趋势或异常情况。在这篇有关创建指标图表的教程中详细了解指标资源管理器。

在“监视”部分下，选择“指标”打开指标资源管理器，其中的数据范围是根据搜索服务设置的。
在“指标”下，从下拉列表中选择一个指标，并查看偏好类型的可用聚合列表。聚合定义在每个时间间隔如何对收集的值采样。
在右上角设置时间间隔。
选择可视化效果。默认设置为折线图。
选择“添加指标”并选择不同的聚合来叠加更多聚合。
在折线图上放大感兴趣的区域。将鼠标指针放在区域的开头位置，选中并按住鼠标左键，拖动到区域的另一侧，然后松开按钮。图表会在该时间范围内放大。

返回用户输入的查询字符串

启用资源日志记录时，系统将捕获“AzureDiagnostics”表中的查询请求。你必须已指定已记录操作的目标（即 Log Analytics 工作区或其他存储选项），这是先决条件。

在“监视”部分下，选择“日志”在 Log Analytics 中打开一个空查询窗口。
运行以下表达式来搜索 Query.Search 操作，这会返回表格格式的结果集，其中包含操作名称、查询字符串、查询的索引以及找到的文档数。最后两条语句排除针对样本索引运行的、包含空的或未指定的搜索的查询字符串，这可以减少结果中的干扰信息。
```
   AzureDiagnostics
| project OperationName, Query_s, IndexName_s, Documents_d
| where OperationName == "Query.Search"
| where Query_s != "?api-version=2024-07-01&search=*"
| where IndexName_s != "realestate-us-sample-index"
```
（可选）在 Query_s 中设置列筛选器，以基于特定的语法或字符串进行搜索。例如，可以基于“等于 ?api-version=2024-07-01&search=*&%24filter=HotelName”进行筛选。

尽管此方法适用于临时调查，但生成报告可以在更有利于分析的布局中合并和呈现查询字符串。

识别长时间运行的查询

添加持续时间列以获取所有查询的数量，而不仅仅是作为指标选取的查询的数量。将此数据排序可以显示完成哪些查询所花费的时间最长。

在“监视”部分下，选择“日志”以查询日志信息。

运行以下基本查询以返回按持续时间（以毫秒为单位）排序的查询。运行时间最长的查询列在最前面。

AzureDiagnostics
| project OperationName, resultSignature_d, DurationMs, Query_s, Documents_d, IndexName_s
| where OperationName == "Query.Search"
| sort by DurationMs

创建指标警报

指标警报会确定一个阈值，用于发送通知或触发提前定义的纠正操作。你可以创建与查询执行相关的警报，但也可以针对资源健康状况、搜索服务配置更改、技能执行和文档处理（索引）创建警报。

所有阈值都是用户定义的，因此你应该了解什么活动级别应该触发警报。

对于查询监视，通常会针对搜索延迟和受限制的查询创建指标警报。如果你知道何时丢弃了查询，可以查看降低负载或增加容量的补救措施。例如，如果受限制的查询在索引编制期间增加，可将其推迟到查询活动减少时。

如果推送特定副本分区配置的限制，则针对查询量阈值 (QPS) 设置警报也很有帮助。

在“监视”下，选择“警报”，然后选择“创建预警规则”。
在“条件”下，选择“添加”。
配置信号逻辑。对于信号类型，请选择“指标”，然后选择信号。
选择信号后，可以使用图表来可视化历史数据，以便在如何继续设置条件方面做出明智的决策。
接下来，向下滚动到“警报逻辑”。对于概念证明，可以人为地指定一个较小值进行测试。
接下来，指定或创建操作组。这是在达到阈值时要调用的响应措施。该措施可以是推送通知或自动响应。
最后，指定警报详细信息。命名并描述警报，分配严重性值，并指定是要以启用还是禁用状态创建规则。

如果指定了电子邮件通知，将收到来自“Azure”的主题行为“Azure：已激活的严重性：3 <your rule name>”的电子邮件。

后续步骤

如果尚未这样做，请查看搜索服务监视基础知识，以全方面地了解监督功能。

监视 Azure AI 搜索中的操作和活动

El futuro es suyo

Compartir a través de

查询量 (QPS)

查询性能

搜索延迟

受限制的查询

在 Azure 门户中浏览指标

返回用户输入的查询字符串

识别长时间运行的查询

创建指标警报

后续步骤

Compartir a través de

在 Azure AI 搜索中监视查询请求

查询量 (QPS)

查询性能

搜索延迟

受限制的查询

在 Azure 门户中浏览指标

返回用户输入的查询字符串

识别长时间运行的查询

创建指标警报

后续步骤

Recursos adicionales