在 Azure AI 搜索中创建全文查询

如果要为全文搜索生成查询，本文提供了设置请求的步骤。本文还介绍了查询结构，并说明了字段属性和语言分析器如何影响查询结果。

先决条件

Azure AI 搜索服务（任何层）。创建服务或查找现有服务。
搜索索引，字符串字段属性为“可搜索”。还可以使用索引别名作为查询请求的终结点。
查询索引的权限：
- 基于密钥的身份验证：搜索服务的查询 API 密钥。
- 基于角色的身份验证：搜索索引数据读取者角色。
对于 SDK 开发，请安装 Azure 搜索客户端库：
- Python： azure-search-documents
- .NET： Azure.Search.Documents
- JavaScript： @azure/search-documents
- Java： azure-search-documents

小窍门

对于快速代码示例，请跳到全文查询请求的示例。

全文查询请求的示例

在 Azure AI 搜索中，查询是针对单个搜索索引的文档集合发出的只读请求，其参数既用于通知查询执行又用于形成返回的响应。

全文查询在 search 参数中指定，由字词、带引号的短语和运算符组成。其他参数将更多定义添加到请求。

以下搜索 POST REST API 调用演示了使用 search 和其他参数的查询请求。

POST https://[service name].search.azure.cn/indexes/hotels-sample/docs/search?api-version=2026-04-01
{
    "search": "NY +view",
    "queryType": "simple",
    "searchMode": "all",
    "searchFields": "HotelName, Description, Address/City, Address/StateProvince, Tags",
    "select": "HotelName, Description, Address/City, Address/StateProvince, Tags",
    "top": 10,
    "count": true
}

Reference：Search POST

要点

search 提供匹配条件（通常是整个搜索词或短语，带或不带运算符）。在索引架构中作为 可搜索 属性的任何字段都位于搜索作的范围内。
queryType 设置分析程序：简单、完整。默认的简单查询分析程序最适合全文搜索。完整的 Lucene 查询分析程序适用于高级查询构造，如正则表达式、邻近搜索、模糊和通配符搜索。对于语义排名，还可以将此参数设置为“语义”，以针对查询响应进行高级语义建模。
searchMode 指定是根据表达式中的“所有”条件（精准率优先）还是“任一”条件（召回率优先）进行匹配。默认为任意。如果你预计会大量使用布尔运算符（在包含大文本块（内容字段或长描述）的索引中较可能发生这种情况），请确保使用 searchMode=Any|All 参数测试查询，以评估该设置对布尔搜索的影响。
searchFields 将查询执行约束为特定的可搜索字段。在开发过程中，为选择和搜索使用同一字段列表会很有帮助。否则，匹配可能是基于你无法在结果中看到的字段值，从而导致不确定返回文档的原因。

用于形成响应的参数：

select 指定要在响应中返回哪些字段。仅可在 select 语句中使用索引内标记为“可检索”的字段。
top 返回指定数量的最佳匹配文档。在本例中，仅返回 10 个命中项。你可以使用 top 和 skip（未展示）来分页显示结果。
count 指出整体上整个索引中多少文档匹配，该数目可能比返回的数目多。有效值为“true”或“false”。默认值为“false”。在索引稳定的情况下，计数是准确的，但对于正在主动添加、更新或删除的任何文档，可能会出现低报或过报。如果只想获取不包含任何文档的计数，可以使用 $top=0。
如果你想要按值（例如排名或位置）对结果分类，则使用 orderby。否则，默认使用相关性分数对结果进行排名。字段的属性必须设置为“可排序”才能成为此参数的可能值。

选择客户端

对于早期开发和概念证明测试，请从 Azure 门户或 REST 客户端或 Jupyter 笔记本开始。这些方法是交互式的，可用于有针对性的测试，有助于评估不同属性的影响，而无需编写任何代码。

若要从应用内调用搜索，请在适用于 .NET、Java、JavaScript 和 Python 的 Azure SDK 中使用 Azure.Document.Search 客户端库。

在 Azure 门户中打开索引时，可以使用搜索资源管理器以及并排选项卡中的索引 JSON 定义来轻松访问字段属性。检查“字段”表，以查看哪些字段在查询测试时是可搜索、可排序、可筛选和可分面的。

登录到 Azure 门户并查找你的搜索服务。
在您的服务中，选择索引并选定一个索引。
索引将打开“搜索资源管理器”选项卡，以便你可以立即查询。切换到 JSON 视图以指定查询语法。

下面是适用于 hotels-sample 索引的全文搜索查询表达式：
```
   {
       "search": "pool spa +airport",
       "queryType": "simple",
       "searchMode": "any",
       "searchFields": "Description, Tags",
       "select": "HotelName, Description, Tags",
       "top": 10,
       "count": true
   }
```
Reference：Search POST

以下屏幕截图演示了查询和响应：

使用 GET 调用时，请求 URL 的长度不能超过 8 KB。此长度足以满足大多数应用程序的需求。但是，某些应用程序生成大型查询，尤其是在使用 OData 筛选器表达式时。对于这些应用程序，HTTP POST 是一个更好的选择，因为它允许比 GET 更大的筛选器。

使用 POST 时，筛选器中的子句数是限制因子，而不是原始筛选器字符串的大小，因为 POST 的请求大小限制约为 16 MB。即使 POST 请求大小限制很大，筛选器表达式也不能任意复杂。有关筛选器复杂性限制的详细信息，请参阅 OData 表达式语法。

使用 REST 客户端设置请求。如需有关入门的帮助，请参阅快速入门：使用 REST 进行全文搜索。

以下示例调用 REST API 进行全文搜索：

POST https://[service name].search.azure.cn/indexes/hotels-sample/docs/search?api-version=2026-04-01
{
    "search": "NY +view",
    "queryType": "simple",
    "searchMode": "all",
    "searchFields": "HotelName, Description, Address/City, Address/StateProvince, Tags",
    "select": "HotelName, Description, Address/City, Address/StateProvince, Tags",
    "count": true
}

Reference：Search POST

部分搜索响应的延续

有时，Azure AI 搜索无法在单个搜索响应中返回所有请求的结果。由于不同原因，部分响应可能会发生，例如当查询返回的文档过多而未指定$top，或者指定了过大的$top值。在这种情况下，Azure AI 搜索在响应正文中包含 @odata.nextLink 批注，如果是 POST 请求，还将包括 @search.nextPageParameters。可以使用这些批注的值来构建另一个搜索请求，以获取搜索响应的下一部分。此行为称为原始搜索请求的延续，注释称为 继续标记。请参阅“响应”部分中的示例，详细了解这些批注的语法及其在响应正文中的显示位置。

Azure AI 搜索可能返回续用令牌的原因具体取决于实施细节，并且可能随时更改。可靠客户端应始终准备好处理返回的文档少于预期且包含继续标记以继续检索文档的情况。另请注意，必须使用与原始请求相同的 HTTP 方法才能继续。例如，如果发送了 GET 请求，则发送的任何延续请求也必须使用 GET（同样适用于 POST）。

注释

@odata.nextLink 和 @search.nextPageParameters 的目的是保护服务免受查询请求过多结果的影响，而不是提供分页的一般机制。如果您希望分页查看结果，请同时使用$top和$skip。例如，如果需要大小为 10 的页面，则第一个请求应具有 $top=10 和 $skip=0，第二个请求应具有 $top=10 和 $skip=10，第三个请求应具有 $top=10 和 $skip=20 等。

以下示例演示如何使用 Azure SDK 运行全文查询。

Python

from azure.core.credentials import AzureKeyCredential
from azure.search.documents import SearchClient

# Set up the client
service_name = "<your-search-service-name>"
index_name = "hotels-sample"
api_key = "<your-query-api-key>"

endpoint = f"https://{service_name}.search.azure.cn"
credential = AzureKeyCredential(api_key)
client = SearchClient(endpoint=endpoint, index_name=index_name, credential=credential)

# Run a full-text search query
results = client.search(
    search_text="NY +view",
    search_mode="all",
    search_fields=["HotelName", "Description", "Address/City", "Tags"],
    select=["HotelName", "Description", "Address/City", "Tags"],
    top=10,
    include_total_count=True
)

print(f"Total documents matching query: {results.get_count()}")
for result in results:
    print(f"Hotel: {result['HotelName']}")

Reference：SearchClient， search

C#

using Azure;
using Azure.Search.Documents;
using Azure.Search.Documents.Models;

// Set up the client
string serviceName = "<your-search-service-name>";
string indexName = "hotels-sample";
string apiKey = "<your-query-api-key>";

Uri endpoint = new Uri($"https://{serviceName}.search.azure.cn");
AzureKeyCredential credential = new AzureKeyCredential(apiKey);
SearchClient searchClient = new SearchClient(endpoint, indexName, credential);

// Run a full-text search query
SearchOptions options = new SearchOptions
{
    SearchMode = SearchMode.All,
    IncludeTotalCount = true,
    Size = 10
};
options.SearchFields.Add("HotelName");
options.SearchFields.Add("Description");
options.Select.Add("HotelName");
options.Select.Add("Description");

SearchResults<SearchDocument> response = await searchClient.SearchAsync<SearchDocument>("NY +view", options);

Console.WriteLine($"Total documents matching query: {response.TotalCount}");
await foreach (SearchResult<SearchDocument> result in response.GetResultsAsync())
{
    Console.WriteLine($"Hotel: {result.Document["HotelName"]}");
}

Reference：SearchClient、 SearchAsync、 SearchOptions

其他 SDK 资源

Azure SDK	客户	示例
.NET	SearchClient	DotNetHowTo
Java	SearchClient	SearchForDynamicDocumentsExample.java
JavaScript	SearchClient	SDK 示例
Python	SearchClient	sample_simple_query.py

选择查询类型：简单 | 完整

如果查询是全文搜索，查询分析器将用于处理作为搜索词和短语传递的任何文本。 Azure AI 搜索提供了两个查询分析器。

简单分析程序理解简单查询语法。选择此解析器作为默认选项是因为它在自由格式文本查询中的速度和效率。该语法支持将常见搜索运算符（AND、OR、NOT）用于术语和短语搜索，以及前缀 (*) 搜索（例如，使用 sea* 搜索 Seattle 和 Seaside）。一般建议首先尝试使用简单版分析程序，如果应用程序需要更强大的查询，则可以改用完整版分析程序。
当您向请求中添加时，将激活完整的 queryType=full，该语法基于 Apache Lucene 解析器。

虽然完整语法和简单语法存在重叠，都支持相同的前缀和布尔运算，但完整语法提供了更多的运算符。在完整语法中，布尔表达式有了更多运算符，高级查询（如模糊搜索、通配符搜索、邻近搜索和正则表达式）也有了更多运算符。

选择查询方法

搜索本质上是一个用户驱动的活动，该活动从搜索框或页面上的单击事件中收集术语或短语。下表总结了收集用户输入的机制以及预期的搜索体验。

输入	体验
搜索方法	用户在搜索框中键入术语或短语（不一定带运算符），然后选择“搜索”发送请求。搜索可与筛选器一起用于同一请求，但不能与自动完成或建议一起使用。
“自动完成”方法	用户键入几个字符，然后在键入每个新字符后启动查询。响应是索引中的完整字符串。如果提供的字符串有效，则用户选择“搜索”将该查询发送到服务。
“建议”方法	与自动完成一样，用户键入几个字符并生成增量查询。响应是匹配文档的下拉列表，通常由几个唯一或描述性字段表示。如果任何一个选择有效，用户选择其中一个，就会返回匹配的文档。
多面导航	页面显示可单击的导航链接或导航痕迹，缩小了搜索范围。分面导航结构是基于初始查询动态组合的。例如，`search=*` 可用于填充由每个可能的类别组成的分面导航树。分面导航结构是从查询响应创建的，但它也是表示下一个查询的机制。在 REST API 引用中，`facets` 作为“搜索文档”操作的查询参数记录，但是它可以在没有 `search` 参数的情况下使用。
筛选器方法	筛选器与分面一起使用，以缩小结果范围。你还可以在页面后面实现一个筛选器，例如用特定于语言的字段初始化页面。在 REST API 引用中，`$filter` 作为“搜索文档”操作的查询参数记录，但是它可以在没有 `search` 参数的情况下使用。

字段属性对查询的影响

如果你熟悉查询类型和组合，可能还记得查询请求上的参数取决于字段在索引中的属性。例如，查询和搜索结果中只能使用标记为“可搜索”和“可检索”的字段。在请求中设置 search、filter 和 orderby 参数时，应检查属性以避免意外结果。

在 hotels-sample 索引的以下屏幕截图中，只有最后两个字段 LastRenovationDate 和 Rating 是 可排序的，这是使用在 "$orderby" only 子句中的要求。

有关字段属性定义，请参阅创建索引 (REST API)。

标记对查询的影响

在索引过程中，搜索引擎对字符串使用文本分析器，以最大程度地提高在查询时找到匹配项的可能性。至少，字符串是小写的，但根据分析器的不同，也可能会进行词形还原和停用词删除。较大的字符串或复合词通常由空格、连字符或短划线分隔，并作为单独的标记编制索引。

要点是，你认为索引包含的内容和索引实际包含的内容可能会有所不同。如果查询没有返回预期的结果，则可以通过分析文本 (REST API) 检查分析器创建的标记。有关词汇切分及其对查询的影响的详细信息，请参阅具有特殊字符的部分术语搜索和模式。

排查查询问题

下表列出了常见的查询问题以及如何解决这些问题。

問题	原因	决议
空结果	没有与查询词匹配的文档。	验证字段是否在架构中标记为可搜索。使用 “分析文本 API ”检查令牌化。
意外结果	查询匹配了非预期的字段。	用于 `searchFields` 限制搜索的字段。
结果过多	查询过于广泛。	添加筛选器，使用`searchMode=all`，或用`+`运算符添加所需的术语。
结果未按预期排名	相关性评分与预期不匹配。	请考虑评分配置文件或语义排名。
缺少部分匹配项	分析器标记方式与预期不同。	通过分析文本 API 使用通配符（`*`）后缀或检查分析器行为。
筛选器不起作用	字段未标记为可筛选。	更新索引架构以在字段上设置 `filterable: true` 。

现在你已经更好地了解了查询请求的工作原理，可以尝试以下快速入门以获得实际操作经验。

Last updated on 2026-05-25