Compartilhar via

配置扩充缓存

重要

根据补充使用条款,此功能为公共预览版。 预览版 REST API 支持此功能。

本文介绍如何将缓存添加到技能组管道,以便每次都无需完全重新生成即可修改下游扩充步骤。 默认情况下,技能集是无状态的,更改其任何构成部分都要从头到尾地重新运行索引器。 使用 扩充缓存时,索引器会根据技能集或索引器定义更改来确定必须刷新文档树的哪些部分。 保留并重复使用现有的已处理输出(如果可能)。

缓存的内容使用提供的连接字符串放置在 Azure 存储中。 这些对象是在运行索引器时创建的。 应将此容器视为搜索服务管理的内部组件,不得对它进行修改。

  • 名为ms-az-search-indexercache-<alpha-numeric-string>的容器
  • 命名的表 MsAzSearchIndexerCacheIndex<alpha-numeric-string>

先决条件

  • 用于存储缓存扩充的 Azure 存储。 存储帐户必须是常规用途 v2

  • 对于仅 Blob 索引,如果在从数据源中删除 Blob 时需要从缓存和索引中删除已同步的文档,请在索引器中启用删除策略。 如果没有此策略,则不支持从缓存中删除文档。

你应该熟悉如何设置索引器和技能集。 从索引器概述着手,然后继续学习技能集来了解扩充管道。

局限性

注意

如果使用 SharePoint Online 索引器,应避免增量扩充。 在某些情况下,如果选择重新加载索引器,缓存将变为无效,需要 索引器重置和完全重新生成

Permissions

Azure AI 搜索标识需要对 Azure 存储进行写入访问:

  • 存储 blob 数据参与者
  • 存储表数据贡献者

连接字符串语法确定是使用系统分配的还是用户分配的标识。 有关详细信息,请参阅 使用托管标识连接到 Azure 存储

设置缓存属性

对新索引器和现有索引器使用此过程。

在索引器定义中,使用以下命令进行设置 cache

  • (必需) storageConnectionString 设置为 Azure 存储连接字符串。
  • (可选) enableReprocessingtrue 默认情况下)。 将其设置为false以暂时暂停增量扩充,然后稍后切换回true
  1. 在左侧,选择 “索引器”。

  2. 选择 “添加索引器 ”以创建新的索引器,或在 JSON 编辑模式下打开现有索引器。

  3. 启用增量扩充,设置扩充缓存存储帐户,并保存索引器。

    屏幕截图显示了用于扩充缓存的 Azure 门户选项。

  4. 如果索引器已存在,则重置它。

  5. 运行索引器。 此一次性完整重建会初始化缓存。 加载后,增量重用将应用于后续运行。