Azure AI Search是企业的信息检索平台。 它支持传统搜索和对话式 AI 驱动的搜索,为专有内容提供“与数据聊天”体验。
创建搜索服务的最简单方法是通过本文介绍的 Azure 门户。
也可以使用以下方式:
开始之前
某些属性在搜索服务生存期内是固定的。 在创建服务之前,请确定以下属性:
| 资产 | DESCRIPTION |
|---|---|
| 名称 | 成为 URL 终结点的一部分。 该名称必须是唯一的,并遵循命名规则。 |
| 区域 | 确定数据驻存和特定功能的可用性。 例如,语义排名器和Azure AI 集成具有区域要求。 选择支持所需功能的区域。 |
| 级 | 确定基础结构、服务限制和计费。 某些功能在较低层或专用层上不可用。 创建服务后,可以在 基本层和标准层(S1、S2 和 S3)之间切换。 |
| 计算类型 | 确定虚拟化和安全模型。 可以在标准 VM(推荐)和机密 VM 之间进行选择,机密 VM 专为需要使用中数据隐私和隔离的特定工作负载设计。 |
订阅Azure
Azure AI Search需要免费订阅或标准Azure订阅。
若要免费试用Azure AI Search,启动试用订阅,然后在免费层上创建搜索服务。 每个Azure订阅都可以有一个免费的搜索服务,该服务旨在对产品进行短期的非生产评估。 可以在免费层上完成所有快速入门和大部分教程。
重要
若要为其他服务腾出空间,Microsoft可能会删除长时间处于非活动状态的免费服务。
查找 Azure AI Search 方案
登录到 Azure 门户。
在仪表板的左上角,选择“创建资源”。
在 Azure 门户中“创建资源”按钮的屏幕截图。
使用搜索框查找 Azure AI Search。
选择订阅
如果有多个Azure订阅,请为搜索服务选择一个订阅。
如果您正在实施 客户管理的加密或使用依赖于托管服务标识的其他功能进行外部数据访问,请选择您用于 Azure Key Vault 或其他使用托管标识的服务的相同订阅。
设置资源组
资源组是一个容器,用于保存Azure解决方案的相关资源。 使用它来合并同一解决方案资源,监视成本,并检查搜索服务的创建日期。
随着时间的推移,可以跟踪单个资源和整个资源组的当前和预计成本。 以下屏幕截图显示了将多个资源合并到一个组中时可用的成本信息:
为服务命名
输入搜索服务的名称。 该名称是 API 调用所针对的终结点的一部分:https://your-service-name.search.azure.cn。 例如,如果输入 myservice,终结点将变为 https://myservice.search.azure.cn。
命名服务时,请遵循以下规则:
- 使用
search.azure.cn命名空间中唯一的名称。 - 使用 2 到 60 个字符。
- 仅使用小写字母、数字和短划线(-)。
- 请勿使用短划线作为前两个字符或最后一个字符。
- 不要使用连续短划线。
提示
如果你有多个搜索服务,则最好将区域包含在服务名称中。 例如,在决定如何合并或附加资源时,名称 myservice-chinanorth 可能会帮你省去访问“属性”页的麻烦。
选择区域
重要
由于需求量大,Azure AI Search当前在某些区域中新的实例不可用。
如果使用多个Azure服务,请将所有服务置于同一区域,从而最大程度地减少或降低带宽费用。 同区域服务之间的数据流出不收取任何费用。
在大多数情况下,请选择附近的区域,除非适用以下任一情况:
最近区域已达到容量上限,这一点可通过各表格的脚注加以确认。 Azure门户在设置资源时,有隐藏不可用区域和层的优势。
你希望使用集成式数据分块和矢量化或内置技能进行 AI 扩充。 集成操作具有区域要求。
你想要将Azure Storage用于基于索引器的索引编制,或者想要存储不在索引中的应用程序数据。 调试会话状态、扩充缓存和知识存储是依赖于Azure Storage的Azure AI Search功能。 为Azure Storage选择的区域对网络安全有影响。 如果要设置防火墙,则应将资源放置在单独的区域中。 有关详细信息,请参阅从 Azure AI Search 到 Azure Storage 的出站连接。
用于选择区域的清单
附近区域是否Azure AI Search可用? 请查看支持的区域列表。
你有考虑特定的层级吗? 检查每个层级的区域可用性。
你是否具有业务连续性和灾难恢复 (BCDR) 要求? 在不同的Azure区域中创建两个或更多个搜索服务,每个服务具有两个或更多个副本,以便它们可以分散到多个 可用性区域。 例如,如果你在北美运营,则可以为每个搜索服务选择“中国东部”和“中国北部”,或者选择“中国北部”和“中国东部”。 有关详细信息,请参阅 Azure AI Search 中的 Multi-region 部署。
是否需要AI 增强、集成的数据分块和向量化或由 Azure AI 服务提供支持的多模态搜索? 出于计费目的,必须通过无密钥连接 (preview) 或基于密钥连接将 Azure AI 服务资源 附加到搜索服务。 基于密钥的连接要求这两个服务位于同一区域。
检查Azure AI Search 区域。 如果您使用由 Azure AI 支持的 OCR、实体识别或其他技能,AI 扩充列将指示 Azure AI Search 和 Azure AI 服务是否位于同一区域。
检查适用于 Azure AI 服务区域的 Azure Vision,以获取支持文本和图像矢量化的多模态接口。 这些 API 由 Azure Vision 提供支持,并通过Azure AI services资源进行访问。 但是,它们通常在比Azure AI服务资源本身更少的地区可用。
选择等级
Azure AI Search 提供多个 价格层:
- 免费
- 基本
- 标准
- 存储优化
每个层都有自己的容量和限制,某些功能依赖于层。 有关计算特征、功能可用性和区域可用性的信息,请参阅 为 Azure AI Search 选择服务层级。
“基本”和“标准”层是生产工作负载的最常用选项,但很多客户会从“免费”层入手。 可计费层主要在分区大小、分区速度和可创建对象数的限制上有所不同。
注意
在 2024 年 4 月 3 日之后创建的服务在每个计费层都有更大的分区和更高的矢量配额。
选择计算类型
计算类型确定用于部署搜索服务的虚拟化和安全模型。 有两种计算类型:
Default(基本成本)在标准Azure基础结构上部署搜索服务,对静态数据和传输中的数据进行加密,但未使用。 建议用于大多数搜索任务。
Confidential(10% 附加费)使用Azure机密计算隔离基于硬件的受信任执行环境中的处理,从而防止使用未加密的数据免受未经授权的访问。 仅当具有高级隐私、合规性或法规要求时,才建议这样做。
机密计算具有有限的区域可用性、禁用或限制某些功能,并增加了运行搜索服务的成本。 有关这两种计算类型的详细比较,请参阅 (可选)启用机密计算。
创建您的服务
提供必要的输入后,创建搜索服务。
服务在几分钟内部署,可以使用Azure通知来监视其进度。 考虑将该服务固定到仪表板,以方便将来访问。
配置身份验证
创建搜索服务时,基于密钥的身份验证是默认设置,但它不是最安全的选项。 建议将其替换为基于角色的访问。
若要为服务启用基于角色的访问:
在 Azure 门户中,转到你的搜索服务。
在左窗格中,选择“设置”“密钥”。> 可以使用API 密钥、Azure 角色或两者连接到服务。 选择“两者”,直到分配角色,之后可以选择“基于角色的访问控制”。
扩展服务
部署搜索服务后,可以对其进行缩放以满足需求。 Azure AI Search提供两个缩放维度:replicas 和 partitions。 副本允许服务处理更高的搜索查询负载,而分区允许服务存储和搜索更多文档。
缩放仅适用于付费层级。 在免费层上,无法缩放服务或配置副本和分区。
重要
你的服务必须具有两个用于只读 SLA 的副本和三个用于读/写 SLA 的副本。
添加资源将增加每月帐单。 使用定价计算器了解计费影响。 可以根据负载调整资源,例如增加用于初始索引的资源,并在以后减少资源进行增量索引。
若要扩展服务:
在 Azure 门户中,转到你的搜索服务。
在左窗格中,选择“设置”>“缩放”。
使用滑块添加副本和分区。
何时添加第二个服务
大多数客户在某个足以满足预期负载的级别上使用单个搜索服务。 一个服务可以在你所选的层的最大限制内托管多个索引,每个索引彼此隔离。 在Azure AI Search中,只能将请求定向到一个索引,从而减少从同一服务中的其他索引检索数据的可能性。
但是,对于以下操作要求,可能需要第二个服务:
- 区域故障。 在发生完全区域中断的可能性不大的情况下,Azure AI Search不提供即时故障转移。 你必须实施自己的多区域解决方案和故障转移方法。 有关详细信息,请参阅 Azure AI Search 中的 Multi-region 部署。
- 需要两个或多个服务的多租户体系结构。
- 需要在每个地理位置中提供服务,以最大程度地减小延迟的全球部署的应用程序。
注意
在Azure AI Search中,无法分隔索引和查询操作,因此不要为单独的工作负荷创建多个服务。 索引始终在其创建的服务上进行查询,无法将索引复制到其他服务。
无需为实现高可用性添加第二个服务。 可以在同一服务中使用两个或多个副本实现查询的高可用性。 由于副本按顺序更新,因此在推出服务更新时,至少有一个副本可正常运行。有关运行时间的详细信息,请参阅服务级别协议。
后续步骤
部署搜索服务后,请继续在 Azure 门户中创建第一个索引:
希望优化并节省云支出?