Azure OpenAI 向量器连接到部署到 Foundry 模型资源中的 Azure OpenAI 的嵌入模型,或Microsoft Foundry 项目在查询时生成嵌入内容。 数据在部署模型的地理位置进行处理。
尽管向量器在查询时使用,但在索引定义中指定它们,并通过矢量配置文件在向量字段上引用它们。 有关详细信息,请参阅 在搜索索引中配置向量器。
在 REST API 中调用 AzureOpenAIVectorizer Azure OpenAI 向量器。 使用最新的稳定版本的 索引 - 创建 (REST API) 或提供该功能的 Azure SDK 包。
注意
此向量器绑定到 Azure OpenAI,按 Azure OpenAI 标准版价格收费。
先决条件
Foundry Models 资源或 Foundry 项目中的 Azure OpenAI。
Azure OpenAI 资源必须具有 自定义子域,例如
https://<resource-name>.openai.azure.com。 可以在 Azure 门户中的 “密钥和终结点 ”页上找到此终结点,并将其用于resourceUri此技能中的属性。Foundry 项目的 父资源 提供对多个终结点(包括
https://<resource-name>.openai.azure.com和https://<resource-name>.services.ai.azure.com)https://<resource-name>.cognitiveservices.azure.com的访问权限。 可以在 Azure 门户中的 “密钥和终结点 ”页上找到这些终结点,并将其中任何终结点用于resourceUri此技能中的属性。
部署到资源或项目的 Azure OpenAI 嵌入模型。 有关支持的模型,请参阅下一部分。
矢量器参数
参数区分大小写。
| 参数名称 | 说明 |
|---|---|
resourceUri |
(必需)模型提供程序的 URI。 支持的域包括:
URL 支持 |
apiKey |
用于访问模型的密钥。 如果你提供密钥,请将 authIdentity 留空。 如果同时设置这两个 apiKey 设置, authIdentity则会 apiKey 在连接上使用。 |
deploymentId |
(必需)已部署的 Azure OpenAI 嵌入模型的 ID。 这是部署模型时指定的部署名称。 |
authIdentity |
搜索服务用于连接的用户托管标识。 可以使用 系统或用户托管标识。 若要使用系统托管标识,请保留并apiKey留authIdentity空。 会自动使用系统托管标识。 托管标识必须具有认知服务 OpenAI 用户权限才能将文本发送到 Azure OpenAI。 |
modelName |
(必需)在指定 deploymentId位置部署的 Azure OpenAI 模型的名称。 支持的值有:
|
支持的矢量查询类型
Azure OpenAI 矢量器仅支持 text 矢量查询。
预期字段维度
使用 Azure OpenAI 矢量器配置的字段的预期字段维度取决于配置的 modelName。
modelName |
最小维度 | 最大维度 |
|---|---|---|
| text-embedding-ada-002 | 1536 | 1536 |
| text-embedding-3-large | 1 | 3072 |
| text-embedding-3-small | 1 | 1536 |
示例定义
"vectorizers": [
{
"name": "my-openai-vectorizer",
"kind": "azureOpenAI",
"azureOpenAIParameters": {
"resourceUri": "https://my-fake-azure-openai-resource.openai.azure.com",
"apiKey": "0000000000000000000000000000000000000",
"deploymentId": "my-ada-002-deployment",
"authIdentity": null,
"modelName": "text-embedding-ada-002",
},
}
]