重要
根据补充使用条款,此向量器以公共预览版提供。 若要使用此功能,建议使用最新预览版的索引 - 创建或更新(REST API)。
Azure AI Foundry 模型目录矢量器连接到通过 Azure AI Foundry 模型目录部署到 Azure 机器学习终结点的嵌入模型。 数据在部署模型的地理位置进行处理。
矢量器参数
参数区分大小写。 所使用的参数取决于 模型提供程序所需的身份验证(如果有)。
| 参数名称 | 说明 |
|---|---|
uri |
( 密钥身份验证必需)来自 Foundry 模型目录的无服务器部署的目标 URI 或 AML 联机终结点的评分 URI。 仅允许 HTTPS URI 方案。 |
key |
( 密钥身份验证必需)模型提供程序的 API 密钥。 |
resourceId |
( 令牌身份验证必需)模型提供程序的 Azure 资源管理器资源 ID。 对于 AML 联机终结点,请使用 subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name} 格式。 |
region |
(令牌 身份验证可选)在其中部署模型提供程序的区域。 如果区域与搜索服务的区域不同,则为必需。 |
timeout |
(可选)发出 API 调用的 HTTP 客户端的超时。 必须将其格式化为 XSD“dayTimeDuration”值(ISO 8601 持续时间值的受限子集)。 例如,PT60S 表示 60 秒。 如果未设置,选择的是默认值 30 秒。 超时可以设置为最大 230 秒和最小 1 秒。 |
要使用的身份验证参数
Azure Foundry 模型目录向量器提供两种身份验证选项:
基于密钥的身份验证。 提供静态密钥以对来自向量器的评分请求进行身份验证。
uri设置此连接的和key参数。基于令牌的身份验证。 基于 Foundry 中心的项目或 AML 联机终结点是使用基于令牌的身份验证部署的。 Azure AI 搜索服务必须在模型提供程序上具有 托管标识 和角色分配。 然后,vectorizer 使用搜索服务标识对模型提供程序进行身份验证,无需静态密钥。 搜索服务标识必须具有 “所有者 ”或 “参与者 ”角色。
resourceId设置参数,如果搜索服务位于与模型提供程序不同的区域,请设置region参数。
支持的矢量查询类型
Azure Foundry 模型目录向量器支持哪些向量查询类型取决于 modelName 配置的查询类型。
| 嵌入模型 | 支持 text 查询 |
支持 imageUrl 查询 |
支持 imageBinary 查询 |
|---|---|---|---|
| Cohere-embed-v3-english | X | X | |
| Cohere-embed-v3-多语言 | X | X | |
| Cohere-embed-v4 | X | X |
预期字段维度
使用 Azure Foundry 模型目录向量器配置的矢量字段的预期字段维度取决于 modelName 配置的字段维度。
modelName |
预期维度 |
|---|---|
| Cohere-embed-v3-english | 1024 |
| Cohere-embed-v3-多语言 | 1024 |
| Cohere-embed-v4 | 256-1536 |
示例定义
Azure AI Foundry 模型目录中的建议模型名称由基础模型加上随机三字母后缀组成。 你的模型的名称将与本例中所示的名称不同。
"vectorizers": [
{
"name": "my-model-catalog-vectorizer",
"kind": "aml",
"amlParameters": {
"uri": "https://Cohere-embed-v3-multilingual-hin.chinaeast.models.ai.azure.cn",
"key": "aaaaaaaa-0b0b-1c1c-2d2d-333333333333",
"timeout": "PT60S",
"modelName": "Cohere-embed-v3-multilingual-hin",
"resourceId": null,
"region": null,
},
}
]