重要
根据补充使用条款,此矢量化工具目前处于公共预览版。 若要使用此功能,建议使用最新预览版的索引 - 创建或更新(REST API)。
矢量器参数
参数区分大小写。 所使用的参数取决于 模型提供程序所需的身份验证(如果有)。
| 参数名称 | 说明 |
|---|---|
uri |
(用于密钥身份验证的必需项)AI 服务模型目录中的无服务器部署目标 URI 或 AML 在线终结点评分 URI。 仅允许 HTTPS URI 方案。 |
key |
( 密钥身份验证必需)模型提供程序的 API 密钥。 |
resourceId |
(令牌认证要求)模型提供程序的 Azure 资源管理器 资源 ID。 对于 AML 联机终结点,请使用 subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name} 格式。 |
region |
(令牌身份验证可选)模型提供程序部署的区域。 如果区域与搜索服务的区域不同,则为必需。 |
timeout |
(可选)HTTP 客户端请求 API 调用的超时时间。 必须将其格式化为 XSD“dayTimeDuration”值(ISO 8601 持续时间值的受限子集)。 例如,PT60S 表示 60 秒。 如果未设置,选择的是默认值 30 秒。 超时可以设置为最大 230 秒和最小 1 秒。 |
要使用的身份验证参数
Azure AI 服务模型目录向量器提供两种身份验证选项:
基于密钥的身份验证。 提供静态密钥以对来自向量器的评分请求进行身份验证。 设置此连接的
uri参数和key参数。基于令牌的身份验证。 基于 AI 服务中心的项目或 AML 联机终结点是使用基于令牌的身份验证部署的。 Azure AI 搜索服务必须具有托管标识并在模型提供程序上进行角色分配。 然后,vectorizer 使用搜索服务标识对模型提供程序进行身份验证,无需静态密钥。 搜索服务标识必须具有 “所有者 ”或 “参与者 ”角色。
resourceId设置参数,如果搜索服务位于与模型提供程序不同的区域,请设置region参数。
支持的矢量查询类型
Azure AI 服务的模型目录向量器支持的矢量查询类型取决于所配置的 modelName。
| 嵌入模型 | 支持 text 查询 |
支持 imageUrl 查询 |
支持 imageBinary 查询 |
|---|---|---|---|
| Cohere-embed-v3-english | X | X | |
| Cohere-embed-v3-多语言 | X | X | |
| Cohere-embed-v4 | X | X |
预计字段维度
使用Azure AI 服务模型目录向量化器配置的向量场的预期字段维度取决于配置的 modelName。
modelName |
预期的尺寸 |
|---|---|
| Cohere-embed-v3-english | 1024 |
| Cohere-embed-v3-多语言 | 1024 |
| Cohere-embed-v4 | 256-1536 |
示例定义
AI 服务模型目录中的建议模型名称由基本模型和随机三字母后缀组成。 你的模型的名称将与本例中所示的名称不同。
"vectorizers": [
{
"name": "my-model-catalog-vectorizer",
"kind": "aml",
"amlParameters": {
"uri": "https://Cohere-embed-v3-multilingual-hin.chinaeast.models.ai.azure.cn",
"key": "aaaaaaaa-0b0b-1c1c-2d2d-333333333333",
"timeout": "PT60S",
"modelName": "Cohere-embed-v3-multilingual-hin",
"resourceId": null,
"region": null,
},
}
]