Azure AI Studio 模型目录矢量器
重要
根据补充使用条款,此向量器以公共预览版提供。 2024-05-01-Preview REST API 支持此功能。
Azure AI Studio 模型目录向量器连接到通过 Azure AI Studio 模型目录部署到 Azure 机器学习终结点的嵌入模型。 数据在部署模型的地理位置进行处理。
矢量器参数
参数区分大小写。 选择使用哪些参数取决于 AML 联机终结点所需的身份验证(如果有)。
参数名称 | 说明 |
---|---|
uri |
(必需)JSON 有效负载发送到的 AML 联机终结点的 URI。 仅支持 https URI 方案。 |
key |
(密钥身份验证所需)AML 联机终结点的密钥。 |
resourceId |
(令牌身份验证需要)。 AML 联机终结点的 Azure 资源管理器资源 ID。 它的格式应如下所示:subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name}。 |
region |
(对于令牌身份验证可选)。 AML 联机终结点部署到的区域。 如果区域与搜索服务的区域不同,则需要提供区域。 |
timeout |
(可选)如果指定,表明执行 API 调用的 http 客户端的超时值。 必须将其格式化为 XSD“dayTimeDuration”值(ISO 8601 持续时间值的受限子集)。 例如,PT60S 表示 60 秒。 如果未设置,选择的是默认值 30 秒。 超时可以设置为最大 230 秒和最小 1 秒。 |
要使用的身份验证参数
需要哪些身份验证参数取决于 AML 联机终结点使用的身份验证(如果有)。 AML 联机终结点提供两个身份验证选项:
- 基于密钥的身份验证。 提供静态密钥,对来自矢量器的评分请求进行身份验证。
- 使用 uri 和 key 参数
- 基于令牌的身份验证。 使用基于令牌的身份验证来部署 AML 联机终结点。 必须启用 Azure AI 搜索服务的托管标识。 然后,矢量器使用服务的托管标识向 AML 联机终结点进行身份验证,无需任何静态密钥。 必须为该标识分配所有者或参与者角色。
- 使用 resourceId 参数。
- 如果搜索服务与 AML 工作区位于不同的区域,请使用 region 参数设置 AML 联机终结点已部署到的区域
支持的矢量查询类型
AI Studio 模型目录矢量器支持的矢量查询类型取决于配置的 modelName
。
modelName |
支持 text 查询 |
支持 imageUrl 查询 |
支持 imageBinary 查询 |
---|---|---|---|
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 | X | X | X |
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 | X | X | X |
Cohere-embed-v3-multilingual | X |
预期字段维度
使用 AI Studio 模型目录矢量器配置的字段的预期字段维度取决于配置的 modelName
。
modelName |
预期维度 |
---|---|
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 | 512 |
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 | 768 |
Cohere-embed-v3-english | 1024 |
Cohere-embed-v3-multilingual | 1024 |
示例定义
"vectorizers": [
{
"name": "my-ai-studio-catalog-vectorizer",
"kind": "aml",
"amlParameters": {
"uri": "https://my-aml-endpoint.chinaeast.inference.studio.ml.azure.cn/score",
"key": "0000000000000000000000000000000000000",
"timeout": "PT60S",
"modelName": "OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch3",
"resourceId": null,
"region": null,
},
}
]