Azure AI Foundry 模型目录矢量化器

重要

根据补充使用条款,此向量器以公共预览版提供。 2024-05-01-Preview REST API 支持此功能。

Azure AI Foundry 模型目录矢量器连接到通过 Azure AI Foundry 模型目录部署到 Azure 机器学习终结点的嵌入模型。 数据在部署模型的地理位置进行处理。

矢量器参数

参数区分大小写。 选择使用哪些参数取决于 AML 联机终结点所需的身份验证(如果有)

参数名称 说明
uri (必需)JSON 有效负载发送到的 AML 联机终结点的 URI 仅支持 https URI 方案。
key 密钥身份验证所需)AML 联机终结点的密钥
resourceId 令牌身份验证需要)。 AML 联机终结点的 Azure 资源管理器资源 ID。 它的格式应如下所示:subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name}。
region (对于令牌身份验证可选)。 AML 联机终结点部署到的区域。 如果区域与搜索服务的区域不同,则需要提供区域。
timeout (可选)如果指定,表明执行 API 调用的 http 客户端的超时值。 必须将其格式化为 XSD“dayTimeDuration”值(ISO 8601 持续时间值的受限子集)。 例如,PT60S 表示 60 秒。 如果未设置,选择的是默认值 30 秒。 超时可以设置为最大 230 秒和最小 1 秒。

要使用的身份验证参数

需要哪些身份验证参数取决于 AML 联机终结点使用的身份验证(如果有)。 AML 联机终结点提供两个身份验证选项:

  • 基于密钥的身份验证。 提供静态密钥,对来自矢量器的评分请求进行身份验证。
    • 使用 uri 和 key 参数
  • 基于令牌的身份验证使用基于令牌的身份验证来部署 AML 联机终结点。 必须启用 Azure AI 搜索服务的托管标识。 然后,矢量器使用服务的托管标识向 AML 联机终结点进行身份验证,无需任何静态密钥。 必须为该标识分配所有者或参与者角色。
    • 使用 resourceId 参数。
    • 如果搜索服务与 AML 工作区位于不同的区域,请使用 region 参数设置 AML 联机终结点已部署到的区域

支持的矢量查询类型

AI Foundry 模型目录矢量器支持的矢量查询类型取决于配置的 modelName

modelName 支持 text 查询 支持 imageUrl 查询 支持 imageBinary 查询
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 X X X
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 X X X
Cohere-embed-v3-multilingual X

预期字段维度

使用 AI Foundry 模型目录矢量器配置的字段的预期字段维度取决于配置的 modelName

modelName 预期维度
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 512
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 768
Cohere-embed-v3-english 1024
Cohere-embed-v3-multilingual 1024

示例定义

Azure AI Foundry 模型目录中的建议模型名称由基础模型加上随机三字母后缀组成。 你的模型的名称将与本例中所示的名称不同。

"vectorizers": [
    {
        "name": "my-ai-studio-catalog-vectorizer",
        "kind": "aml",
        "amlParameters": {
            "uri": "https://my-aml-endpoint.chinaeast.inference.studio.ml.azure.cn/score",
            "key": "0000000000000000000000000000000000000",
            "timeout": "PT60S",
            "modelName": "OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch3",
            "resourceId": null,
            "region": null,
        },
    }
]

另请参阅