Azure Foundry 模型目录向量器

重要

根据补充使用条款,此向量器以公共预览版提供。 若要使用此功能,建议使用最新预览版的索引 - 创建或更新(REST API)。

Azure AI Foundry 模型目录矢量器连接到通过 Azure AI Foundry 模型目录部署到 Azure 机器学习终结点的嵌入模型。 数据在部署模型的地理位置进行处理。

矢量器参数

参数区分大小写。 所使用的参数取决于 模型提供程序所需的身份验证(如果有)。

参数名称 说明
uri 密钥身份验证必需)来自 Foundry 模型目录的无服务器部署的目标 URI 或 AML 联机终结点的评分 URI。 仅允许 HTTPS URI 方案。
key 密钥身份验证必需)模型提供程序的 API 密钥。
resourceId 令牌身份验证必需)模型提供程序的 Azure 资源管理器资源 ID。 对于 AML 联机终结点,请使用 subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name} 格式。
region (令牌 身份验证可选)在其中部署模型提供程序的区域。 如果区域与搜索服务的区域不同,则为必需。
timeout (可选)发出 API 调用的 HTTP 客户端的超时。 必须将其格式化为 XSD“dayTimeDuration”值(ISO 8601 持续时间值的受限子集)。 例如,PT60S 表示 60 秒。 如果未设置,选择的是默认值 30 秒。 超时可以设置为最大 230 秒和最小 1 秒。

要使用的身份验证参数

Azure Foundry 模型目录向量器提供两种身份验证选项:

  • 基于密钥的身份验证。 提供静态密钥以对来自向量器的评分请求进行身份验证。 uri设置此连接的和key参数。

  • 基于令牌的身份验证。 基于 Foundry 中心的项目或 AML 联机终结点是使用基于令牌的身份验证部署的。 Azure AI 搜索服务必须在模型提供程序上具有 托管标识 和角色分配。 然后,vectorizer 使用搜索服务标识对模型提供程序进行身份验证,无需静态密钥。 搜索服务标识必须具有 “所有者 ”或 “参与者 ”角色。 resourceId设置参数,如果搜索服务位于与模型提供程序不同的区域,请设置region参数。

支持的矢量查询类型

Azure Foundry 模型目录向量器支持哪些向量查询类型取决于 modelName 配置的查询类型。

嵌入模型 支持 text 查询 支持 imageUrl 查询 支持 imageBinary 查询
Cohere-embed-v3-english X X
Cohere-embed-v3-多语言 X X
Cohere-embed-v4 X X

预期字段维度

使用 Azure Foundry 模型目录向量器配置的矢量字段的预期字段维度取决于 modelName 配置的字段维度。

modelName 预期维度
Cohere-embed-v3-english 1024
Cohere-embed-v3-多语言 1024
Cohere-embed-v4 256-1536

示例定义

Azure AI Foundry 模型目录中的建议模型名称由基础模型加上随机三字母后缀组成。 你的模型的名称将与本例中所示的名称不同。

"vectorizers": [
    {
        "name": "my-model-catalog-vectorizer",
        "kind": "aml",
        "amlParameters": {
            "uri": "https://Cohere-embed-v3-multilingual-hin.chinaeast.models.ai.azure.cn",
            "key": "aaaaaaaa-0b0b-1c1c-2d2d-333333333333",
            "timeout": "PT60S",
            "modelName": "Cohere-embed-v3-multilingual-hin",
            "resourceId": null,
            "region": null,
        },
    }
]

另请参阅