Azure AI服务模型目录矢量化器

重要

根据补充使用条款,此矢量化工具目前处于公共预览版。 若要使用此功能,建议使用最新预览版的索引 - 创建或更新(REST API)。

矢量器参数

参数区分大小写。 所使用的参数取决于 模型提供程序所需的身份验证(如果有)。

参数名称 说明
uri (用于密钥身份验证的必需项)AI 服务模型目录中的无服务器部署目标 URI 或 AML 在线终结点评分 URI。 仅允许 HTTPS URI 方案。
key 密钥身份验证必需)模型提供程序的 API 密钥。
resourceId 令牌认证要求)模型提供程序的 Azure 资源管理器 资源 ID。 对于 AML 联机终结点,请使用 subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name} 格式。
region 令牌身份验证可选)模型提供程序部署的区域。 如果区域与搜索服务的区域不同,则为必需。
timeout (可选)HTTP 客户端请求 API 调用的超时时间。 必须将其格式化为 XSD“dayTimeDuration”值(ISO 8601 持续时间值的受限子集)。 例如,PT60S 表示 60 秒。 如果未设置,选择的是默认值 30 秒。 超时可以设置为最大 230 秒和最小 1 秒。

要使用的身份验证参数

Azure AI 服务模型目录向量器提供两种身份验证选项:

  • 基于密钥的身份验证。 提供静态密钥以对来自向量器的评分请求进行身份验证。 设置此连接的uri参数和key参数。

  • 基于令牌的身份验证。 基于 AI 服务中心的项目或 AML 联机终结点是使用基于令牌的身份验证部署的。 Azure AI 搜索服务必须具有托管标识并在模型提供程序上进行角色分配。 然后,vectorizer 使用搜索服务标识对模型提供程序进行身份验证,无需静态密钥。 搜索服务标识必须具有 “所有者 ”或 “参与者 ”角色。 resourceId设置参数,如果搜索服务位于与模型提供程序不同的区域,请设置region参数。

支持的矢量查询类型

Azure AI 服务的模型目录向量器支持的矢量查询类型取决于所配置的 modelName

嵌入模型 支持 text 查询 支持 imageUrl 查询 支持 imageBinary 查询
Cohere-embed-v3-english X X
Cohere-embed-v3-多语言 X X
Cohere-embed-v4 X X

预计字段维度

使用Azure AI 服务模型目录向量化器配置的向量场的预期字段维度取决于配置的 modelName

modelName 预期的尺寸
Cohere-embed-v3-english 1024
Cohere-embed-v3-多语言 1024
Cohere-embed-v4 256-1536

示例定义

AI 服务模型目录中的建议模型名称由基本模型和随机三字母后缀组成。 你的模型的名称将与本例中所示的名称不同。

"vectorizers": [
    {
        "name": "my-model-catalog-vectorizer",
        "kind": "aml",
        "amlParameters": {
            "uri": "https://Cohere-embed-v3-multilingual-hin.chinaeast.models.ai.azure.cn",
            "key": "aaaaaaaa-0b0b-1c1c-2d2d-333333333333",
            "timeout": "PT60S",
            "modelName": "Cohere-embed-v3-multilingual-hin",
            "resourceId": null,
            "region": null,
        },
    }
]

另请参阅