将 MLflow 模型部署到联机终结点

本文介绍如何将 MLflow 模型部署到联机终结点进行实时推理。将 MLflow 模型部署到联机终结点时，无需指定评分脚本或环境，此功能称为无代码部署。

对于无代码部署，Azure Machine Learning：

动态安装 conda.yaml 文件中列出的Python包。因此，系统会在容器运行时安装依赖项。
提供包含以下项的 MLflow 基本映像或特选环境：
- azureml-inference-server-http 包
- mlflow-skinny 包
- 用于推理的评分脚本

先决条件

Python 3.10 或更高版本。
一个 Azure 订阅。如果没有Azure订阅，请在开始前创建 Trial。
至少具有以下Azure基于角色的访问控制（Azure RBAC）角色之一的用户帐户：
- Azure Machine Learning工作区的所有者角色
- Azure Machine Learning工作区的参与者角色
- 具有 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/* 权限的自定义角色
有关详细信息，请参阅管理访问 Azure 机器学习工作区。
访问Azure Machine Learning：
将 Azure CLI 和 ml 扩展安装到Azure CLI。有关安装步骤，请参阅安装和设置 CLI （v2）。
安装 Azure Machine Learning SDK for Python。
```
pip install azure-ai-ml azure-identity
```
- 安装 MLflow SDK 包、mlflow 和 Azure Machine Learning 的 MLflow 集成包 azureml-mlflow。
```
pip install mlflow azureml-mlflow
```
- 如果未在Azure Machine Learning计算实例中运行代码，请将 MLflow 跟踪 URI 或 MLflow 注册表 URI 配置为指向所处理Azure Machine Learning工作区。有关如何将 MLflow 连接到工作区的详细信息，请参阅 Configure MLflow for Azure Machine Learning。
在 Azure Machine Learning studio 中工作时，没有其他先决条件。

关于示例

本文的示例演示如何将 MLflow 模型部署到联机终结点以执行预测。此示例使用基于糖尿病数据集的 MLflow 模型。此数据集包含 10 个基线变量：年龄、性别、体重指数、平均血压和 6 个从 442 名糖尿病患者获得的血液血清测量。它还包含兴趣反应，即对基线数据日期一年后的疾病进展进行的定量测量。

该模型是使用 scikit-learn 回归器训练的。所有必需的预处理都打包为管道，因此此模型是一个从原始数据到预测的端到端管道。

本文中的信息基于 azureml-examples 存储库中的代码示例。如果克隆存储库，则可以在本地运行本文中的命令，而无需复制或粘贴 YAML 文件和其他文件。使用以下命令克隆存储库并转到编码语言的文件夹：

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/cli

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/sdk/python/endpoints/online/mlflow

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/sdk/python/endpoints/online/mlflow

请在 Jupyter Notebook 中进行跟随操作

若要遵循本文中的步骤，请参阅示例存储库中的 Deploy MLflow 模型到联机终结点笔记本。

连接到工作区

连接到Azure Machine Learning工作区：

az account set --subscription <subscription-ID>
az configure --defaults workspace=<workspace-name> group=<resource-group-name> location=<location>

导入所需的库：

from azure.ai.ml import MLClient, Input
from azure.ai.ml.entities import (
ManagedOnlineEndpoint,
ManagedOnlineDeployment,
Model,
Environment,
CodeConfiguration,
)
from azure.identity import DefaultAzureCredential
from azure.ai.ml.constants import AssetTypes

配置工作区详细信息并获取工作区句柄：

subscription_id = "<subscription-ID>"
resource_group = "<resource-group-name>"
workspace = "<workspace-name>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)

导入所需的库：

import json
import mlflow
import pandas as pd
from mlflow.deployments import get_deploy_client
from mlflow.tracking import MlflowClient

初始化 MLflow 客户端：
```
mlflow_client = MlflowClient()
```

配置部署客户端：

deployment_client = get_deploy_client(mlflow.get_tracking_uri())

注册模型

只能将已注册的模型部署到联机终结点。本文中的步骤使用了一个经过训练以适用于糖尿病数据集的模型。在这种情况下，克隆的存储库中已有模型的本地副本，因此只需将模型发布到工作区中的注册表。如果要部署的模型已注册，则可以跳过此步骤。

MODEL_NAME='sklearn-diabetes'
az ml model create --name $MODEL_NAME --type "mlflow_model" --path "endpoints/online/ncd/sklearn-diabetes/model"

model_name = 'sklearn-diabetes'
model_local_path = "sklearn-diabetes/model"
model = ml_client.models.create_or_update(
        Model(name=model_name, path=model_local_path, type=AssetTypes.MLFLOW_MODEL)
)

model_name = 'sklearn-diabetes'
model_local_path = "sklearn-diabetes/model"

registered_model = mlflow_client.create_model_version(
    name=model_name, source=f"file://{model_local_path}"
)
version = registered_model.version

如果你在运行中记录模型会怎样？

如果您在一次运行中记录了模型，则可以直接注册它。

若要注册模型，需要知道其存储位置：

如果使用 MLflow autolog 功能，则模型的路径取决于模型类型和框架。检查作业输出以标识模型文件夹的名称。此文件夹包含一个名为MLModel的文件。
如果使用该方法 log_model 手动记录模型，请将模型的路径作为参数传递给该方法。例如，如果您使用 mlflow.sklearn.log_model(my_model, "classifier") 来记录模型，那么 classifier 就是存储模型的路径。

可以使用 Azure Machine Learning CLI v2 从训练作业输出创建模型。以下代码使用 ID $RUN_ID 的作业工件来注册名为 $MODEL_NAME 的模型。 $MODEL_PATH 是作业用于存储模型的路径。

az ml model create --name $MODEL_NAME --path azureml://jobs/$RUN_ID/outputs/artifacts/$MODEL_PATH

可以使用 Python SDK 从训练作业输出创建模型。以下代码使用 ID RUN_ID 的作业工件来注册名为 sklearn-diabetes 的模型。 MODEL_PATH 是作业用于存储模型的路径。

model_name = 'sklearn-diabetes'

ml_client.models.create_or_update(
    Model(
        path=f"azureml://jobs/{RUN_ID}/outputs/artifacts/{MODEL_PATH}",
        name=model_name,
        type=AssetTypes.MLFLOW_MODEL
    )
)

可以使用 Python MLflow SDK 从训练作业输出创建模型。以下代码使用 ID RUN_ID 的作业工件来注册名为 sklearn-diabetes 的模型。 MODEL_PATH 是作业用于存储模型的路径。

model_name = 'sklearn-diabetes'

registered_model = mlflow_client.create_model_version(
    name=model_name, source=f"runs://{RUN_ID}/{MODEL_PATH}"
)
version = registered_model.version

将 MLflow 模型部署到联机终结点

使用以下代码配置要将模型部署到的终结点的名称和身份验证模式：

小窍门

此示例使用基于密钥的身份验证来简单起见。对于生产部署，Microsoft建议 Microsoft Entra使用基于令牌的身份验证（aad_token），通过基于标识的访问控制提供增强的安全性。有关详细信息，请参阅对联机终结点的客户端进行身份验证。

通过运行以下命令设置终结点名称。首先将 YOUR_ENDPOINT_NAME 替换为一个唯一的名称。

set -e

# <set_endpoint_name>
export ENDPOINT_NAME="<YOUR_ENDPOINT_NAME>"
# </set_endpoint_name>

#  endpoint name
export ENDPOINT_NAME=endpt-ncd-`echo $RANDOM`

AML_SKLEARN_MODEL_NAME=mir-sample-sklearn-ncd-model
echo $AML_SKLEARN_MODEL_NAME

AML_LIGHTGBM_MODEL_NAME=mir-sample-lightgbm-ncd-model
echo $AML_LIGHTGBM_MODEL_NAME

# <create_endpoint>
az ml online-endpoint create --name $ENDPOINT_NAME -f endpoints/online/ncd/create-endpoint.yaml
# </create_endpoint>

# check if create was successful
endpoint_status=`az ml online-endpoint show --name $ENDPOINT_NAME --query "provisioning_state" -o tsv`
echo $endpoint_status
if [[ $endpoint_status == "Succeeded" ]]
then
  echo "Endpoint created successfully"
else
  echo "Endpoint creation failed"
  exit 1
fi

# cleanup of existing models
model_archive=$(az ml model archive -n $AML_SKLEARN_MODEL_NAME --version 1 || true)
model_archive=$(az ml model archive -n $AML_LIGHTGBM_MODEL_NAME --version 1 || true)


# <create_sklearn_deployment>
az ml online-deployment create --name sklearn-deployment --endpoint $ENDPOINT_NAME -f endpoints/online/ncd/sklearn-deployment.yaml --all-traffic
# </create_sklearn_deployment>

deploy_status=`az ml online-deployment show --name sklearn-deployment --endpoint $ENDPOINT_NAME --query "provisioning_state" -o tsv`
echo $deploy_status
if [[ $deploy_status == "Succeeded" ]]
then
  echo "Deployment completed successfully"
else
  echo "Deployment failed"
  exit 1
fi

# <test_sklearn_deployment>
az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/ncd/sample-request-sklearn.json
# </test_sklearn_deployment>

# <create_lightgbm_deployment>
az ml online-deployment create --name lightgbm-deployment --endpoint $ENDPOINT_NAME -f endpoints/online/ncd/lightgbm-deployment.yaml
# </create_lightgbm_deployment>

deploy_status=`az ml online-deployment show --name lightgbm-deployment --endpoint $ENDPOINT_NAME --query "provisioning_state" -o tsv`
echo $deploy_status
if [[ $deploy_status == "Succeeded" ]]
then
  echo "Deployment completed successfully"
else
  echo "Deployment failed"
  exit 1
fi

# <test_lightgbm_deployment>
az ml online-endpoint invoke --name $ENDPOINT_NAME --deployment lightgbm-deployment --request-file endpoints/online/ncd/sample-request-lightgbm.json
# </test_lightgbm_deployment>

# cleanup of models
model_archive=$(az ml model archive -n $AML_SKLEARN_MODEL_NAME --version 1 || true)
model_archive=$(az ml model archive -n $AML_LIGHTGBM_MODEL_NAME --version 1 || true)

# <delete_endpoint>
az ml online-endpoint delete --name $ENDPOINT_NAME --yes 
# </delete_endpoint>

若要配置终结点，请创建一个名为 create-endpoint.yaml 包含以下行的 YAML 文件：

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

# To create a unique endpoint name, use a time stamp of the current date and time.
import datetime

endpoint_name = "sklearn-diabetes-" + datetime.datetime.now().strftime("%m%d%H%M%f")

endpoint = ManagedOnlineEndpoint(
    name=endpoint_name,
    description="An online endpoint to generate predictions for the diabetes dataset",
    auth_mode="key",
    tags={"env": "dev"},
)

使用配置文件设置终结点的属性。在这种情况下，将终结点的身份验证模式设置为 key。


# To create a unique endpoint name, use a time stamp of the current date and time.
import datetime
    
endpoint_name = "sklearn-diabetes-" + datetime.datetime.now().strftime("%m%d%H%M%f")

endpoint_config = {
    "auth_mode": "key",
    "identity": {
        "type": "system_assigned"
    }
}

使用以下代码将此配置信息写入 JSON 文件：

endpoint_config_path = "endpoint_config.json"
with open(endpoint_config_path, "w") as outfile:
    outfile.write(json.dumps(endpoint_config))

创建终结点：

az ml online-endpoint create --name $ENDPOINT_NAME -f endpoints/online/mlflow/create-endpoint.yaml

ml_client.begin_create_or_update(endpoint)

endpoint = deployment_client.create_endpoint(
    name=endpoint_name,
    config={"endpoint-config-file": endpoint_config_path},
)

配置部署。部署是托管处理实际推理的模型所需的一组资源。

创建一个名为 sklearn-deployment.yaml 包含以下行的 YAML 文件：

 $schema: https://azuremlschemas.azureedge.net/latest/managedOnlineDeployment.schema.json
 name: sklearn-deployment
 endpoint_name: my-endpoint
 model:
   name: mir-sample-sklearn-ncd-model
   version: 1
   path: sklearn-diabetes/model
   type: mlflow_model
 instance_type: Standard_DS3_v2
 instance_count: 1

blue_deployment = ManagedOnlineDeployment(
    name="blue",
    endpoint_name=endpoint_name,
    model=model,
    instance_type="Standard_F4s_v2",
    instance_count=1
)

blue_deployment_name = "blue"

若要配置部署的硬件要求，请创建具有所需配置的 JSON 文件：

deploy_config = {
    "instance_type": "Standard_F4s_v2",
    "instance_count": 1,
}

注意

有关此配置的完整规范的信息，请参阅 CLI （v2）托管联机部署 YAML 架构。

使用以下代码将配置写入文件：

deployment_config_path = "deployment_config.json"
with open(deployment_config_path, "w") as outfile:
    outfile.write(json.dumps(deploy_config))

注意

仅 scoring_script 模型风格支持自动生成 environment 和 PyFunc。若要使用不同的模型风格，请参阅自定义 MLflow 模型部署。

创建部署：
```
 az ml online-deployment create --name sklearn-deployment --endpoint $ENDPOINT_NAME -f endpoints/online/ncd/sklearn-deployment.yaml --all-traffic
```
```
az ml online-deployment create --package-model --name sklearn-deployment --endpoint $ENDPOINT_NAME -f endpoints/online/ncd/sklearn-deployment.yaml --all-traffic
```
```
ml_client.online_deployments.begin_create_or_update(blue_deployment)
```
```
blue_deployment = deployment_client.create_deployment(
    name=blue_deployment_name,
    endpoint=endpoint_name,
    model_uri=f"models:/{model_name}/{version}",
    config={"deploy-config-file": deployment_config_path},
)    
```
1. 选择 终结点。转到 “实时终结点 ”选项卡，然后选择“ 创建”。
2. 选择之前注册的 MLflow 模型，然后选择“ 选择”。
  
  注意
  
  配置页包含一条说明，告知你为所选 MLflow 模型自动生成评分脚本和环境。
3. 在 “终结点”下，选择“ 新建 ”以部署到新终结点。
4. 在 “终结点名称”下，输入终结点的名称或保留默认名称。
5. 在 “部署名称”下，输入部署的名称或保留默认名称。
6. 选择“部署”，将模型部署到终结点。
将所有流量分配到部署。到目前为止，终结点有一个部署，但没有为其分配任何流量。
如果在创建过程中使用 --all-traffic 标志，则Azure CLI中不需要此步骤。如果需要更改流量，请使用 az ml online-endpoint update --traffic 命令。有关如何更新流量的详细信息，请参阅逐步更新流量。
```
endpoint.traffic = {"blue": 100}
```
```
traffic_config = {"traffic": {blue_deployment_name: 100}}
```
将配置写入文件：
```
traffic_config_path = "traffic_config.json"
with open(traffic_config_path, "w") as outfile:
    outfile.write(json.dumps(traffic_config))
```
在工作室中不需要此步骤。
更新终结点配置：
如果在创建过程中使用 --all-traffic 标志，则Azure CLI中不需要此步骤。如果需要更改流量，请使用 az ml online-endpoint update --traffic 命令。有关如何更新流量的详细信息，请参阅逐步更新流量。
```
ml_client.begin_create_or_update(endpoint).result()
```
```
deployment_client.update_endpoint(
    endpoint=endpoint_name,
    config={"endpoint-config-file": traffic_config_path},
)
```
在工作室中不需要此步骤。

调用端点

部署就绪后，您可以使用它来服务请求。测试部署的一种方法是在部署客户端中使用内置调用功能。在示例存储库中， sample-request-sklearn.json 该文件包含以下 JSON 代码。可以将它用作部署的示例请求文件。

{"input_data": {
    "columns": [
      "age",
      "sex",
      "bmi",

{
  "input_data": {
    "columns": [
      "age",
      "sex",
      "bmi",
      "bp",
      "s1",
      "s2",
      "s3",
      "s4",
      "s5",
      "s6"
    ],
    "data": [
      [ 1.0,2.0,3.0,4.0,5.0,6.0,7.0,8.0,9.0,10.0 ]
    ],
    "index": [0]
  }
}

{
  "input_data": {
    "columns": [
      "age",
      "sex",
      "bmi",
      "bp",
      "s1",
      "s2",
      "s3",
      "s4",
      "s5",
      "s6"
    ],
    "data": [
      [ 1.0,2.0,3.0,4.0,5.0,6.0,7.0,8.0,9.0,10.0 ]
    ],
    "index": [0]
  }
}

{"input_data": {
    "columns": [
      "age",
      "sex",
      "bmi",
      "bp",
      "s1",
      "s2",
      "s3",
      "s4",
      "s5",
      "s6"
    ],
    "data": [
      [ 1.0,2.0,3.0,4.0,5.0,6.0,7.0,8.0,9.0,10.0 ],
      [ 10.0,2.0,9.0,8.0,7.0,6.0,5.0,4.0,3.0,2.0]
    ],
    "index": [0,1]
  }}

注意

此文件使用 input_data 密钥而不是 inputsMLflow 服务使用的密钥。 Azure Machine Learning需要不同的输入格式来自动生成终结点的 Swagger 协定。有关预期输入格式的详细信息，请参阅 MLflow 内置服务器中的部署与Azure Machine Learning推理服务器中的部署。

向终结点提交请求：

az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/mlflow/sample-request-sklearn.json

response = ml_client.online_endpoints.invoke(
    endpoint_name=endpoint_name,
    request_file="sample-request-sklearn.json",
)

# Read the sample request that's in the JSON file, and then construct a pandas data frame.
with open("sample-request-sklearn.json", "r") as f:
    sample_request = json.loads(f.read())
    samples = pd.DataFrame(**sample_request["input_data"])

deployment_client.predict(endpoint=endpoint_name, df=samples)

响应应类似于以下文本：

[ 
  11633.100167144921,
  8522.117402884991
]

[ 
  11633.100167144921
]

[ 
  11633.100167144921
]

[ 
  11633.100167144921,
  8522.117402884991
]

重要

对于 MLflow 无代码部署，目前不支持通过本地终结点进行测试。

自定义 MLflow 模型部署

将 MLflow 模型部署到联机终结点时，无需指定评分脚本。但是，如果要自定义推理过程，可以添加评分脚本。

在以下情况下自定义你的 MLflow 模型部署：

此模型没有 PyFunc 风格。
需要自定义运行模型的方式。例如，需要使用 mlflow.<flavor>.load_model() 特定风格来加载模型。
你需要在评分例程中预处理或后处理，因为模型不处理此处理。
模型输出不能在表格数据中很好地表示。例如，输出是表示图像的张量。

重要

如果为 MLflow 模型部署指定评分脚本，则还需要指定部署的环境。

部署自定义评分脚本

若要部署使用自定义评分脚本的 MLflow 模型，请执行以下步骤。

标识模型文件夹

通过执行以下步骤确定包含 MLflow 模型的文件夹：

转到 Azure Machine Learning studio。
转到“模型”部分。
选择要部署的模型，然后转到其 “项目 ”选项卡。
记下显示的文件夹。注册模型时，请指定此文件夹。

创建评分脚本

以下评分脚本 score.py 提供了如何使用 MLflow 模型执行推理的示例。可以根据需要调整此脚本，或根据自己的方案更改其中的任何部分。请注意，您之前标识的文件夹名称 model 包含在函数 init() 中。

import logging
import os
import json
import mlflow
from io import StringIO
from mlflow.pyfunc.scoring_server import infer_and_parse_json_input, predictions_to_json


def init():
    global model
    global input_schema
    # "model" is the path of the mlflow artifacts when the model was registered. For automl
    # models, this is generally "mlflow-model".
    model_path = os.path.join(os.getenv("AZUREML_MODEL_DIR"), "model")
    model = mlflow.pyfunc.load_model(model_path)
    input_schema = model.metadata.get_input_schema()


def run(raw_data):
    json_data = json.loads(raw_data)
    if "input_data" not in json_data.keys():
        raise Exception("Request must contain a top level key named 'input_data'")

    serving_input = json.dumps(json_data["input_data"])
    data = infer_and_parse_json_input(serving_input, input_schema)
    predictions = model.predict(data)

    result = StringIO()
    predictions_to_json(predictions, result)
    return result.getvalue()

警告

MLflow 2.0 公告：示例评分脚本适用于 MLflow 1.X 和 MLflow 2.X。但是，这些版本的预期输入和输出格式可能会有所不同。检查环境定义，查看所使用的 MLflow 版本。 MLflow 2.0 仅在 Python 3.8 及更高版本中受支持。

创建环境

下一步是创建可以运行评分脚本的环境。由于模型是 MLflow 模型，因此 conda 要求也在模型包中指定。有关 MLflow 模型中包含的文件的详细信息，请参阅 MLmodel 格式。使用文件中的 conda 依赖项生成环境。但是，还需要包括 azureml-inference-server-http 和 azureml-ai-monitoring 包，这是Azure Machine Learning中的联机部署所必需的。

可以创建一个名为 conda.yaml 的 conda 定义文件，其中包含以下行：

channels:
- conda-forge
dependencies:
- python=3.9
- pip
- pip:
  - mlflow
  - scikit-learn==1.2.2
  - cloudpickle==2.2.1
  - psutil==5.9.4
  - pandas==2.0.0
  - azureml-inference-server-http
  name: mlflow-env

注意

此 conda 文件的 dependencies 节包括 azureml-inference-server-http 和 azureml-ai-monitoring 包。

使用此 conda 依赖项文件创建环境：

你在部署配置中嵌入式创建环境。

environment = Environment(
    conda_file="sklearn-diabetes/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu22.04:latest",
)

选择环境。
转到“ 自定义环境 ”选项卡，然后选择“ 创建”。
在 “设置”上，执行以下步骤：
1. 在 “名称”下，输入环境的名称。在这种情况下，请输入 sklearn-mlflow-online。
2. 在 “选择环境源”下，选择 “使用具有可选 conda 文件的现有 docker 映像”。
3. 在 “容器注册表映像路径”下，输入 mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu22.04。
4. 选择“下一步”转到“自定义”部分。
复制文件的内容 sklearn-diabetes/environment/conda.yaml 并将其粘贴到文本框中。
选择 “下一步 ”转到“ 标记 ”页，然后再次选择“ 下一步”。
在 “审阅”上，选择“ 创建”。环境已准备就绪，可供使用。

创建部署

在 endpoints/online/ncd 文件夹中，创建一个部署配置文件， deployment.yml其中包含以下行：

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineDeployment.schema.json
name: sklearn-diabetes-custom
endpoint_name: my-endpoint
model: azureml:sklearn-diabetes@latest
environment: 
    image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu22.04
    conda_file: sklearn-diabetes/environment/conda.yaml
code_configuration:
    code: sklearn-diabetes/src
    scoring_script: score.py
instance_type: Standard_F2s_v2
instance_count: 1

创建部署：

az ml online-deployment create -f endpoints/online/ncd/deployment.yml

blue_deployment = ManagedOnlineDeployment(
    name="blue",
    endpoint_name=endpoint_name,
    model=model,
    environment=environment,
    code_configuration=CodeConfiguration(
        code="sklearn-diabetes/src",
        scoring_script="score.py"
    ),
    instance_type="Standard_F4s_v2",
    instance_count=1,
)

ml_client.online_deployments.begin_create_or_update(blue_deployment)

处理请求

部署完成后，即可为请求提供服务。测试部署的一种方法是将 invoke 该方法与示例请求文件一起使用， sample-request-sklearn.json例如以下文件：

{"input_data": {
    "columns": [
      "age",
      "sex",
      "bmi",
      "bp",
      "s1",
      "s2",
      "s3",
      "s4",
      "s5",
      "s6"
    ],
    "data": [
      [ 1.0,2.0,3.0,4.0,5.0,6.0,7.0,8.0,9.0,10.0 ],
      [ 10.0,2.0,9.0,8.0,7.0,6.0,5.0,4.0,3.0,2.0]
    ],
    "index": [0,1]
  }}

{
  "input_data": {
    "columns": [
      "age",
      "sex",
      "bmi",
      "bp",
      "s1",
      "s2",
      "s3",
      "s4",
      "s5",
      "s6"
    ],
    "data": [
      [ 1.0,2.0,3.0,4.0,5.0,6.0,7.0,8.0,9.0,10.0 ]
    ],
    "index": [0]
  }
}

{"input_data": {
    "columns": [
      "age",
      "sex",
      "bmi",
      "bp",
      "s1",
      "s2",
      "s3",
      "s4",
      "s5",
      "s6"
    ],
    "data": [
      [ 1.0,2.0,3.0,4.0,5.0,6.0,7.0,8.0,9.0,10.0 ],
      [ 10.0,2.0,9.0,8.0,7.0,6.0,5.0,4.0,3.0,2.0]
    ],
    "index": [0,1]
  }}

向终结点提交请求：

az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/ncd/sample-request-sklearn.json

response = ml_client.online_endpoints.invoke(
    endpoint_name=endpoint_name,
    deployment_name=deployment.name,
    request_file="sample-request-sklearn.json",
)

响应应类似于以下文本：

{
    "predictions": [ 
    1095.2797413413252,
    1134.585328803727
    ]
}

{
    "predictions": [ 
    1095.2797413413252
    ]
}

{
    "predictions": [ 
    1095.2797413413252,
    1134.585328803727
    ]
}

注意

使用 MLflow 2.x 或更高版本时，响应包含 predictions 密钥。

清理资源

如果不再需要终结点，请删除其关联的资源：

set -e

# <set_endpoint_name>
export ENDPOINT_NAME="<YOUR_ENDPOINT_NAME>"
# </set_endpoint_name>

#  endpoint name
export ENDPOINT_NAME=endpt-ncd-`echo $RANDOM`

AML_SKLEARN_MODEL_NAME=mir-sample-sklearn-ncd-model
echo $AML_SKLEARN_MODEL_NAME

AML_LIGHTGBM_MODEL_NAME=mir-sample-lightgbm-ncd-model
echo $AML_LIGHTGBM_MODEL_NAME

# <create_endpoint>
az ml online-endpoint create --name $ENDPOINT_NAME -f endpoints/online/ncd/create-endpoint.yaml
# </create_endpoint>

# check if create was successful
endpoint_status=`az ml online-endpoint show --name $ENDPOINT_NAME --query "provisioning_state" -o tsv`
echo $endpoint_status
if [[ $endpoint_status == "Succeeded" ]]
then
  echo "Endpoint created successfully"
else
  echo "Endpoint creation failed"
  exit 1
fi

# cleanup of existing models
model_archive=$(az ml model archive -n $AML_SKLEARN_MODEL_NAME --version 1 || true)
model_archive=$(az ml model archive -n $AML_LIGHTGBM_MODEL_NAME --version 1 || true)


# <create_sklearn_deployment>
az ml online-deployment create --name sklearn-deployment --endpoint $ENDPOINT_NAME -f endpoints/online/ncd/sklearn-deployment.yaml --all-traffic
# </create_sklearn_deployment>

deploy_status=`az ml online-deployment show --name sklearn-deployment --endpoint $ENDPOINT_NAME --query "provisioning_state" -o tsv`
echo $deploy_status
if [[ $deploy_status == "Succeeded" ]]
then
  echo "Deployment completed successfully"
else
  echo "Deployment failed"
  exit 1
fi

# <test_sklearn_deployment>
az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/ncd/sample-request-sklearn.json
# </test_sklearn_deployment>

# <create_lightgbm_deployment>
az ml online-deployment create --name lightgbm-deployment --endpoint $ENDPOINT_NAME -f endpoints/online/ncd/lightgbm-deployment.yaml
# </create_lightgbm_deployment>

deploy_status=`az ml online-deployment show --name lightgbm-deployment --endpoint $ENDPOINT_NAME --query "provisioning_state" -o tsv`
echo $deploy_status
if [[ $deploy_status == "Succeeded" ]]
then
  echo "Deployment completed successfully"
else
  echo "Deployment failed"
  exit 1
fi

# <test_lightgbm_deployment>
az ml online-endpoint invoke --name $ENDPOINT_NAME --deployment lightgbm-deployment --request-file endpoints/online/ncd/sample-request-lightgbm.json
# </test_lightgbm_deployment>

# cleanup of models
model_archive=$(az ml model archive -n $AML_SKLEARN_MODEL_NAME --version 1 || true)
model_archive=$(az ml model archive -n $AML_LIGHTGBM_MODEL_NAME --version 1 || true)

# <delete_endpoint>
az ml online-endpoint delete --name $ENDPOINT_NAME --yes 
# </delete_endpoint>

ml_client.online_endpoints.begin_delete(endpoint_name)

deployment_client.delete_endpoint(endpoint_name)

Last updated on 2026-04-22

配置初始设置

配置自定义设置

将 MLflow 模型部署到联机终结点

先决条件

关于示例

请在 Jupyter Notebook 中进行跟随操作

连接到工作区

注册模型

如果你在运行中记录模型会怎样？

将 MLflow 模型部署到联机终结点

调用端点

自定义 MLflow 模型部署

部署自定义评分脚本

标识模型文件夹

创建评分脚本

创建环境

创建部署

处理请求

清理资源

相关内容

其他資源