Databricks 上的 MLflow 模型自动特征查找

模型服务可以自动查找已发布在线商店的功能值。

要求

  • 该模型必须在 Unity Catalog 中通过 FeatureEngineeringClient.log_model(用于特征工程)或在工作区功能存储中通过 FeatureStoreClient.log_model(需要 v0.3.5 及更高版本)进行记录。
  • 必须将在线商店使用只读凭据发布。

注释

可以在部署模型之前的任何时间(包括训练模型之后)发布特征表。

自动特征查找

Azure Databricks 模型服务支持从这些在线商店进行自动功能查找:

  • Azure Cosmos DB (v0.5.0 及更高版本)

以下数据类型支持自动特征查找:

  • IntegerType
  • FloatType
  • BooleanType
  • StringType
  • DoubleType
  • LongType
  • TimestampType
  • DateType
  • ShortType
  • DecimalType
  • ArrayType
  • MapType

替代联机模型评分中的特征值

将在用于模型评分的联机存储中自动查找模型所需的所有特征(使用 FeatureEngineeringClient.log_modelFeatureStoreClient.log_model 进行了记录)。 使用具有模型服务的 REST API 对模型进行评分时,若要替代特征值,请将特征值作为 API 有效负载的一部分。

注释

新的特征值必须符合基础模型的预期特征数据类型。

笔记本示例:Unity Catalog

使用 Databricks Runtime 13.3 LTS 及更高版本时,Unity Catalog 中具有主键的任何 Delta 表都可以用作特征表。 使用在 Unity Catalog 中注册的表作为特征表时,所有 Unity Catalog 功能都将自动提供给该特征表。

此示例笔记本介绍如何将特征发布到联机存储,然后提供可自动从联机存储中查找特征的已训练模型。

使用 Unity 目录的在线商店示例笔记本

获取笔记本

笔记本示例:工作空间特征存储

此示例笔记本介绍如何将特征发布到联机存储,然后提供可自动从联机存储中查找特征的已训练模型。

在线商店示例笔记本

获取笔记本