使用 Databricks 上的 MLflow 模型自动进行特征查找
模型服务可以自动在已发布的联机存储中查找特征值。
要求
- 必须已使用
FeatureEngineeringClient.log_model
(适用于 Unity Catalog 中的特征工程)或FeatureStoreClient.log_model
(适用于工作区特征存储,需要使用 v0.3.5 及更高版本)对模型进行了记录。 - 必须使用只读凭据发布联机存储。
注意
可以在部署模型之前的任何时间(包括训练模型之后)发布特征表。
自动特征查找
Azure Databricks 模型服务支持自动查找以下联机存储中的特征:
- Azure Cosmos DB(v0.5.0 及更高版本)
以下数据类型支持自动特征查找:
IntegerType
FloatType
BooleanType
StringType
DoubleType
LongType
TimestampType
DateType
ShortType
DecimalType
ArrayType
MapType
替代联机模型评分中的特征值
将在用于模型评分的联机存储中自动查找模型所需的所有特征(使用 FeatureEngineeringClient.log_model
或 FeatureStoreClient.log_model
进行了记录)。 若要在为模型评分时使用 REST API 以及模型服务替代特征值,请将这些特征值作为 API 有效负载的一部分包括在内。
注意
新特征值必须符合基础模型所需的特征数据类型。
笔记本示例:Unity Catalog
使用 Databricks Runtime 13.3 LTS 及更高版本时,Unity Catalog 中具有主键的任何 Delta 表都可以用作特征表。 使用在 Unity Catalog 中注册的表作为特征表时,所有 Unity Catalog 功能都将自动提供给该特征表。
此示例笔记本介绍如何将特征发布到联机存储,然后提供可自动从联机存储中查找特征的已训练模型。
使用 Unity Catalog 的在线商店示例笔记本
笔记本示例:工作区功能存储
此示例笔记本介绍如何将特征发布到联机存储,然后提供可自动从联机存储中查找特征的已训练模型。