使用联机工作流中的特征

在 Unity Catalog 中使用特征工程时,模型开发过程的每个步骤都会集成到 Databricks Data Intelligence 平台中。 这意味着,可以在 Databricks 处理基础结构时生成自动化数据管道来计算和提供特征值。 Databricks 平台为特征和模型提供实时服务,包括按需计算特征值。

自动特征查找

使用 Databricks 特征工程训练模型并使用 Databricks 模型服务时,模型会自动查找 Databricks 联机表或第三方在线商店中的特征值。 这会自动发生,无需设置。

当评分请求传入模型时,模型服务会自动检索模型所需的已发布特征值。 这样,最新的特征值将始终用于预测。

此图说明了实时服务的平台组件之间的关系。

使用联机查找的特征存储工作流

按需特征

实时应用程序的机器学习模型通常需要最新的特征值。 在图中所示的示例中,餐厅推荐模型的一项功能是显示用户与餐厅的当前距离。 此功能必须“按需”计算,即在收到评分请求时计算。 收到评分请求后,该模型会查找餐厅的位置,然后应用预定义的函数来计算用户当前位置与餐厅之间的距离。 该距离以及特征存储中的其他预计算特征会作为输入传递给模型。 有关详细信息,请参阅按需计算特征

按需计算功能工作流