使用联机工作流中的特征
在 Unity Catalog 中使用特征工程时,模型开发过程的每个步骤都会集成到 Databricks Data Intelligence 平台中。 这意味着,可以在 Databricks 处理基础结构时生成自动化数据管道来计算和提供特征值。 Databricks 平台为特征和模型提供实时服务,包括按需计算特征值。
使用 Databricks 特征工程训练模型并使用 Databricks 模型服务时,模型会自动查找 Databricks 联机表或第三方在线商店中的特征值。 这会自动发生,无需设置。
当评分请求传入模型时,模型服务会自动检索模型所需的已发布特征值。 这样,最新的特征值将始终用于预测。
此图说明了实时服务的平台组件之间的关系。
实时应用程序的机器学习模型通常需要最新的特征值。 在图中所示的示例中,餐厅推荐模型的一项功能是显示用户与餐厅的当前距离。 此功能必须“按需”计算,即在收到评分请求时计算。 收到评分请求后,该模型会查找餐厅的位置,然后应用预定义的函数来计算用户当前位置与餐厅之间的距离。 该距离以及特征存储中的其他预计算特征会作为输入传递给模型。 有关详细信息,请参阅按需计算特征。