使用 Databricks 功能存储时,模型开发过程的每个步骤都会集成到 Databricks 数据智能平台中。 这意味着,在 Databricks 处理基础设施的情况下,您可以构建自动化数据管道来计算和提供特征值功能。 Databricks 平台为特征和模型提供实时服务,包括按需计算特征值。
自动特征查找
使用 Databricks 特征存储进行模型训练并通过 Databricks 模型服务提供时,模型会自动从 Databricks Online 特征存储或第三方在线商店中查找特征值。 这会自动发生,无需设置。
重要
不再支持 Databricks 联机表。 如果您已拥有在线表,Databricks 建议将其迁移到 Databricks 特征库。
当评分请求传入模型时,模型服务会自动检索模型所需的已发布特征值。 这样,最新的特征值将始终用于预测。
此图说明了实时服务的平台组件之间的关系。
按需功能
实时应用程序的机器学习模型通常需要最新的特征值。 在图中所示的示例中,餐厅推荐模型的一项功能是显示用户与餐厅的当前距离。 此功能必须“按需”计算,即在收到评分请求时计算。 收到评分请求后,该模型会查找餐厅的位置,然后应用预定义的函数来计算用户当前位置与餐厅之间的距离。 该距离以及特征存储中的其他预计算特征会作为输入传递给模型。 有关详细信息,请参阅按需计算特性。