结构化流式处理

结构化流是一个 Apache Spark API,可让你基于流数据表达计算,就像基于静态数据表达批处理计算一样。 结构化流式处理引擎以增量方式执行计算,并在流数据抵达时持续更新结果。 有关结构化流的概述,请参阅 Apache Spark 结构化流编程指南。 以下文章提供了介绍性笔记本、有关如何使用特定类型的流源和接收器、如何将流投入生产的详细信息,以及用于演示示例用例的笔记本:

API 参考

有关结构化流的参考信息,Azure Databricks 建议参阅以下 Apache Spark API 参考文章:

博客

有关如何使用 Apache Spark 执行复杂流分析的详细信息,请参阅以下由多个部分组成的博客系列中的文章:

旧版 Spark 流式处理

有关旧版 Spark 流功能的信息,请参阅: