在服务更新期间保证流分析作业可靠性

作为完全托管服务的一部分的是快速引入新服务功能和改进的能力。 因此,流分析可以每周(或更频繁地)进行服务更新部署。 无论进行多少次测试,由于引入了 bug,仍存在现有正在运行的作业可能会中断的风险。 如果运行的是任务关键型作业,则需要避免这些风险。 可以遵循 Azure 的配对区域模型来降低此风险。

Azure 配对区域如何解决此问题?

流分析可以保证在单独的批处理中更新配对区域中的作业。 每个批都有一个或多个区域,这些区域可以同时更新。 流分析服务可确保任何新更新通过严格的内部通道,以获得最高质量。 该服务还会在部署到每个批次后主动查找许多信号,以便更加确信没有引入任何 bug。 流分析的更新部署不会同时在一组配对区域中进行。 因此,在更新之间具有足够的时间间隔来识别潜在问题并修复它们。

可用性和配对区域 一文具有关于配对区域的最新信息。

建议将相同的作业部署到这两个配对区域。 然后,应该监视这些作业,以便在发生意外情况时收到通知。 如果其中一个作业在流分析服务更新后以失败状态结束,则可以联系客户支持以帮助确定根本原因。 还应将任何下游使用者故障转移到正常作业输出。

后续步骤