优化 Azure Functions 的性能和可靠性

本文为提高无服务器函数应用的性能和可靠性提供了指南。 如需了解一套更通用的 Azure Functions 最佳做法,请参阅 Azure Functions 最佳做法

下面是有关如何使用 Azure Functions 生成和构建无服务器解决方案的最佳做法。

避免使用长时间运行的函数

长时间运行的大型函数可能会引起意外超时问题。 若要详细了解给定托管计划的超时,请参阅函数应用超时持续时间

由于含有许多 Node.js 依赖项,函数规模可能会变得很大。 导入依赖项也会导致加载时间增加,引起意外的超时问题。 显式和隐式加载依赖项。 由代码加载的单个模块可能会加载自己的附加模块。

尽可能将大型函数重构为可协同工作且快速返回响应的较小函数集。 例如,webhook 或 HTTP 触发器函数可能需要在特定时间限制内确认响应;webhook 需要快速响应,这很常见。 可将 HTTP 触发器有效负载传递到由队列触发器函数处理的队列。 此方法允许延迟实际工作并返回即时响应。

确保后台任务完成

当函数启动任何任务、回调、线程或进程时,它们必须在函数代码返回之前完成。 由于 Functions 不会跟踪这些后台线程,因此无论后台线程状态如何,站点关闭都可能发生,这可能会导致 Functions 中出现意外行为。

例如,如果函数启动后台任务并在任务完成之前返回成功响应,不管后台任务的结果如何,Functions 运行时都将认为执行已成功完成。 如果此后台任务正在执行基本工作,则站点关闭可能会抢占该任务,从而使该工作处于未知状态。

跨函数通信

Durable FunctionsAzure 逻辑应用用于管理状态转换以及多个函数之间的通信。

如果不使用 Durable Functions 或逻辑应用来集成多个函数,则最好是将存储队列用于跨函数通信。 主要原因是与其他存储选项相比,存储队列成本更低且更易预配。

存储队列中各消息的大小限制为 64 KB。 如果需要在函数之间传递更大的消息,可使用 Azure 服务总线队列,以在标准层中支持最大为 256 KB 的消息大小,在高级层中最大为 100 MB 的消息大小。

如果在处理前需要筛选消息,则服务总线主题十分有用。

对于支持大容量通信,事件中心十分有用。

将函数编写为无状态

如有可能,函数应为无状态和幂等。 将任意所需状态信息与数据关联。 例如,正在处理的排序可能具有关联的 state 成员。 函数本身保持无状态时,该函数可根据该状态处理排序。

对于计时器触发器,特别建议采用幂等函数。 例如,如果有必须每天运行一次的内容,则编写它,使它可在一天内的任何时间运行,并生成相同的结果。 某天没有任何工作时,可退出该函数。 此外,如果未能完成以前的运行,则下次运行应从中断的位置继续运行。 这对于在失败时重试的基于消息的绑定尤其重要。 有关详细信息,请参阅针对完全相同的输入设计 Azure Functions

编写防御函数

假定任何时候函数都可能会遇到异常。 设计函数,使其具有在下次执行期间从上一失败点继续执行的能力。 请考虑需执行以下操作的方案:

  1. 在数据库中进行 10,000 行的查询。
  2. 为每行创建队列消息,从而处理下一行。

根据系统复杂程度,可能有:行为有误的相关下游服务,网络故障或已达配额限制等等。所有这些可在任何时间影响用户的函数。 需设计函数,使其做好该准备。

如果将 5,000 个那些项插入到队列中进行处理,然后发生故障,代码将如何响应? 跟踪已完成的一组中的项。 否则,下次可能再次插入它们。 这种双插入可能会严重影响工作流,因此请将函数设置为幂等

如果已处理队列项,则允许函数不执行任何操作。

利用已为 Azure Functions 平台中使用的组件提供的防御措施。 有关示例,请参阅 Azure 存储队列触发器和绑定文档中的处理有害队列消息

对于基于 HTTP 的函数,请考虑通过 Azure API Management 使用 API 版本控制策略。 例如,如果必须更新基于 HTTP 的函数应用,请将新的更新部署到单独的函数应用,并使用 API Management 修订版或版本将客户端定向到新版本或修订版。 一旦所有客户端都使用该版本或修订版,并且之前的函数应用上不存在任何其他执行,则可以取消预配之前的函数应用。

函数组织最佳做法

你可以在解决方案中开发和发布多个函数。 这些函数通常组合到单个函数应用中,但也可以分别在多个函数应用中运行。 在高级和专用(应用服务)托管计划中,多个函数应用也可以通过在同一计划中运行来共享相同的资源。 函数和函数应用的分组方式会影响整个解决方案的性能、缩放、配置、部署和安全性等方面。 并不存在适用于所有情况的规则,因此在计划和开发函数时,请思考本部分中介绍的内容。

组织函数以改善性能和缩放情况

你创建的每个函数都存在内存占用情况。 虽然这种占用通常很小,但函数应用内的函数过多可能会导致应用在新实例上的启动速度变慢。 这也意味着函数应用的总体内存使用率可能会更高。 我们很难确定单个应用中应该有多少个函数,这取决于特定工作负荷的具体情况。 但是如果函数在内存中存储了大量数据,则应考虑减少单个应用中的函数数量。

如果在一个高级计划或专用(应用服务)计划中运行多个函数应用,那么,这些应用会共享分配到该计划的相同资源。 如果某个函数应用的内存需求量比其他函数应用高出很多,则会在应用部署到的每个实例上使用不成比例的的内存资源量。 这样一来每个实例上的其他应用可用的内存就可能变少,因此可能需要在其单独的托管计划中运行类似于此的高内存使用的函数应用。

注意

使用消耗计划时,建议始终将每个应用置于其自己的计划中,因为无论如何应用都是独立缩放的。 有关详细信息,请参阅同一计划中的多个应用

考虑是否要用不同的负载配置文件对函数进行分组。 例如,如果将某个函数用于处理成千上万的队列消息,而只是偶尔调用某个内存需求量大的函数,那么可能需要将它们部署到不同的函数应用中,以便让它们获取自己的资源集,且相互独立地进行缩放。

组织函数以进行配置和部署

函数应用具有一个 host.json 文件,该文件用于配置函数触发器和 Azure Functions 运行时的高级行为。 对文件所做的更改 host.json 会应用于应用中的所有函数。 如果某些函数需要自定义配置,请考虑将它们移动到其自己的函数应用中。

本地项目中的所有函数会作为一组文件一起部署至 Azure 中的函数应用。 你可能需要单独部署单个函数,或仅将部署槽位用于部分函数。 在这种情况下,应将这些单独代码项目中的函数部署到不同的函数应用。

按权限组织函数

应用程序设置中存储的连接字符串和其他凭据为函数应用中的所有函数提供了关联资源中相同的权限集。 请考虑将具有特定凭据访问权限的函数数量降至最少,具体方法是将不使用这些凭据的函数移动到单独的函数应用中。 你始终可以使用诸如函数链之类的技术在不同函数应用中的函数之间传递数据。

可伸缩性最佳做法

有许多因素会影响函数应用实例的缩放方式。 有关函数缩放的文档中提供了详细信息。 下面是确保以最佳方式缩放函数应用的最佳做法。

共享和管理连接

只要可能,请重用与外部资源的连接。 请参阅如何管理 Azure Functions 中的连接

避免共享存储帐户

创建函数应用时,必须将其与存储帐户相关联。 存储帐户连接在 AzureWebJobsStorage 应用程序设置中进行维护。

若要最大程度地提高性能,请对每个函数应用使用单独的存储帐户。 如果有 Durable Functions 或事件中心触发的函数,则请注意,这两种函数都会产生大量存储事务,这一点特别重要。 当应用程序逻辑与 Azure 存储交互时,无论是直接(使用存储 SDK)交互还是通过某个存储绑定进行交互,都应使用专用存储帐户。 例如,如果有事件中心触发的函数将一些数据写入 Blob 存储,请使用两个存储帐户,一个用于函数应用,另一个用于由函数存储的 Blob。

请勿在同一函数应用中混合测试和生产代码

Function App 中的各函数共享资源。 例如,共享内存。 如果生产中使用的是 Function App,则请勿向其添加与测试相关的函数和资源。 生产代码执行期间,这可能会导致意外的开销。

请注意在生产 Function App 中加载的内容。 将内存平均分配给应用中的每个函数。

如果在多个 .NET 函数中引用共享程序集,请将其放在常用的共享文件夹中。 否则,可能会意外部署在函数之间表现不同的同一二进制的多个版本。

请勿在生产代码中使用详细日志记录,否则会对性能产生负面影响。

使用异步代码,但避免阻止调用

异步编程是推荐的最佳做法,在涉及到阻止 I/O 操作时更是如此。

在 C# 中,请始终避免引用 Result 属性或在 Task 实例上调用 Wait 方法。 这种方法会导致线程耗尽。

提示

如果计划使用 HTTP 或 WebHook 绑定,请制定计划来避免因实例化 HttpClient 不当导致的端口耗尽现象。 有关详细信息,请参阅如何在 Azure Functions 中管理连接

使用多个工作进程

默认情况下,Functions 的任何主机实例均使用单个工作进程。 若要提高性能,尤其是使用单线程运行时(如 Python)的性能,请使用 FUNCTIONS_WORKER_PROCESS_COUNT 增加每个主机的工作进程数(最多 10 个)。 然后,Azure Functions 会尝试在这些工作进程之间平均分配同步函数调用。

FUNCTIONS_WORKER_PROCESS_COUNT 适用于 Functions 在横向扩展应用程序以满足需求时创建的每个主机。

尽量批量接收消息

某些触发器(例如事件中心)允许通过单次调用接收一批消息。 批处理消息可大幅提升性能。 可以根据 host.json 参考文档中的详述,在 host.json 文件中配置最大批大小

对于 C# 函数,可将类型更改为强类型化数组。 例如,方法签名可以是 EventData[] sensorEvent,而不是 EventData sensorEvent。 对于其他语言,需要根据此文所述,在 function.json 中将基数属性显式设置为 many,以启用批处理。

配置主机行为以更好地处理并发性

使用函数应用中的 host.json 文件可以配置主机运行时和触发器行为。 除了批处理行为以外,还可以管理大量触发器的并发性。 调整这些选项中的值往往有助于每个实例根据被调用函数的需求适当缩放。

host.json 文件中的设置应用于应用中的所有函数,以及函数的单个实例。 例如,如果有包含两个 HTTP 函数的函数应用,并且 maxConcurrentRequests 请求设置为 25,则针对任一 HTTP 触发器发出的请求将计入 25 个共享的并发请求。 如果该函数应用扩展到 10 个实例,则十个函数会有效地允许 250 个并发请求(10 个实例 * 每个实例 25 个并发请求)。

可在 host.json 配置文章在找到其他主机配置选项。

后续步骤

有关详细信息,请参阅以下资源: