使用机器学习工作室（经典）函数缩放流分析作业

2024-09-02

重要

对 Azure 机器学习工作室（经典）的支持将于 2024 年 8 月 31 日结束。建议在该日期之前转换到 Azure 机器学习。

自 2021 年 12 月 1 日起，无法创建新的机器学习工作室（经典）资源（工作区和 Web 服务计划）。在 2024 年 8 月 31 日之前，可继续使用现有的机器学习工作室（经典）试验和 Web 服务。有关详细信息，请参阅：

什么是 Azure 机器学习？

机器学习工作室（经典版）文档即将停用，未来可能不再更新。

本文介绍如何高效地缩放使用机器学习工作室（经典）函数的 Azure 流分析作业。有关如何缩放流分析作业的常规信息，请参阅文章缩放作业。

什么是流分析中的工作室（经典）函数？

流分析中机器学习工作室（经典）函数的用法与流分析查询语言中常规函数调用的用法类似。但在幕后，这些函数调用实际上是工作室（经典）Web 服务请求。

可以通过在同一个 Web 服务 API 调用中“批处理”多个行来提高工作室（经典）Web 服务请求的吞吐量。这种分组称为微型批。有关详细信息，请参阅机器学习工作室（经典）Web 服务。流分析支持工作室（经典）。

配置采用工作室（经典）函数的流分析作业

可通过两个参数来配置流分析作业使用的工作室（经典）函数：

工作室（经典）函数调用的批大小。
为流分析作业预配的流单元 (SU) 数。

若要确定适当的 SU 值，请决定是要优化流分析作业的延迟，还是优化每个 SU 的吞吐量。可能会始终将 SU 添加到某个作业，以提高适当分区的流分析查询的吞吐量。增加 SU 会增大运行作业的成本。

确定流分析作业的延迟容限。增大批大小会增大工作室（经典）请求的延迟以及流分析作业的延迟。

增大批大小可让流分析作业使用相同数量的工作室（经典）Web 服务请求来处理更多的事件。工作室（经典）Web 服务延迟增大与批大小增大之间通常呈亚线性关系。

在任意给定情况下，必须考虑为工作室（经典）Web 服务选择最经济高效的批大小。 Web 服务请求的默认批大小为 1000。可以使用流分析 REST API 或适用于流分析的 PowerShell 客户端来更改此默认大小。

确定批大小后，可根据函数每秒需要处理的事件数来设置流单元 (SU) 数量。有关流式处理单位的详细信息，请参阅流分析缩放作业。

每 6 个 SU 可与工作室（经典）Web 服务建立 20 个并发连接。但是，1 个 SU 作业和 3 个 SU 作业可建立 20 个并发连接。

如果应用程序每秒生成 200,000 个事件，并且批大小为 1000，则造成的 Web 服务延迟为 200 毫秒。这种速率意味着，每个连接在每秒内可向工作室（经典）Web 服务发出 5 个请求。通过 20 个连接，流分析作业可在 200 毫秒内处理 20,000 个事件，在 1 秒内可处理 100,000 个事件。

若要每秒处理 200,000 个事件，流分析作业需要 40 个并发连接，也就是 12 个 SU。下图显示了从流分析作业到工作室（经典）Web 服务终结点的请求：每 6 个 SU 最多有 20 个到工作室（经典）Web 服务的并发连接。

缩放采用工作室（经典）函数的流分析 - 两作业示例

一般情况下，“B”代表批大小、“L”代表批大小为 B 时的 Web 服务延迟（以毫秒为单位），“N”个 SU 的流分析作业的吞吐量为：

缩放采用工作室（经典）函数的流分析 - 公式

你还可以在工作室（经典）Web 服务中配置“最大并发调用数”。建议将此参数设置为最大值（目前为 200）。

有关此设置的详细信息，请参阅机器学习工作室（经典）Web 服务的缩放文章。

示例 – 情绪分析

以下示例包含具有情绪分析工作室（经典）函数的流分析作业，如流分析机器学习工作室（经典）集成教程所述。

查询是简单的、已完全分区的查询，后跟情绪函数，如以下示例所示：

    WITH subquery AS (
        SELECT text, sentiment(text) as result from input
    )

    Select text, result.[Score]
    Into output
    From subquery

让我们了解创建一个流分析作业所需的配置。该作业以每秒处理 10,000 个推文的速率对推文执行情绪分析。

此流分析作业使用 1 个 SU 是否能够处理这种流量？使用默认批大小 1000，该作业应该能够跟上输入速度。使用情绪分析工作室（经典）Web 服务（默认批大小为 1000）的默认延迟时，延迟不超过 1 秒。

流分析作业的 总延迟 或端到端延迟通常只有几秒钟。更深入地了解此流分析作业，尤其是工作室（经典）函数调用。如果批大小为 1000，则 10,000 个事件的吞吐量将向 Web 服务发送大约 10 个请求。即使使用一个 SU，也有足够的并发连接可以容纳此输入流量。

如果输入事件率增加 100 倍，而流分析作业需要每秒处理 1000000 条推文。有两个选项来完成增加的规模：

增加批大小。
将输入流分区以并行处理事件。

如果使用第一个选项，作业延迟将增加。

如果使用第二个选项，则必须预配更多的 SU 才能发出更多的工作室（经典）Web 服务并发请求。增加 SU 也会增大作业成本。

让我们了解如何使用每个批大小的以下延迟度量值进行缩放：

延迟	批大小
200 毫秒	包含 1000 个或更少事件的批
250 毫秒	包含 5,000 个事件的批
300 毫秒	包含 1,000 个事件的批
500 毫秒	包含 25,000 个事件的批

使用第一个选项（不预配更多的 SU）。批大小可能会增加到 25000。以这种方式增大批大小可让作业处理 1,000,000 个事件，并且可与工作室（经典）Web 服务建立 20 个并发连接（每个调用的延迟为 500 毫秒）。所以，由于 sentiment 函数请求基于工作室（经典）Web 服务请求，流分析作业的额外延迟将从 200 毫秒增加到 500 毫秒。然而，批大小不可无限制增加，因为工作室（经典）Web 服务要求一个请求的有效负载大小为 4 MB 或更小，而 Web 服务请求会在 100 秒操作后超时。
如果使用第二个选项，批大小仍为 1000，Web 服务延迟为 200 毫秒，每 20 个 Web 服务的并发连接每秒能够处理 1000 * 20 * 5 个事件，即 100,000 个事件。因此，若要每秒处理 1,000,000 个事件，作业需要 60 个 SU。与第一个选项相比，流分析作业会提出更多 Web 服务批处理请求，从而导致成本增加。

下表介绍了不同 SU 和批大小（以每秒事件数为单位）的流分析作业的吞吐量。

批大小（ML 延迟）	500（200 毫秒）	1000（200 毫秒）	5,000（250 毫秒）	10,000（300 毫秒）	25,000（500 毫秒）
1 个 SU	2,500	5,000	20,000	30,000	50,000
3 个 SU	2,500	5,000	20,000	30,000	50,000
6 个 SU	2,500	5,000	20,000	30,000	50,000
12 个 SU	5,000	10,000	40,000	60,000	100,000
18 个 SU	7,500	15,000	60,000	90,000	150,000
24 个 SU	10,000	20,000	80,000	120,000	200,000
…	…	…	…	…	…
60 个 SU	25,000	50,000	200,000	300,000	500,000

到目前为止，你应该已经对流分析中工作室（经典）函数的工作方式有了较好的了解。可能还知道流分析作业从数据源中“拉取”数据，并且每次“拉取”都会返回一批供流分析作业处理的事件。这种拉取模型如何影响工作室（经典）Web 服务请求？

通常情况下，我们为工作室（经典）函数设置的批大小不会被每个流分析作业的“拉取”操作返回的事件数整除。如果发生这种情况，将通过“部分”批处理调用工作室（经典）Web 服务。使用部分批可避免在合并拉取间的事件时造成其他作业延迟开销。

在流分析作业的“监视”区域中，已添加了其他三个的函数相关的指标。它们是“函数请求数”、“函数事件数”和“失败的函数请求数”，如下图所示。

缩放采用工作室（经典）函数的流分析 - 指标

它们的定义如下：

函数请求数：函数请求的数量。

函数事件数：函数请求数中的事件数。

失败的函数请求数：失败的函数请求数量。

关键点

若要缩放采用工作室（经典）函数的流分析作业，请考虑以下因素：

输入事件速率。
运行的流分析作业所允许的延迟（以及工作室（经典）Web 服务请求的批大小）。
预配的流分析 SU 和工作室（经典）Web 服务请求数（与函数相关的额外成本）。

以完全分区的流分析查询为例。如果需要更复杂的查询，有关 Azure 流分析的 Microsoft Q&A 问题页面是一项绝佳资源，可以获取流分析团队的额外帮助。

后续步骤

若要了解流分析的更多内容，请参阅：

通过

使用机器学习工作室（经典）函数缩放流分析作业

什么是流分析中的工作室（经典）函数？

配置采用工作室（经典）函数的流分析作业

示例 – 情绪分析

函数相关的新监控指标

关键点

后续步骤

其他资源