映射数据流中的窗口函数

APPLIES TO： Azure Data Factory Azure Synapse Analytics

数据流可在Azure Data Factory管道和Azure Synapse Analytics管道中使用。本文适用于映射数据流。如果你不熟悉转换，请参阅介绍性文章：使用映射数据流转换数据。

本文提供有关映射数据流中Azure Data Factory和Azure Synapse Analytics支持的窗口函数的详细信息。

窗口函数列表

以下函数仅在窗口转换中可用。

窗口函数	任务
cumeDist	计算某个值在分区内相对于所有值的位置。结果是前面的行数，或者等于当前行在分区中的顺序除以窗口分区中的总行数。排序中的任何平局值都计算为相同的位置。
denseRank	计算在窗口的 order by 子句中指定的一组值中的值排名。结果是 1 加上前面的行数，或者等于当前行在分区中的顺序。这些值不会在序列中产生间隙。即使未对数据进行排序并查找值更改，该 `denseRank` 函数也能正常工作。
lag	获取当前行之前`n`行所评估的第一个参数的值。第二个参数是要回溯的行数，默认值为 `1`。如果行数不多，则返回值 `null` ，除非指定了默认值。
lead	获取当前行后计算出的第一个参数在 `n` 行处的值。第二个参数是要期待的行数，默认值为 `1`。如果行数不多，则返回值 `null` ，除非指定了默认值。
nTile	将每个窗口分区的行划分为 `n` 个存储桶，范围从 `1` 到最多 `n`。存储桶值相差最多`1`。如果分区中的行数不均匀划分为存储桶数，则从第一个存储桶开始，其余值按存储桶分布一个。 `NTile` 函数适合用于计算 `tertiles`、四分位数、十分位数和其他常见的摘要统计数据。该函数在初始化期间计算两个变量。常规存储桶的大小增加了一个额外的行。这两个变量都以当前分区的大小为基础。在计算过程中，函数会跟踪当前行号、当前存储桶号和存储桶更改的行号（`bucketThreshold`）。当当前行号达到存储桶阈值时，存储桶值将增加一个。阈值按桶的大小增加（如果当前桶有填充，则额外增加一个）。
rank	计算在窗口的 order by 子句中指定的一组值中的值排名。结果是 1 加上前面的行数，或者等于当前行在分区中的顺序。这些值在序列中产生间隙。即使未对数据进行排序并查找值更改，该 `rank` 函数也能正常工作。
rowNumber	为从`1`开始的窗口中的行分配顺序行编号。

所有聚合函数的列表。
所有数组函数的列表。
所有高速缓存的查找函数的列表。
所有转换函数的列表。
所有日期和时间函数的列表。
所有表达式函数的列表。
所有地图函数的列表。
所有元函数的列表。
所有数据转换表达式的使用情况详细信息。
了解如何使用表达式生成器。

Last updated on 2026-04-22