summarize 运算符

使用 “版本 ”下拉列表切换服务。了解有关导航的详细信息。
适用于：✅ Azure Data Explorer ✅ Azure Monitor ✅ Microsoft Sentinel

生成可聚合输入表内容的表。

语法

T| summarize [ SummarizeParameters ] [[Column=] Aggregation [, ...]] [ [byColumn=] GroupExpression [, ...]]

详细了解语法约定。

参数

客户	类型	必需	说明
列	`string`		结果列的名称。默认为派生自表达式的名称。
聚合	`string`	✔️	对聚合函数（例如 `count()` 或 `avg()`）的调用，以列名作为参数。
GroupExpression	标量 (scalar)	✔️	一个可以引用输入数据的标量表达式。输出包含任意数量的记录，因为所有组表达式都有不同的值。
SummarizeParameters	`string`		零个或多个空格分隔 Name Value 形式的参数，用于控制行为`=`。请参阅支持的参数。

注意

当输入表为空时，输出取决于是否使用了 GroupExpression：

如果未提供 GroupExpression ，则输出为单个（空）行。
如果提供了 GroupExpression ，则输出没有行。

支持的参数

客户	说明
`hint.num_partitions`	指定用于在群集节点上共享查询负载的分区数。请参阅随机执行查询
`hint.shufflekey=<key>`	`shufflekey` 查询使用键将数据分区，在群集节点上共享查询负载。请参阅随机执行查询
`hint.strategy=shuffle`	`shuffle` 策略查询会在群集节点上共享查询负载，其中的每个节点将处理一个数据分区。请参阅随机执行查询

输入行将排列成与 by 表达式具有相同值的组。然后，对每个组计算指定的聚合函数，从而为每组生成行。结果包含 by 列，还至少包含用于每个计算聚合的一列。（某些聚合函数返回多个列。）

结果具有任意多行，因为值的不同组合 by （可能为零）。如果未提供任何组键，则结果将包含单个记录。

若要基于数值范围进行汇总，请使用 bin() 将范围减小为离散值。

注意

尽管可为聚合和分组表达式提供任意表达式，但使用简单列名称或将 bin() 应用于数值列会更加高效。
不再支持日期/时间列的自动每小时箱。请改用显式分箱。例如 summarize by bin(timestamp, 1h)。

聚合的默认值

下表汇总了聚合的默认值：

运算符	默认值
`count()`，`countif()`，`dcount()`，`dcountif()`，`count_distinct()`，`sum()`，`sumif()`，`variance()`，`varianceif()`，`stdev()`，`stdevif()`	0
`make_bag()`，`make_bag_if()`，`make_list()`，`make_list_if()`，`make_set()`，`make_set_if()`	空的动态数组 ([])
所有其他	null

注意

将这些聚合应用于包含 null 值的实体时，将忽略 null 值，并且不会将其纳入计算。请参阅示例。

示例

本文中的示例使用 help 群集中的公开可用的表，例如 Samples 数据库中的 StormEvents 表。

下面的示例确定导致直接受伤的风暴的唯一组合和State存在什么组合EventType。没有聚合函数，只是有分组依据键。输出仅显示这些结果的列。

运行查询

StormEvents
| where InjuriesDirect > 0
| summarize by State, EventType

输出

下表仅显示了前 5 行。若要查看完整输出，请运行查询。

状态	事件类型
德克萨斯	雷雨大风
德克萨斯	山洪
德克萨斯	冬季天气
德克萨斯	疾风
德克萨斯	洪水
...	...

以下示例查找夏威夷的最小和最大暴雨。没有 group-by 子句，因此输出中只有一行。

运行查询

StormEvents
| where State == "HAWAII" and EventType == "Heavy Rain"
| project Duration = EndTime - StartTime
| summarize Min = min(Duration), Max = max(Duration)

输出

最小值	麦克斯
01:08:00	11:55:00

以下示例计算每个状态的唯一 storm 事件类型数，并按唯一风暴类型数对结果进行排序：

运行查询

StormEvents
| summarize TypesOfStorms=dcount(EventType) by State
| sort by TypesOfStorms

输出

下表仅显示了前 5 行。若要查看完整输出，请运行查询。

状态	TypesOfStorms
德克萨斯	二十七
加州	26
宾夕法尼亚州	二十五
佐治亚州	24
伊利诺伊州	23
...	...

以下示例计算持续时间超过 1 天的风暴的直方图风暴事件类型。由于 Duration 有许多值，因此请使用 bin() 将它的值按 1 天的间隔分组。

运行查询

StormEvents
| project EventType, Duration = EndTime - StartTime
| where Duration > 1d
| summarize EventCount=count() by EventType, Length=bin(Duration, 1d)
| sort by Length

输出

事件类型	长度	EventCount
干旱	30.00:00:00	1646
野火	30.00:00:00	11
热	30.00:00:00	14
洪水	30.00:00:00	20
暴雨	29.00:00:00	42
...	...	...

以下示例显示输入表为空时的聚合的默认值。运算符 summarize 用于计算聚合的默认值。当 summarize 运算符的输入至少有一个空的分组依据键时，其结果也将为空。

如果 summarize 运算符的输入没有空的分组依据键，则结果将是在 summarize 中使用的聚合的默认值。有关详细信息，请参阅聚合的默认值。

运行查询

datatable(x:long)[]
| summarize any_x=take_any(x), arg_max_x=arg_max(x, *), arg_min_x=arg_min(x, *), avg(x), buildschema(todynamic(tostring(x))), max(x), min(x), percentile(x, 55), hll(x) ,stdev(x), sum(x), sumif(x, x > 0), tdigest(x), variance(x)

输出

any_x	arg_max_x	arg_min_x	avg_x	schema_x	max_x	min_x	percentile_x_55	hll_x	stdev_x	sum_x	sumif_x	tdigest_x	variance_x
			NAN						0	0	0		0

avg_x(x) 的结果为 NaN，因为被除以 0。

运行查询

datatable(x:long)[]
| summarize  count(x), countif(x > 0) , dcount(x), dcountif(x, x > 0)

输出

count_x	countif_	dcount_x	dcountif_x
0	0	0	0

运行查询

datatable(x:long)[]
| summarize  make_set(x), make_list(x)

输出

set_x	list_x
【】	【】

平均聚合只对非 null 值求和，并且只计算这些值，忽略任何 null 值。

运行查询

range x from 1 to 4 step 1
| extend y = iff(x == 1, real(null), real(5))
| summarize sum(y), avg(y)

输出

sum_y	avg_y
15	5

标准计数函数在其计数中包含 null 值：

运行查询

range x from 1 to 2 step 1
| extend y = iff(x == 1, real(null), real(5))
| summarize count(y)

输出

count_y
2

运行查询

range x from 1 to 2 step 1
| extend y = iff(x == 1, real(null), real(5))
| summarize make_set(y), make_set(y)

输出

set_y	set_y1
[5.0]	[5.0]

Last updated on 2026-02-28

summarize 运算符

语法

参数

支持的参数

返回

聚合的默认值

示例

其他资源