collect_set
聚合函数
适用于: Databricks SQL Databricks Runtime
返回一个数组,该数组由组内 expr
中的所有唯一值组成。
语法
collect_set(expr) [FILTER ( WHERE cond ) ]
还可以使用 OVER
子句将此函数作为窗口函数调用。
参数
expr
:除MAP
以外任何类型的表达式。cond
:可选的布尔表达式,可筛选用于聚合的行。
返回
参数类型的 ARRAY。
数组中元素的顺序不确定。 排除 NULL 值。
示例
> SELECT collect_set(col) FROM VALUES (1), (2), (NULL), (1) AS tab(col);
[1,2]
> SELECT collect_set(col1) FILTER(WHERE col2 = 10)
FROM VALUES (1, 10), (2, 10), (NULL, 10), (1, 10), (3, 12) AS tab(col1, col2);
[1,2]