bitmap_or_agg 聚合函数

适用于:勾选“是” Databricks SQL 勾选“是” Databricks Runtime 13.3 LTS 及更高版本

返回组中所有 BINARY 输入值的按位 OR

该函数通常与 bitmap_bucket_number()bitmap_count()bitmap_bit_position()bitmap_construct_agg () 函数一起用于对非重复整型数进行计数。

若要以整型数值的形式聚合位图,请使用 bit_or() 聚合函数。 若要将位位置聚合到 BINARY 位图中,请使用 bitmap_construct_agg ()

语法

bitmap_or_agg(expr) [FILTER ( WHERE cond ) ]

还可以使用 OVER 子句将此函数作为窗口函数调用。

自变量

  • exprBINARY 表示位图的长度为 <= 4096。 Azure Databricks 将较长的值截断为 4096。
  • cond:可选的布尔表达式,可筛选用于聚合的行。

返回

长度为 4096 的 BINARY

示例

> SELECT hex(trim(TRAILING X'00' FROM bitmap_or_agg(val))) FROM VALUES(x'10'), (x'02') AS T(val);
 12

-- Count the number of distinct values across two tables
> SELECT sum(num_distinct) AS num_distinct
    FROM (SELECT bucket, bitmap_count(bitmap_or_agg(num_distinct)) AS num_distinct
            FROM ((SELECT bitmap_bucket_number(val) AS bucket,
                          bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
                     FROM VALUES(1), (2), (1), (-1), (5), (0), (5) AS t(val)
                     GROUP BY ALL)
                  UNION ALL
                  (SELECT bitmap_bucket_number(val) AS bucket,
                          bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
                     FROM VALUES(3), (1), (-1), (6), (5), (1), (5), (8) AS t(val)
                     GROUP BY ALL))
            GROUP BY ALL);
  8