bitmap_construct_agg 聚合函数

适用于:check marked yesDatabricks SQL check marked yes Databricks Runtime 13.3 及更高版本

返回组中所有位位置值的按位 OR。 在组中介于 0 和 32767 之间,作为 BINARY

该函数通常与 bitmap_bucket_number()bitmap_count()bitmap_bit_position() 函数一起用于对一组密集非重复整型数进行计数。

若要以整型数值的形式聚合位图,请使用 bit_or() 聚合函数。

语法

bitmap_construct_agg(expr) [FILTER ( WHERE cond ) ]

还可以使用 OVER 子句将此函数作为窗口函数调用。

参数

  • expr:介于 0 和 32767 之间的整型数值表达式,表示 BINARY 字符串中的位位置。
  • cond:可选的布尔表达式,可筛选用于聚合的行。

返回

长度为 4096 的 BINARY

示例

> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val))) FROM VALUES(0) AS T(val);
 01

> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val))) FROM VALUES(15) AS T(val);
 0080

> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val)))
   FROM VALUES(1), (3), (7), (15), (31) AS T(val);
 8A800080

-- Count the number of distinct values
> SELECT sum(num_distinct) AS num_distinct
    FROM (SELECT bitmap_bucket_number(val),
                 bitmap_count(bitmap_construct_agg(bitmap_bit_position(val)))
            FROM VALUES(1), (2), (1), (-1), (5), (0), (5) AS t(val)
            GROUP BY ALL) AS distinct_vals_by_bucket(bucket, num_distinct)
  5