theta_intersection_agg 聚合函数

适用于:检查标记为“是”的 Databricks SQL 检查标记为“是”是 Databricks Runtime 18.0 及更高版本

使用多个 Theta Sketch 缓冲区并将其相交到一个结果缓冲区中。 返回所有输入草图中显示的非重复值的近似计数。

Syntax

theta_intersection_agg ( sketch )

Arguments

退货

一个 BINARY 值,该值包含表示所有输入草图交集的序列化 Theta Sketch。

备注

  • NULL 聚合期间忽略值。
  • 交集结果表示所有输入草图中显示的值。
  • 若要与两个草图相交,请改用标量 theta_intersection 函数

错误消息

示例

-- Find approximate count of values appearing in all sketches
> SELECT theta_sketch_estimate(theta_intersection_agg(sketch)) FROM (
    SELECT theta_sketch_agg(col) AS sketch FROM VALUES (1), (2), (3) AS tab(col)
    UNION ALL
    SELECT theta_sketch_agg(col) AS sketch FROM VALUES (2), (3), (4) AS tab(col)
    UNION ALL
    SELECT theta_sketch_agg(col) AS sketch FROM VALUES (3), (4), (5) AS tab(col)
  ) t;
1