适用于:
Databricks SQL
Databricks Runtime 18.0 及更高版本
使用多个 Theta Sketch 缓冲区并将其相交到一个结果缓冲区中。 返回所有输入草图中显示的非重复值的近似计数。
Syntax
theta_intersection_agg ( sketch )
Arguments
-
草图:二进制格式的 Theta Sketch(如聚合函数)。
theta_sketch_agg
退货
一个 BINARY 值,该值包含表示所有输入草图交集的序列化 Theta Sketch。
备注
-
NULL聚合期间忽略值。 - 交集结果表示所有输入草图中显示的值。
- 若要与两个草图相交,请改用标量
theta_intersection函数 。
错误消息
示例
-- Find approximate count of values appearing in all sketches
> SELECT theta_sketch_estimate(theta_intersection_agg(sketch)) FROM (
SELECT theta_sketch_agg(col) AS sketch FROM VALUES (1), (2), (3) AS tab(col)
UNION ALL
SELECT theta_sketch_agg(col) AS sketch FROM VALUES (2), (3), (4) AS tab(col)
UNION ALL
SELECT theta_sketch_agg(col) AS sketch FROM VALUES (3), (4), (5) AS tab(col)
) t;
1