适用于:
Databricks SQL
Databricks Runtime 18.0 及更高版本
使用集联合合并两个 Theta Sketch 二进制表示形式。
Syntax
theta_union ( first, second [, lgNomEntries ] )
Arguments
- first:采用二进制格式的 Theta Sketch。
- second:采用二进制格式的 Theta Sketch。
-
lgNomEntries:指定联合缓冲区名义条目的 log-base-2 的可选
INTEGER文本。 必须介于 4 到 26 之间(含)。 默认值为 12。
退货
一个 BINARY 值,该值包含表示两个输入草图的并集的序列化 Theta Sketch。
备注
- 联合作处理具有不同
lgNomEntries值的输入草图。 - 若要合并两个以上的草图,请改用聚合
theta_union_agg函数函数。
错误消息
示例
-- Union two sketches
> SELECT theta_sketch_estimate(theta_union(theta_sketch_agg(col1), theta_sketch_agg(col2)))
FROM VALUES (1, 4), (1, 4), (2, 5), (2, 5), (3, 6) tab(col1, col2);
6