theta_difference 函数

适用于:检查标记为“是”的 Databricks SQL 检查标记为“是”是 Databricks Runtime 18.0 及更高版本

计算两个 Theta Sketch 二进制表示形式的集差(A 减 B)。 返回的草图仅包含显示在第一个草图中但不出现在第二个草图中的值。

Syntax

theta_difference ( first, second )

Arguments

  • 首先:二进制格式的 Theta 草图(设置 A)。
  • second: A Theta Sketch in binary format (set B) .

退货

一个 BINARY 值,该值包含表示集差的序列化 Theta Sketch (A - B)。

备注

  • 该作不是通勤的: theta_difference(A, B)theta_difference(B, A)
  • 结果包含显示在第一个草图中但不出现在第二个草图中的值。

错误消息

示例

-- Find values in first sketch but not in second
> SELECT theta_sketch_estimate(theta_difference(theta_sketch_agg(col1), theta_sketch_agg(col2)))
  FROM VALUES (5, 4), (1, 4), (2, 5), (2, 5), (3, 1) tab(col1, col2);
2