dcount_intersect 插件
适用于:✅Azure 数据资源管理器
基于 hll
值(N 在 [2..16] 范围内)计算 N 个集合之间的交集,并返回 N 个 dcount
值。 该插件通过 evaluate
运算符调用。
语法
T | evaluate
dcount_intersect(
hll_1, hll_2, [,
hll_3,
...])
详细了解语法约定。
参数
客户 | 类型 | 必需 | 说明 |
---|---|---|---|
T | string |
✔️ | 输入表格表达式。 |
hll_i | 使用 hll() 函数计算的集 S i 的值。 |
返回
返回一个表,其中包含 N 个 dcount
值(按列,表示交集)。
列名为 s0、s1...(直到 n-1)。
给定集 S1、S2... Sn 返回值将代表以下各项的非重复计数:
S1,
S1 ∩ S2,
S1 ∩ S2 ∩ S3、
... ,
S1 ∩ S2 ∩ ... ∩ Sn
示例
// Generate numbers from 1 to 100
range x from 1 to 100 step 1
| extend isEven = (x % 2 == 0), isMod3 = (x % 3 == 0), isMod5 = (x % 5 == 0)
// Calculate conditional HLL values (note that '0' is included in each of them as additional value, so we will subtract it later)
| summarize hll_even = hll(iif(isEven, x, 0), 2),
hll_mod3 = hll(iif(isMod3, x, 0), 2),
hll_mod5 = hll(iif(isMod5, x, 0), 2)
// Invoke the plugin that calculates dcount intersections
| evaluate dcount_intersect(hll_even, hll_mod3, hll_mod5)
| project evenNumbers = s0 - 1, // 100 / 2 = 50
even_and_mod3 = s1 - 1, // gcd(2,3) = 6, therefor: 100 / 6 = 16
even_and_mod3_and_mod5 = s2 - 1 // gcd(2,3,5) is 30, therefore: 100 / 30 = 3
输出
evenNumbers | even_and_mod3 | even_and_mod3_and_mod5 |
---|---|---|
50 | 16 | 3 |