将两个 KLL 双草图缓冲区合并为一个。
Syntax
from pyspark.sql import functions as sf
sf.kll_sketch_merge_double(left, right)
参数
| 参数 | 类型 | Description |
|---|---|---|
left |
pyspark.sql.Column 或 str |
第一个 KLL 双素描。 |
right |
pyspark.sql.Column 或 str |
第二个 KLL 双素描。 |
退货
pyspark.sql.Column:合并的 KLL 草图。
例子
示例 1:合并两个 KLL 双草图
from pyspark.sql import functions as sf
df = spark.createDataFrame([1.0,2.0,3.0,4.0,5.0], "DOUBLE")
sketch_df = df.agg(sf.kll_sketch_agg_double("value").alias("sketch"))
result = sketch_df.select(sf.kll_sketch_merge_double("sketch", "sketch")).first()[0]
result is not None and len(result) > 0
True