将两个 KLL 浮点图缓冲区合并为一个。
Syntax
from pyspark.sql import functions as sf
sf.kll_sketch_merge_float(left, right)
参数
| 参数 | 类型 | Description |
|---|---|---|
left |
pyspark.sql.Column 或 str |
第一个 KLL 浮点素描。 |
right |
pyspark.sql.Column 或 str |
第二个 KLL 浮点素描。 |
退货
pyspark.sql.Column:合并的 KLL 草图。
例子
示例 1:合并两个 KLL 浮点图
from pyspark.sql import functions as sf
df = spark.createDataFrame([1.0,2.0,3.0,4.0,5.0], "FLOAT")
sketch_df = df.agg(sf.kll_sketch_agg_float("value").alias("sketch"))
result = sketch_df.select(sf.kll_sketch_merge_float("sketch", "sketch")).first()[0]
result is not None and len(result) > 0
True