返回 KLL 双素描中收集的项数。
Syntax
from pyspark.sql import functions as sf
sf.kll_sketch_get_n_double(col)
参数
| 参数 | 类型 | Description |
|---|---|---|
col |
pyspark.sql.Column 或 str |
KLL 双素描二进制表示形式。 |
退货
pyspark.sql.Column:草图中的项计数。
例子
示例 1:获取 KLL 双素描中的项计数
from pyspark.sql import functions as sf
df = spark.createDataFrame([1.0,2.0,3.0,4.0,5.0], "DOUBLE")
sketch_df = df.agg(sf.kll_sketch_agg_double("value").alias("sketch"))
sketch_df.select(sf.kll_sketch_get_n_double("sketch")).show()
+-------------------------------+
|kll_sketch_get_n_double(sketch)|
+-------------------------------+
| 5|
+-------------------------------+