根据给定输入排名值,从 KLL bigint 草图中提取分位值。 排名可以是单个值或数组。
Syntax
from pyspark.sql import functions as sf
sf.kll_sketch_get_quantile_bigint(sketch, rank)
参数
| 参数 | 类型 | Description |
|---|---|---|
sketch |
pyspark.sql.Column 或 str |
KLL bigint 草图二进制表示形式。 |
rank |
pyspark.sql.Column 或 str |
要提取的排名值(介于 0.0 和 1.0 之间)。 |
退货
pyspark.sql.Column:分位值(s)。
例子
示例 1:从 KLL bigint 草图获取分位
from pyspark.sql import functions as sf
df = spark.createDataFrame([1,2,3,4,5], "INT")
sketch_df = df.agg(sf.kll_sketch_agg_bigint("value").alias("sketch"))
sketch_df.select(sf.kll_sketch_get_quantile_bigint("sketch", sf.lit(0.5))).show()
+-------------------------------------------+
|kll_sketch_get_quantile_bigint(sketch, 0.5)|
+-------------------------------------------+
| 3|
+-------------------------------------------+