Compartir a través de

kll_sketch_get_rank_float

从给定输入分位值的 KLL 浮点图中提取排名值。 分位可以是单个值或数组。

Syntax

from pyspark.sql import functions as sf

sf.kll_sketch_get_rank_float(sketch, quantile)

参数

参数 类型 Description
sketch pyspark.sql.Column 或 str KLL 浮点图二进制表示形式。
quantile pyspark.sql.Column 或 str 要查找的分位值(s)。

退货

pyspark.sql.Column:排名值(介于 0.0 和 1.0 之间)。

例子

示例 1:从 KLL 浮点图获取排名

from pyspark.sql import functions as sf
df = spark.createDataFrame([1.0,2.0,3.0,4.0,5.0], "FLOAT")
sketch_df = df.agg(sf.kll_sketch_agg_float("value").alias("sketch"))
sketch_df.select(sf.kll_sketch_get_rank_float("sketch", sf.lit(3.0))).show()
+--------------------------------------+
|kll_sketch_get_rank_float(sketch, 3.0)|
+--------------------------------------+
|                                   0.6|
+--------------------------------------+