Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
从给定输入分位值的 KLL 双素描中提取排名值。 分位可以是单个值或数组。
Syntax
from pyspark.sql import functions as sf
sf.kll_sketch_get_rank_double(sketch, quantile)
参数
| 参数 | 类型 | Description |
|---|---|---|
sketch |
pyspark.sql.Column 或 str |
KLL 双素描二进制表示形式。 |
quantile |
pyspark.sql.Column 或 str |
要查找的分位值(s)。 |
退货
pyspark.sql.Column:排名值(介于 0.0 和 1.0 之间)。
例子
示例 1:从 KLL 双素描获取排名
from pyspark.sql import functions as sf
df = spark.createDataFrame([1.0,2.0,3.0,4.0,5.0], "DOUBLE")
sketch_df = df.agg(sf.kll_sketch_agg_double("value").alias("sketch"))
sketch_df.select(sf.kll_sketch_get_rank_double("sketch", sf.lit(3.0))).show()
+---------------------------------------+
|kll_sketch_get_rank_double(sketch, 3.0)|
+---------------------------------------+
| 0.6|
+---------------------------------------+