Compartir a través de

percent_rank(百分比排名)

Window 函数:返回窗口分区中行的相对排名(即百分位)。

Syntax

from pyspark.sql import functions as sf

sf.percent_rank()

参数

此函数不采用任何参数。

退货

pyspark.sql.Column:用于计算相对排名的列。

例子

from pyspark.sql import functions as sf
from pyspark.sql import Window
df = spark.createDataFrame([1, 1, 2, 3, 3, 4], "int")
w = Window.orderBy("value")
df.withColumn("pr", sf.percent_rank().over(w)).show()
+-----+---+
|value| pr|
+-----+---+
|    1|0.0|
|    1|0.0|
|    2|0.4|
|    3|0.6|
|    3|0.6|
|    4|1.0|
+-----+---+