Compartir a través de

covar_samp

返回 col1 和 col2 样本协方差的新列。

Syntax

from pyspark.sql import functions as sf

sf.covar_samp(col1, col2)

参数

参数 类型 Description
col1 pyspark.sql.Column 或列名 计算协变的第一列。
col2 pyspark.sql.Column 或列名 要计算协变的第二列。

退货

pyspark.sql.Column:这两个列值的示例协变。

例子

from pyspark.sql import functions as sf
a = [1] * 10
b = [1] * 10
df = spark.createDataFrame(zip(a, b), ["a", "b"])
df.agg(sf.covar_samp("a", df.b)).show()
+----------------+
|covar_samp(a, b)|
+----------------+
|             0.0|
+----------------+