返回 col1 和 col2 样本协方差的新列。
Syntax
from pyspark.sql import functions as sf
sf.covar_samp(col1, col2)
参数
| 参数 | 类型 | Description |
|---|---|---|
col1 |
pyspark.sql.Column 或列名 |
计算协变的第一列。 |
col2 |
pyspark.sql.Column 或列名 |
要计算协变的第二列。 |
退货
pyspark.sql.Column:这两个列值的示例协变。
例子
from pyspark.sql import functions as sf
a = [1] * 10
b = [1] * 10
df = spark.createDataFrame(zip(a, b), ["a", "b"])
df.agg(sf.covar_samp("a", df.b)).show()
+----------------+
|covar_samp(a, b)|
+----------------+
| 0.0|
+----------------+