使用 Zstandard 返回 expr 的解压缩值。 支持在单传递模式和流式处理模式下压缩的数据。 解压缩失败时,它将返回 NULL。
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.try_zstd_decompress(input=<input>)
参数
| 参数 | 类型 | Description |
|---|---|---|
input |
pyspark.sql.Column 或 str |
要解压缩的二进制值。 |
退货
pyspark.sql.Column:包含未压缩值的新列。
例子
示例 1:使用 Zstandard 解压缩数据
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("KLUv/SCCpQAAaEFwYWNoZSBTcGFyayABABLS+QU=",)], ["input"])
df.select(dbf.try_zstd_decompress(dbf.unbase64(df.input)).cast("string").alias("result")).show(truncate=False)
+----------------------------------------------------------------------------------------------------------------------------------+
|result |
+----------------------------------------------------------------------------------------------------------------------------------+
|Apache Spark Apache Spark Apache Spark Apache Spark Apache Spark Apache Spark Apache Spark Apache Spark Apache Spark Apache Spark |
+----------------------------------------------------------------------------------------------------------------------------------+
示例 2:解压缩无效输入
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("invalid input",)], ["input"])
df.select(dbf.try_zstd_decompress(dbf.unbase64(df.input)).cast("string").alias("result")).show(truncate=False)
+------+
|result|
+------+
|NULL |
+------+