try_zstd_decompress

使用 Zstandard 返回 expr 的解压缩值。 支持在单传递模式和流式处理模式下压缩的数据。 解压缩失败时,它将返回 NULL。

Syntax

from pyspark.databricks.sql import functions as dbf

dbf.try_zstd_decompress(input=<input>)

参数

参数 类型 Description
input pyspark.sql.Columnstr 要解压缩的二进制值。

退货

pyspark.sql.Column:包含未压缩值的新列。

例子

示例 1:使用 Zstandard 解压缩数据

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("KLUv/SCCpQAAaEFwYWNoZSBTcGFyayABABLS+QU=",)], ["input"])
df.select(dbf.try_zstd_decompress(dbf.unbase64(df.input)).cast("string").alias("result")).show(truncate=False)
+----------------------------------------------------------------------------------------------------------------------------------+
|result                                                                                                                            |
+----------------------------------------------------------------------------------------------------------------------------------+
|Apache Spark Apache Spark Apache Spark Apache Spark Apache Spark Apache Spark Apache Spark Apache Spark Apache Spark Apache Spark |
+----------------------------------------------------------------------------------------------------------------------------------+

示例 2:解压缩无效输入

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("invalid input",)], ["input"])
df.select(dbf.try_zstd_decompress(dbf.unbase64(df.input)).cast("string").alias("result")).show(truncate=False)
+------+
|result|
+------+
|NULL  |
+------+