explode
表值生成器函数
适用于: Databricks SQL Databricks Runtime
通过取消嵌套 collection
返回行集。
在 Databricks SQL 和 Databricks Runtime 13.3 LTS 及更高版本中,此函数支持命名参数调用。
语法
explode(collection)
参数
collection
:ARRAY
或MAP
表达式。
返回
由数组的元素或者映射的键和值组成的行集。
由数组的 explode
生成的列名为 col
。
映射的列名为 key
和 value
。
如果 collection
为 NULL
,则不会生成任何行。 若要对数组或映射值返回具有 NULL
的单行,请使用 explode_outer() 函数。
适用于: Databricks Runtime 12.1 及更早版本:
explode
只能作为表达式的根或跟在 LATERAL VIEW 之后放入SELECT
列表中。 将该函数放入SELECT
列表中时,同一个SELECT
列表中不得有其他生成器函数,否则会引发 UNSUPPORTED_GENERATOR.MULTI_GENERATOR。适用于: Databricks SQL Databricks Runtime 12.2 LTS 及更高版本:
从 LATERAL VIEW 子句或
SELECT
列表调用的语法已弃用。 请改为将explode
作为 table_reference 调用。
示例
适用于:Databricks SQL Databricks Runtime 12.1 及更低版本:
> SELECT explode(array(10, 20)) AS elem, 'Spark';
10 Spark
20 Spark
> SELECT explode(map(1, 'a', 2, 'b')) AS (num, val), 'Spark';
1 a Spark
2 b Spark
> SELECT explode(array(1, 2)), explode(array(3, 4));
Error: UNSUPPORTED_GENERATOR.MULTI_GENERATOR
-- The difference between explode() and explode_outer() is that explode_outer() returns NULL if the array is NULL.
> SELECT explode_outer(c1) AS elem, 'Spark' FROM VALUES(array(10, 20)), (null) AS T(c1);
10 Spark
20 Spark
NULL Spark
> SELECT explode(c1) AS elem, 'Spark' FROM VALUES(array(10, 20)), (null) AS T(c1);
10 Spark
20 Spark
适用于: Databricks SQL Databricks Runtime 12.2 LTS 及更高版本:
> SELECT elem, 'Spark' FROM explode(array(10, 20)) AS t(elem);
10 Spark
20 Spark
> SELECT num, val, 'Spark' FROM explode(map(1, 'a', 2, 'b')) AS t(num, val);
1 a Spark
2 b Spark
> SELECT * FROM explode(array(1, 2)), explode(array(3, 4));
1 3
1 4
2 3
2 4
-- Using lateral correlation in Databricks 12.2 and above
> SELECT * FROM explode(array(1, 2)) AS t, LATERAL explode(array(3 * t.col, 4 * t.col));
1 3
1 4
2 6
2 8