explode_outer
表值生成器函数
适用于: Databricks SQL Databricks Runtime
使用 outer 语义通过取消嵌套 collection
返回行集。
在 Databricks SQL 和 Databricks Runtime 13.3 LTS 及更高版本中,此函数支持命名参数调用。
语法
explode_outer(collection)
参数
collection
:ARRAY
或MAP
表达式。
返回
由数组的元素或者映射的键和值组成的行集。
由数组的 explode_outer
生成的列名为 col
。
映射的列名为 key
和 value
。
如果 collection
为 NULL
,则为数组值或映射值生成包含 NULL
的单个行。
若要在 collection
为 NULL
时不返回任何行,请使用 explode() 函数。
适用于: Databricks Runtime 12.1 及更早版本:
explode_outer
只能作为表达式的根或跟在 LATERAL VIEW 之后放入SELECT
列表中。 将该函数放入SELECT
列表中时,同一个SELECT
列表中不得有其他生成器函数,否则会引发 UNSUPPORTED_GENERATOR.MULTI_GENERATOR。适用于: Databricks SQL Databricks Runtime 12.2 LTS 及更高版本:
从 LATERAL VIEW 子句或
SELECT
列表调用的语法已弃用。 请改为将explode_outer
作为 table_reference 调用。
示例
适用于: Databricks Runtime 12.1 及更早版本:
> SELECT explode_outer(array(10, 20)) AS elem, 'Spark';
10 Spark
20 Spark
> SELECT explode_outer(collection => array(10, 20)) AS elem, 'Spark';
10 Spark
20 Spark
> SELECT explode_outer(map(1, 'a', 2, 'b')) AS (num, val), 'Spark';
1 a Spark
2 b Spark
> SELECT explode_outer(cast(NULL AS array<int>)), 'Spark';
NULL Spark
> SELECT explode_outer(array(1, 2)), explode_outer(array(3, 4));
Error: UNSUPPORTED_GENERATOR.MULTI_GENERATOR
-- The difference between explode() and explode_outer() is that explode_outer() returns NULL if the array is NULL.
> SELECT explode_outer(c1) AS elem, 'Spark' FROM VALUES(array(10, 20)), (null) AS T(c1);
10 Spark
20 Spark
NULL Spark
> SELECT explode(c1) AS elem, 'Spark' FROM VALUES(array(10, 20)), (null) AS T(c1);
10 Spark
20 Spark
适用于: Databricks SQL Databricks Runtime 12.2 LTS 及更高版本:
> SELECT elem, 'Spark' FROM explode_outer(array(10, 20)) AS t(elem);
10 Spark
20 Spark
> SELECT num, val, 'Spark' FROM explode_outer(map(1, 'a', 2, 'b')) AS t(num, val);
1 a Spark
2 b Spark
> SELECT * FROM explode_outer(array(1, 2)), explode_outer(array(3, 4));
1 3
1 4
2 3
2 4
> SELECT * FROM explode_outer(cast(NULL AS array<int>));
NULL
-- Using lateral correlation in Databricks 12.2 and above
> SELECT * FROM explode_outer(array(1, 2)) AS t, LATERAL explode_outer(array(3 * t.col, 4 * t.col));
1 3
1 4
2 6
2 8