变量

适用于:Databricks Runtime check marked yes 14.1 及更高版本

变量是类型化和架构限定对象,用于存储对会话专用的值。 在 Azure Databricks 中,变量是临时的,通过 DECLARE VARIABLE 语句在会话中声明。

术语临时变量会话变量是可互换的。

临时变量所在的架构是 system.session

变量在定义它的会话结束时被隐式删除。 但是,可以使用 DROP VARIABLE 语句提前显式删除它。

定义变量时,其值为 NULL 或可选的指定默认表达式的结果。 可以在会话期间随时使用 SET VARIABLE 语句修改任意数量的变量的值。

在查询中引用时,变量名称列名列别名函数参数名称共享命名空间。 在名称冲突时,变量的解析顺序排在最后。

变量在语义上有三个方面不同于参数标记

  • 参数标记仅存在于单个语句中。 调用 API 必须提供值和类型。 变量存在于会话的持续时间内,允许在多个语句中引用变量,而无需为每个语句传递值。
  • 可以在不离开 SQL 上下文的情况下设置变量。
  • 可以在临时视图和 SQL 函数的主体中引用变量。 引用临时视图或临时 SQL 函数时,将使用其正文中任何变量的当前值。

IDENTIFIER 子句接受变量作为参数。 这样,就可以使用用于设置这些变量的变量和查询的结果参数化标识符

示例

-- A verbose definition of a temporary variable
> DECLARE OR REPLACE VARIABLE myvar INT DEFAULT 17;

-- A dense definition, including derivation of the type from the default expression
> DECLARE address = named_struct('street', 'Grimmauld Place', 'number', 12);

-- Referencing a variable
> SELECT myvar, session.address.number;
 17  12

-- Setting a single variable
> SET VAR myvar = (SELECT max(c1) FROM VALUES (1), (2) AS t(c1));
> SELECT myvar;
  2

-- Setting multiple variables
> SET VAR (myvar, address) = (SELECT address.number, named_struct('street', address.street, 'number', 10));
> SELECT myvar, address;
  12    {"street":"Grimmauld Place","number":10}

-- Drop a variable
> DROP TEMPORARY VARIABLE myvar;
> DROP TEMPORARY VARIABLE IF EXISTS address;

-- Use the IDENTIFIER clause with a variable
> DECLARE view = 'tempv';
> CREATE OR REPLACE TEMPORARY VIEW IDENTIFIER(view) (c1) AS SELECT 1;
> SELECT * FROM IDENTIFIER(view);
  1