名称解析

适用于：勾选“是” Databricks SQL Databricks Runtime

名称解析是将标识符解析为特定列、字段、参数或表引用的过程。

列、字段、参数和变量解析

表达式中的标识符可以是对以下任一项的引用：

基于视图、表、通用表表达式 (CTE) 的列名称，或者 column_alias。
结构或映射中的字段名称或映射键。永远不会取消限定字段和键。
SQL 用户定义的函数或 SQL 过程的参数名称。
会话或 SQL 脚本本地变量名称。
一个不需要使用 current_user 的特殊函数，例如 current_date 或 ()。
在 DEFAULT、INSERT、 UPDATE 或 MERGE 的上下文中用于将列或变量值设置为其默认值的 SET VARIABLE 关键字。

名称解析应用以下原则：

最接近的匹配引用优先，并且
列和参数优先于字段和键。

具体而言，标识符到特定引用的解析按顺序遵循以下规则：

局部引用
1. 列引用
  
  将可能已限定的标识符与的FROM clause中的列名称进行匹配。
  
  如果存在多个此类匹配项，则引发 AMBIGUOUS_COLUMN_OR_FIELD 错误。
2. 无参数函数引用
  
  如果标识符未限定并且与 current_user、current_date 或 current_timestamp 匹配：则将其解析为以下函数之一。
3. 列默认规范
  
  如果标识符未限定、与 default 匹配并且在 UPDATE SET、INSERT VALUES 或 MERGE WHEN [NOT] MATCHED 的上下文中构成了完整表达式：则解析为 DEFAULT、INSERT 或 UPDATE 的目标表的相应 MERGE 值。
4. 结构字段或映射键引用
  
  如果标识符已限定，则根据以下步骤尝试将它与字段或映射键进行匹配：
  
  答：删除最后一个标识符，并将其视为字段或键。 B. 将余下部分与的FROM clause中的列进行匹配。
  
  如果存在多个此类匹配项，则引发 AMBIGUOUS_COLUMN_OR_FIELD 错误。
  
  如果存在匹配项并且列为：
  - STRUCT：匹配字段。
    
    如果无法匹配字段，则引发 FIELD_NOT_FOUND 错误。
    
    如果存在多个字段，则引发 AMBIGUOUS_COLUMN_OR_FIELD 错误。
  - MAP：如果键已限定，则引发错误。
    
    如果映射中实际上不存在密钥，则可能会发生运行时错误。
  - 任何其他类型：引发错误。 C. 重复上述步骤以删除作为字段的尾部标识符。应用规则 (A) 和 (B)，同时保留一个解释为列的标识符。
横向列别名

适用于： Databricks SQL Databricks Runtime 12.2 LTS 及更高版本

如果表达式位于 SELECT 列表中，则将前导标识符与该列表中的上一SELECT进行匹配。

如果存在多个此类匹配项，则引发 AMBIGUOUS_LATERAL_COLUMN_ALIAS 错误。

将余下的每个标识符作为字段或映射键进行匹配，如果无法匹配，则引发 FIELD_NOT_FOUND 或 AMBIGUOUS_COLUMN_OR_FIELD 错误。
相关性
- LATERAL
  
  如果查询的前面带有 LATERAL 关键字，则应用规则 1.a 和 1.d，同时考虑 FROM 中包含该查询和 LATERAL 前面部分的表引用。
- 常规
  
  如果查询是标量子查询、IN 或 EXISTS 子查询，则应用规则 1.a、1.d 和 2，同时考虑包含查询的 FROM 子句中的表引用。
嵌套关联

重新应用规则 3 并迭代查询的嵌套级别。
FOR 循环

如果语句位于 FOR 循环中：

答：将标识符与 FOR 循环语句查询中的列进行匹配。如果标识符是限定的，则限定符必须与定义时 FOR 循环变量的名称匹配。 B. 如果标识符已限定，则遵循规则 1.c 与参数的字段或映射键进行匹配
复合语句

如果语句包含在复合语句中：

答：将该标识符与该复合语句中声明的变量匹配。如果标识符是限定的，并且复合语句已定义，那么限定符必须与该复合语句的标签匹配。 B. 如果标识符已限定，则遵循规则 1.c 与变量的字段或映射键进行匹配
嵌套复合语句或 FOR 循环

重新应用规则 5 和 6，逐层迭代复合语句的嵌套级别。
例程参数

如果表达式是 CREATE FUNCTION 或 CREATE PROCEDURE 语句的一部分：
1. 将标识符与参数名称进行匹配。如果标识符是限定的，则限定符必须与例程的名称匹配。
2. 如果标识符已限定，则遵循规则 1.c 与参数的字段或映射键进行匹配
会话变量
1. 将标识符与变量名称匹配。如果标识符已限定，则限定符必须是 session 或 system.session。
2. 如果标识符已限定，则遵循规则 1.c 与变量的字段或映射键进行匹配

名称解析，`HAVINGORDER BY`和`QUALIFY`

子HAVINGORDER BYQUALIFY句可以从列表引用名称SELECT以及基础表中的列。当其中一个子句中的名称同时与列表中的列别名 SELECT 和表列匹配时，子句会以不同的方式解析歧义：

ORDER BY SELECT首选列表别名而不是表列。
HAVING 首选表列而不是 SELECT 列表别名。
QUALIFY 首选表列而不是 SELECT 列表别名（与 HAVING列表别名相同）。

示例

> CREATE OR REPLACE TEMPORARY VIEW t(a, b) AS VALUES (1, 10), (2, 20), (3, 30);

-- ORDER BY prefers the alias over the column.
-- 'a' in ORDER BY refers to the alias (-a), not column 'a',
-- so the row with the largest column 'a' comes first.
> SELECT -a AS a FROM t ORDER BY a LIMIT 1;
  -3

-- HAVING prefers the column over the alias.
-- 'a' in HAVING refers to column 'a', not the alias sum(b).
> SELECT sum(b) AS a FROM t GROUP BY a HAVING a > 1;
  20
  30

-- QUALIFY prefers the column over the alias (same as HAVING).
-- 'a' in QUALIFY refers to column 'a', not the alias -row_number().
> SELECT -row_number() OVER (ORDER BY b) AS a FROM t QUALIFY a > 1;
  -2
  -3

字段提取和名称解析优先级

当限定名称（如 a.b 在 HAVING 或 ORDER BY中使用）时，上述优先级规则仍适用，但要考虑其他事项：首选候选项必须支持结构字段或映射密钥提取。如果不这样做，则改用其他候选项。

例如，如果别名 a 解析为纯 INT 字段，但表列 a 是 STRUCT 带字段 x的， ORDER BY 则选择 STRUCT 该列，因为无法从 INT 别名中提取字段。相反，如果表列是纯 INT 表列且别名为一个 STRUCT， HAVING 则回退到字段提取的别名。

示例

-- ORDER BY fallback: the table column is a STRUCT, the alias is an INT.
-- ORDER BY normally prefers the alias, but the alias (INT) cannot have
-- field 'x' extracted, so the struct column wins.
> CREATE OR REPLACE TEMPORARY VIEW s1(a) AS VALUES (named_struct('x', 1)), (named_struct('x', 2));

> SELECT -a.x AS a FROM s1 ORDER BY a.x LIMIT 1;
  -1

-- HAVING fallback: the table column is an INT, the alias is a STRUCT.
-- HAVING normally prefers the table column, but the column (INT) cannot have
-- field 'x' extracted, so the alias wins.
> CREATE OR REPLACE TEMPORARY VIEW s2(a) AS VALUES (1), (2);

> SELECT named_struct('x', 2) AS a FROM s2 GROUP BY a HAVING a.x > 1;
  {"x":2}
  {"x":2}

-- Map key extraction follows the same rules.
-- ORDER BY fallback: alias (INT) cannot have key extracted, map column wins.
> CREATE OR REPLACE TEMPORARY VIEW s3(a) AS VALUES (map('key', 100)), (map('key', 200));

> SELECT -a['key'] AS a FROM s3 ORDER BY a['key'] LIMIT 1;
  -100

-- HAVING fallback: column (INT) cannot have key extracted, map alias wins.
> CREATE OR REPLACE TEMPORARY VIEW s4(a) AS VALUES (100), (200);

> SELECT map('key', 200) AS a FROM s4 GROUP BY a HAVING a['key'] > 100;
  {"key":200}
  {"key":200}

限制

为了防止执行资源开销可能很高的关联查询，Azure Databricks 将支持的关联限制为一个级别。此限制也适用于 SQL 函数中的参数引用。

示例

-- Differentiating columns and fields
> SELECT a FROM VALUES(1) AS t(a);
 1

> SELECT t.a FROM VALUES(1) AS t(a);
 1

> SELECT t.a FROM VALUES(named_struct('a', 1)) AS t(t);
 1

-- A column takes precedence over a field
> SELECT t.a FROM VALUES(named_struct('a', 1), 2) AS t(t, a);
 2

-- Implict lateral column alias
> SELECT c1 AS a, a + c1 FROM VALUES(2) AS T(c1);
 2  4

-- A local column reference takes precedence, over a lateral column alias
> SELECT c1 AS a, a + c1 FROM VALUES(2, 3) AS T(c1, a);
 2  5

-- A scalar subquery correlation to S.c3
> SELECT (SELECT c1 FROM VALUES(1, 2) AS t(c1, c2)
           WHERE t.c2 * 2 = c3)
    FROM VALUES(4) AS s(c3);
 1

-- A local reference takes precedence over correlation
> SELECT (SELECT c1 FROM VALUES(1, 2, 2) AS t(c1, c2, c3)
           WHERE t.c2 * 2 = c3)
    FROM VALUES(4) AS s(c3);
  NULL

-- An explicit scalar subquery correlation to s.c3
> SELECT (SELECT c1 FROM VALUES(1, 2, 2) AS t(c1, c2, c3)
           WHERE t.c2 * 2 = s.c3)
    FROM VALUES(4) AS s(c3);
 1

-- Correlation from an EXISTS predicate to t.c2
> SELECT c1 FROM VALUES(1, 2) AS T(c1, c2)
    WHERE EXISTS(SELECT 1 FROM VALUES(2) AS S(c2)
                  WHERE S.c2 = T.c2);
 1

-- Attempt a lateral correlation to t.c2
> SELECT c1, c2, c3
    FROM VALUES(1, 2) AS t(c1, c2),
         (SELECT c3 FROM VALUES(3, 4) AS s(c3, c4)
           WHERE c4 = c2 * 2);
 [UNRESOLVED_COLUMN] `c2`

-- Successsful usage of lateral correlation with keyword LATERAL
> SELECT c1, c2, c3
    FROM VALUES(1, 2) AS t(c1, c2),
         LATERAL(SELECT c3 FROM VALUES(3, 4) AS s(c3, c4)
                  WHERE c4 = c2 * 2);
 1  2  3

-- Referencing a parameter of a SQL function
> CREATE OR REPLACE TEMPORARY FUNCTION func(a INT) RETURNS INT
    RETURN (SELECT c1 FROM VALUES(1) AS T(c1) WHERE c1 = a);
> SELECT func(1), func(2);
 1  NULL

-- A column takes precedence over a parameter
> CREATE OR REPLACE TEMPORARY FUNCTION func(a INT) RETURNS INT
    RETURN (SELECT a FROM VALUES(1) AS T(a) WHERE t.a = a);
> SELECT func(1), func(2);
 1  1

-- Qualify the parameter with the function name
> CREATE OR REPLACE TEMPORARY FUNCTION func(a INT) RETURNS INT
    RETURN (SELECT a FROM VALUES(1) AS T(a) WHERE t.a = func.a);
> SELECT func(1), func(2);
 1  NULL

-- Lateral alias takes precedence over correlated reference
> SELECT (SELECT c2 FROM (SELECT 1 AS c1, c1 AS c2) WHERE c2 > 5)
    FROM VALUES(6) AS t(c1)
  NULL

-- Lateral alias takes precedence over function parameters
> CREATE OR REPLACE TEMPORARY FUNCTION func(x INT)
    RETURNS TABLE (a INT, b INT, c DOUBLE)
    RETURN SELECT x + 1 AS x, x
> SELECT * FROM func(1)
  2 2

-- All together now
> CREATE OR REPLACE TEMPORARY VIEW lat(a, b) AS VALUES('lat.a', 'lat.b');

> CREATE OR REPLACE TEMPORARY VIEW frm(a) AS VALUES('frm.a');

> CREATE OR REPLACE TEMPORARY FUNCTION func(a INT, b int, c int)
  RETURNS TABLE
  RETURN SELECT t.*
    FROM lat,
         LATERAL(SELECT a, b, c
                   FROM frm) AS t;

> VALUES func('func.a', 'func.b', 'func.c');
  a      b      c
  -----  -----  ------
  frm.a  lat.b  func.c

表和视图解析

表引用中的标识符可以是以下任一标识符：

Unity Catalog 或 Hive 元存储中的持久表或视图
公用表表达式 (CTE)
临时视图或临时表

标识符的解析方式取决于它是否已限定：

合格

如果标识符包含三个部分且已完全限定：catalog.schema.relation，则它是唯一的。

如果标识符由两个部分组成：schema.relation，则使用 SELECT current_catalog() 的结果进一步限定该标识符以使其保持唯一。
未限定
1. 通用表表达式
  
  如果引用在 WITH 子句的范围内，则将标识符与某个 CTE 进行匹配，该 CTE 从直接包含的 WITH 子句开始，并从该子句外移。
2. 临时视图或临时表
  
  将标识符与当前会话中定义的任何临时视图或临时表匹配。
3. 永久性表
  
  通过在前面添加 SELECT current_catalog() 和 SELECT current_schema() 的结果来完全限定标识符，并将其作为永久性关系进行查找。

如果无法将关系解析为任何表、视图或 CTE，Databricks 将引发 TABLE_OR_VIEW_NOT_FOUND 错误。

示例

-- Setting up a scenario
> USE CATALOG spark_catalog;
> USE SCHEMA default;

> CREATE TABLE rel(c1 int);
> INSERT INTO rel VALUES(1);

-- An fully qualified reference to rel:
> SELECT c1 FROM spark_catalog.default.rel;
 1

-- A partially qualified reference to rel:
> SELECT c1 FROM default.rel;
 1

-- An unqualified reference to rel:
> SELECT c1 FROM rel;
 1

-- Add a temporary view with a conflicting name:
> CREATE TEMPORARY VIEW rel(c1) AS VALUES(2);

-- For unqualified references the temporary view takes precedence over the persisted table:
> SELECT c1 FROM rel;
 2

-- Temporary views cannot be qualified, so qualifiecation resolved to the table:
> SELECT c1 FROM default.rel;
 1

-- An unqualified reference to a common table expression wins even over a temporary view:
> WITH rel(c1) AS (VALUES(3))
    SELECT * FROM rel;
 3

-- If CTEs are nested, the match nearest to the table reference takes precedence.
> WITH rel(c1) AS (VALUES(3))
    (WITH rel(c1) AS (VALUES(4))
      SELECT * FROM rel);
  4

-- To resolve the table instead of the CTE, qualify it:
> WITH rel(c1) AS (VALUES(3))
    (WITH rel(c1) AS (VALUES(4))
      SELECT * FROM default.rel);
  1

-- For a CTE to be visible it must contain the query
> SELECT * FROM (WITH cte(c1) AS (VALUES(1))
                   SELECT 1),
                cte;
  [TABLE_OR_VIEW_NOT_FOUND] The table or view `cte` cannot be found.

函数解析

函数引用由必需的尾部括号集识别。

它可以解析为：

Azure Databricks 提供的内置函数；
范围为当前会话的临时用户定义函数，或
存储在 Hive 元存储或 Unity 目录中的持久性用户定义函数。

函数名称的解析取决于它是否被限定：

合格

如果名称包含三个部分且已完全限定：catalog.schema.function，则它是唯一的。

如果名称由两个部分组成：schema.function，则使用 SELECT current_catalog() 的结果进一步限定该名称以使其保持唯一。

然后在目录中查找函数。
未限定

对于未限定的函数名称，Azure Databricks 遵循固定的优先顺序 (PATH)：
1. 内置函数
  
  如果内置函数集中存在具有此名称的函数，则选择该函数。
2. 临时函数
  
  如果临时函数集中存在具有此名称的函数，则选择该函数。
3. 永久函数
  
  通过在前面添加 SELECT current_catalog() 和 SELECT current_schema() 的结果来完全限定函数名称，并将其作为永久性函数进行查找。

如果无法解析该函数，Azure Databricks 将引发 UNRESOLVED_ROUTINE 错误。

示例

> USE CATALOG spark_catalog;
> USE SCHEMA default;

-- Create a function with the same name as a builtin
> CREATE FUNCTION concat(a STRING, b STRING) RETURNS STRING
    RETURN b || a;

-- unqualified reference resolves to the builtin CONCAT
> SELECT concat('hello', 'world');
 helloworld

-- Qualified reference resolves to the persistent function
> SELECT default.concat('hello', 'world');
 worldhello

-- Create a persistent function
> CREATE FUNCTION func(a INT, b INT) RETURNS INT
    RETURN a + b;

-- The persistent function is resolved without qualifying it
> SELECT func(4, 2);
 6

-- Create a conflicting temporary function
> CREATE FUNCTION func(a INT, b INT) RETURNS INT
    RETURN a / b;

-- The temporary function takes precedent
> SELECT func(4, 2);
 2

-- To resolve the persistent function it now needs qualification
> SELECT spark_catalog.default.func(4, 3);
 6

Last updated on 2026-03-27

名称解析

列、字段、参数和变量解析

名称解析，HAVINGORDER BY和QUALIFY

示例

字段提取和名称解析优先级

示例

限制

示例

表和视图解析

示例

函数解析

示例

相关文章

其他资源

名称解析，`HAVINGORDER BY`和`QUALIFY`