2025 年发布了以下 Databricks SQL 功能和改进。
注释
下面列出的发行日期和内容在多数情况下只对应于 Azure 公有云的实际部署。
其中提供了 Azure 公有云上 Azure Databricks 服务的演进历史记录以供参考,这些内容可能不适用于由世纪互联运营的 Azure。
2025 年 7 月
SQL 编辑器中参数的预设日期范围
2025 年 7 月 31 日
在新 SQL 编辑器中,现在可以从预设日期范围中进行选择,例如 “本周”、“ 过去 30 天”或 “去年 ”,使用时间戳、日期和日期范围参数。 通过这些预设,无需手动输入日期即可更快地应用常见时间筛选器。
SQL 编辑器中的内联执行历史记录
2025 年 7 月 24 日
现在,新的 SQL 编辑器中提供了内联执行历史记录,使你可以快速访问过去的结果,而无需重新执行查询。 轻松引用以前的执行记录,直接导航到过去的查询概要,并比较运行时间和状态 —— 所有操作均在您当前查询的上下文中进行。
Databricks SQL 版本 2025.20 现已在 Current 通道中提供
2025 年 7 月 17 日
Databricks SQL 版本 2025.20 正在逐步在 当前 渠道推出。 有关此版本中的功能和更新,请参阅 2025.20 功能。
SQL 编辑器更新
2025 年 7 月 17 日
对命名参数的改进: 现在支持日期范围和多选参数。 有关日期范围参数,请参阅 “添加日期范围”。 有关多选参数,请参阅 在单个查询中使用多个值。
SQL 编辑器中更新了标头布局: 运行按钮和目录选取器已移动到标头,从而为编写查询创建更多垂直空间。
Git 对警报的支持
2025 年 7 月 17 日
现在可以使用 Databricks Git 文件夹来跟踪和管理警报更改。 若要使用 Git 跟踪警报,请将警报放置在 Databricks Git 文件夹中。 新克隆的警报仅在用户与其交互后才会显示在警报列表页或 API 中。 它们已暂停计划,需要由用户显式恢复。 请参阅 Git 集成如何与警报配合使用。
Databricks SQL 版本 2025.20 现已在预览版中提供
2025 年 7 月 3 日
Databricks SQL 版本 2025.20 现已在 预览 频道中提供。 查看以下部分,了解新功能和行为更改。
扩展的空间 SQL 表达式,GEOMETRY 和 GEOGRAPHY 数据类型
现在可以将地理空间数据存储在内置 GEOMETRY
和 GEOGRAPHY
列中,以提高空间查询的性能。 此版本添加了 80 多个新的空间 SQL 表达式,包括用于导入、导出、测量、构造、编辑、验证、转换和确定具有空间联接的拓扑关系的函数。 请参阅 ST 地理空间函数、GEOGRAPHY
类型和GEOMETRY
类型。
SQL 过程支持
SQL 脚本现在可以被封装在 Unity Catalog 中的存储过程,作为可重用的资产。 可以使用 CREATE PROCEDURE 命令创建过程,然后使用 CALL 命令调用过程。
为 SQL Functions 设置默认排序规则
使用 DEFAULT COLLATION
命令中的新子句定义用于STRING
参数、返回类型和STRING
函数正文中的文本的默认排序规则。
递归通用表表达式 (rCTE) 支持
Azure Databricks 现在支持使用 递归通用表表达式(rCTE)导航分层数据。
使用自引用 CTE UNION ALL
来遵循递归关系。
默认情况下已启用 ANSI SQL
默认 SQL 方言现在是 ANSI SQL。 ANSI SQL 是一个完善的标准,可帮助保护用户免受意外或不正确结果的影响。 有关详细信息,请阅读 Databricks ANSI 启用指南 。
在ALL CATALOGS
SCHEMAS 中支持SHOW
SHOW SCHEMAS
语法已更新,现在接受以下语法:
SHOW SCHEMAS [ { FROM | IN } { catalog_name | ALL CATALOGS } ] [ [ LIKE ] pattern ]
在 ALL CATALOGS
查询中指定 SHOW
时,执行将循环访问所有支持命名空间且使用目录管理器 (DsV2) 的活动目录。 对于每个目录,其中包含顶级命名空间。
已对命令的输出属性和架构进行了修改,添加了一列,用于指示 catalog
对应命名空间的目录。 新列将添加到输出属性的末尾,如下所示:
上一个输出
| Namespace |
|------------------|
| test-namespace-1 |
| test-namespace-2 |
新输出
| Namespace | Catalog |
|------------------|----------------|
| test-namespace-1 | test-catalog-1 |
| test-namespace-2 | test-catalog-2 |
液体聚类分析现在更高效地压缩删除矢量
在 OPTIMIZE
运行时,使用 Liquid 聚类的 Delta 表现在能够更有效地应用删除向量的物理更改。 有关详细信息,请参阅 对 Parquet 数据文件应用更改。
允许在UPDATE
操作的/INSERT
MERGE
列值中使用非确定性表达式
Azure Databricks 现在允许在MERGE
操作的更新和插入列值中使用非确定性表达式。 但是,不支持语句条件 MERGE
中的非确定性表达式。
例如,现在可以为列生成动态值或随机值:
MERGE INTO target USING source
ON target.key = source.key
WHEN MATCHED THEN UPDATE SET target.value = source.value + rand()
这可以通过模糊处理实际数据来保护数据隐私,同时保留数据属性(例如平均值值或其他计算列)。
支持 VAR 关键字来声明和删除 SQL 变量
声明和删除变量的 SQL 语法现在还支持VAR
VARIABLE
关键字。 此更改将所有变量相关作的语法统一,这可提高一致性,并减少在设置变量时已使用 VAR
的用户的混淆。
当子句只应用于具体化视图时,CREATE VIEW
列级子句现在将引发错误
指定仅对 CREATE VIEW
有效的列级子句的 MATERIALIZED VIEW
命令现在会引发错误。 受影响的子句对于命令 CREATE VIEW
为:
NOT NULL
- 指定的数据类型,例如
FLOAT
或STRING
DEFAULT
COLUMN MASK
2025 年 6 月
Databricks SQL 无服务器引擎升级
2025 年 6 月 11 日
以下引擎升级现已在全球推出,在未来几周内,可用性扩展到所有区域。
- 较低的延迟:仪表盘、ETL 作业和混合工作负载现在运行得更快,性能提升最高可达 25%。 升级会自动应用于无服务器 SQL 仓库,无需额外付费或配置。
- 预测查询执行(PQE):PQE 实时监视任务,并动态调整查询执行,以帮助避免倾斜、溢出和不必要的工作。
- Photon 矢量化混排:将数据保持紧凑列式格式,在 CPU 的高速缓存中对其进行排序,并使用矢量化指令同时处理多个值。 这可提高 CPU 绑定工作负荷(例如大型联接和宽聚合)的吞吐量。
用户界面更新
2025 年 6 月 5 日
-
查询见解改进: 访问查询历史记录页现在会触发
listHistoryQueries
事件。 现在打开查询配置文件会发出getHistoryQuery
事件。
2025年5月
指标视图处于公共预览阶段
2025 年 5 月 29 日
Unity 目录指标视图提供了一种集中方法,用于定义和管理一致、可重用和治理的核心业务指标。 它们将复杂的业务逻辑抽象化为集中式定义,使组织能够定义关键绩效指标一次,并在仪表板、Genie 空间和警报等报告工具中一致地使用它们。 使用在预览通道(2025.16)上运行的 SQL 仓库或其他运行 Databricks Runtime 16.4 或更高版本的计算资源来处理指标视图。 请参阅 Unity 目录指标视图。
用户界面更新
2025 年 5 月 29 日
-
新的 SQL 编辑器改进:
- Drafts 文件夹中的新查询: 现在,新查询在 Drafts 文件夹中默认创建。 保存或重命名后,这些文件会自动移出草稿箱。
-
查询代码片段支持: 现在,可以创建和重用查询片段-预定义的 SQL 段,例如
JOIN
或CASE
表达式,支持自动完成和动态插入点。 通过选择 “查看>查询代码段”来创建代码片段。 - 审核日志事件: 现在会记录审核日志事件,用于新的 SQL 编辑器中进行的操作。
- 筛选器对可视化效果的影响: 应用于结果表的筛选器现在也会影响可视化效果,无需修改 SQL 查询即可进行交互式浏览。
Beta 版中的新警报版本
2025 年 5 月 22 日
新版本的警报现在处于 Beta 版中。 此版本通过将查询设置、条件、计划和通知目标合并到单个界面,简化了创建和管理警报。 你仍然可以将旧版警报与新版本一起使用。 请参阅 Databricks SQL 警报。
用户界面更新
2025 年 5 月 22 日
- 图表中的工具提示格式: SQL 编辑器和笔记本图表中的工具提示现在遵循 “数据标签 ”选项卡中定义的数字格式。请参阅 Databricks 笔记本和 SQL 编辑器中的可视化效果。
Databricks SQL 版本 2025.16 现已推出
2025 年 5 月 15 日
Databricks SQL 版本 2025.16 现已在 预览 频道中提供。 查看以下部分,了解新功能、行为更改和 bug 修复。
IDENTIFIER
Databricks SQL 中现已提供对目录操作的支持
现在您可以在执行以下目录作业时使用IDENTIFIER
子句:
CREATE CATALOG
DROP CATALOG
COMMENT ON CATALOG
ALTER CATALOG
使用此新语法,可以使用为这些作定义的参数动态指定目录名称,从而实现更灵活和可重用的 SQL 工作流。 请考虑 CREATE CATALOG IDENTIFIER(:param)
,其中 param
是一个参数,用于指定目录名称。
有关详细信息,请参阅 IDENTIFIER 子句。
整理表达式现在提供自动生成的临时别名
自动生成的整理后表达式别名现在总会以确定性方式合并 COLLATE
信息。 自动生成的别名是暂时性的(不稳定的),不应依赖。 相反,最佳做法是一致且显式地使用 expression AS alias
。
视图中的 UNION/EXCEPT/INTERSECT 和 EXECUTE IMMEDIATE 现在返回正确的结果
查询具有顶级UNION
/EXCEPT
/INTERSECT
和非别名列的临时视图定义和永久性视图定义之前返回的结果不正确,因为UNION
/EXCEPT
/INTERSECT
关键字被视为别名。 现在,这些查询将正确执行整个集合操作。
EXECUTE IMMEDIATE ... INTO
由于解析器将这些关键字解释为别名,导致具有顶级UNION
/EXCEPT
/INTERSECT
及非别名列的集合操作错误地将结果写入指定变量。 同样,还允许包含无效尾文本的 SQL 查询。 在这些情况下,设置操作现在可以将正确的结果写入指定的变量,或者在 SQL 文本无效的情况下失败。
新增 listagg
功能和 string_agg
函数
现在可以使用 listagg
或 string_agg
函数来聚合组中的 STRING
和 BINARY
值。 有关详细信息,请参阅 string_agg。
修复了对别名整数文本的分组在某些运算中失效的问题
对于某些操作(例如 MERGE INTO
),以前分组表达式在别名整数文本上无法正常工作。 例如,此表达式将返回 GROUP_BY_POS_OUT_OF_RANGE
,因为值 (val
) 将替换为202001:
merge into t
using
(select 202001 as val, count(current_date) as total_count group by val) on 1=1
when not matched then insert (id, name) values (val, total_count)
此问题已修复。 若要缓解现有查询中的问题,请检查所使用的常量是否不等于分组表达式中的列位置。
启用标志以禁止禁用 MERGE
操作的源具体化
以前,用户可以通过在MERGE
内将merge.materializeSource
设置为none
来禁用源数据物化。 启用新标志后,将禁止此操作并导致错误。 Databricks 计划仅针对以前未使用此配置标志的客户启用标志,因此,客户不应注意到行为的任何更改。
2025 年 4 月
Databricks SQL 版本 2025.15 现已推出
2025 年 4 月 10 日
Databricks SQL 版本 2025.15 现已在 预览 频道中提供。 查看以下部分,了解新功能、行为更改和 bug 修复。
使用 ALTER TABLE
编辑多个栏目
现在可以更改单个 ALTER TABLE
语句中的多个列。 请参阅 ALTER TABLE...COLUMN 子句。
Delta 表协议降级现已正式发布,提供检查点保护
DROP FEATURE
已正式发布,可用于移除 Delta Lake 表功能并降级表协议。 默认情况下,DROP FEATURE
现在会创建受保护的检查点,以实现更优化和简化的降级体验,无需等待时间或历史记录截断。 请参阅删除 Delta Lake 表功能并降级表协议。
基于 ANSI SQL/PSM 编写 SQL 过程脚本(公测版)
现在,可以使用基于 ANSI SQL/PSM 的脚本功能通过 SQL 编写过程逻辑,包括条件语句、循环、局部变量和异常处理。 请参阅 SQL 脚本。
表和视图级别默认排序规则
现在可以为表和视图指定默认排序规则。 这简化了表和视图的创建,其中所有或大多数列共享相同的排序规则。 请参阅排序规则。
新的 H3 函数
添加了以下 H3 函数:
旧版仪表板支持已经结束
2025 年 4 月 10 日
对旧版仪表板的官方支持已结束。 不能再使用 UI 或 API 创建或克隆旧仪表板。 Databricks 继续解决关键安全问题和服务中断,但建议对所有新开发使用 AI/BI 仪表板。 若要了解有关 AI/BI 仪表板的详细信息,请参阅 仪表板。 有关迁移的帮助,请参阅将旧仪表板克隆到 AI/BI 仪表板,并使用仪表板 API 创建和管理仪表板。
SQL 查询的自定义自动格式设置选项
2025 年 4 月 3 日
** 为所有 SQL 查询自定义自动格式化选项。 请参阅 自定义格式 SQL 语句。
Boxplot 可视化问题已修复
2025 年 4 月 3 日
修复了只有分类 x 轴的 Databricks SQL Boxplot 可视化效果未正确显示类别和条形图的问题。 可视化效果现在按预期呈现。
SQL 仓库的 CAN VIEW 权限为公共预览版
2025 年 4 月 3 日
“可以查看”权限现在在公共预览版中提供。 此权限允许用户监视 SQL 仓库,包括关联的查询历史记录和查询配置文件。 具有 CAN VIEW 权限的用户无法在未被授予其他权限的情况下对 SQL 仓库运行查询。 请参阅 SQL 仓库 ACL。
2025 年 3 月
用户界面更新
2025 年 3 月 27 日
- 更新了查询配置文件以提高可用性: 查询配置文件已更新,可提高可用性并帮助你快速访问关键见解。 请参阅查询简介。
用户界面更新
2025 年 3 月 20 日
- 将 SQL 仓库所有权转移到服务主体: 现在可以使用 UI 将仓库所有权转移到服务主体。
用户界面更新
2025 年 3 月 6 日
- 双轴图表现在支持缩放:现在可以通过单击拖动来放大双轴图表。
- 固定表列: 现在可以将表列固定到表显示左侧。 在表上向右滚动时,列仍然显示在视图中。 请参阅 列设置。
- 修复了组合图的问题: 在 x 轴上使用时态字段时,解决了 x 轴标签和条形之间的不对齐问题。
2025 年 2 月
Databricks SQL 版本 2025.10 现已推出
2025 年 2 月 21 日
Databricks SQL 版本 2025.10 现已在 预览 频道中提供。 查看以下部分,了解新功能、行为更改和 bug 修复。
在 Delta Sharing 中,默认启用表历史记录
使用 SQL 命令创建的共享 ALTER SHARE <share> ADD TABLE <table>
现在默认启用历史记录共享(WITH HISTORY
)。 请参阅 ALTER SHARE。
凭据 SQL 语句在凭据类型不匹配时返回错误
在此版本中,如果凭据管理 SQL 语句中指定的凭据类型与凭据参数的类型不匹配,则返回错误,并且该语句未运行。 例如,对于语句 DROP STORAGE CREDENTIAL 'credential-name'
,如果 credential-name
不是存储凭据,则语句将失败并出现错误。
此更改有助于防止用户错误。 以前,即使传递的凭据与指定的凭据类型不匹配,这些语句也会成功运行。 例如,以下语句将成功删除storage-credential
: DROP SERVICE CREDENTIAL storage-credential
此更改会影响以下语句:
在生成的列表达式中使用 timestampdiff
& timestampadd
Delta Lake 生成的列表达式 现在支持 timestampdiff 和 timestampadd 函数。
支持 SQL 管道语法
现在可以编写 SQL 管道。 SQL 管道将标准查询(如 SELECT c2 FROM T WHERE c1 = 5
)构造成分步序列,如以下示例所示:
FROM T
|> SELECT c2
|> WHERE c1 = 5
若要了解 SQL 管道支持的语法,请参阅 SQL 管道语法。
有关此跨行业扩展的背景信息,请参阅 “SQL 的问题及其解决方法:SQL 中的管道语法”(由 Google Research 出品)。
使用 http_request
函数发出 HTTP 请求
现在,可以使用 http_request 函数创建 HTTP 连接,并通过它们发出 HTTP 请求。
更新至 DESCRIBE TABLE
将元数据作为结构化 JSON 返回
现在 DESCRIBE TABLE AS JSON
可以使用该命令将表元数据作为 JSON 文档返回。 JSON 输出的结构比默认的可读报表更结构化,可用于以编程方式解释表的架构。 若要了解详细信息,请参阅 DESCRIBE TABLE AS JSON。
不区分尾随空格的排序规则
添加了对忽略尾随空白的排序规则的支持。 例如,这些排序规则将 'Hello'
和 'Hello '
视为相等。 若要了解详细信息,请参阅 RTRIM 排序规则。
改进了增量克隆处理
此版本包含一个边缘情况的修补程序:增量 CLONE
可能会重新复制已经从源表复制到目标表的文件。 请参阅克隆 Azure Databricks 上的表。
用户界面更新
2025 年 2 月 13 日
- 在数据发现中预览 Unity 目录元数据: 通过将鼠标悬停在架构浏览器中的资产上,预览 Unity 目录资产的元数据。 此功能在目录浏览器、AI/BI 仪表板和 SQL 编辑器等使用架构浏览器的界面中均可使用。
- 筛选以查找可查询的数据资产:Catalog Explorer 架构浏览器中的筛选器设置现在包含一个可查询复选框。 选择此选项不包括可以查看但不能查询的对象。
2025 年 1 月
用户界面更新
2025 年 1 月 30 日
SQL 仓库的已完成查询计数图表(公共预览版): SQL 仓库监视 UI 上现已推出新的 已完成查询计数 图表。 此图表显示时间范围内完成的查询数,包括已取消和失败的查询。 该图表可以与其他图表和查询历史记录表一起使用,以评估和排查仓库性能问题。 查询被分配在其完成时所在的时间窗口中。 每个分钟的平均计数。 有关详细信息,请参阅监视 SQL 仓库。
在 SQL 编辑器图表中展开的数据显示: 在 SQL 编辑器中创建的可视化效果现在最多支持 15,000 行数据。
Databricks SQL 版本 2024.50 现已推出
2025 年 1 月 23 日
Databricks SQL 版本 2024.50 现已在 预览 频道中提供。 查看以下部分,了解新功能、行为更改和 bug 修复。
VARIANT
数据类型不能再用于需要比较的操作
不能在包含 VARIANT
数据类型的查询中使用以下子句或运算符:
DISTINCT
INTERSECT
EXCEPT
UNION
DISTRIBUTE BY
这些操作执行比较,以及使用 VARIANT 数据类型的比较会生成未定义的结果,并且 Databricks 中不受支持。 如果在 Azure Databricks 工作负荷或表中使用 VARIANT 类型,Databricks 建议进行以下更改:
- 更新查询或表达式,以将
VARIANT
值显式转换为非VARIANT
数据类型。 - 如果字段必须与上述任何操作一起使用,请从
VARIANT
数据类型中提取这些字段,并使用非VARIANT
数据类型存储这些字段。
若要了解详细信息,请参阅 查询变体数据。
支持对 USE CATALOG with IDENTIFIER
子句进行参数化
USE CATALOG 语句支持 IDENTIFIER 子句。 借助此支持,可以根据字符串变量或参数标记参数化当前目录。
COMMENT ON COLUMN
对表和视图的支持
COMMENT ON 语句支持更改视图列和表列的注释。
新的 SQL 函数
以下新的内置 SQL 函数可用:
- dayname(expr) 会返回给定日期的星期几的三个字母英语首字母缩略词。
- uniform(expr1, expr2 [,seed]) 返回在指定数字范围内具有独立且相同分布值的随机值。
-
randstr(length) 返回一个包含
length
个字母数字字符的随机字符串。
更多函数的命名参数调用
以下函数支持命名参数调用:
- variant_explode
- variant_explode_outer
- 内嵌
- inline_outer
- 保持posexplode原名称以确保技术一致性,但可能需要解释其功能作用。
- posexplode_outer
嵌套类型现在正确接受 NULL 约束
此版本修复了一个影响某些 Delta 生成的嵌套类型列的错误,例如,STRUCT
。 这些列有时会根据嵌套字段的 NULL
或 NOT NULL
约束错误地拒绝表达式。 此问题已修复。
SQL 编辑器用户界面更新
2025 年 1 月 15 日
新的 SQL 编辑器(公共预览版)包括以下用户界面改进:
- 增强的下载体验: 查询输出在下载时会自动以查询名称命名。
-
字体大小的键盘快捷方式: 使用
Alt +
和Alt -
(Windows/Linux) 或Opt +
Opt -
(macOS) 在 SQL 编辑器中快速调整字号。 -
用户在评论中被提及:在评论中使用
@
标记特定用户,以便向他们发送电子邮件通知。 - 更快的选项卡导航:现在,加载的选项卡切换速度提高了 80%,未加载的选项卡速度提高了 62%。
- 简化的仓库选择: SQL 仓库大小信息直接显示在计算选择器中,以便于选择。
-
参数编辑快捷方式: 使用
Ctrl + Enter
(Windows/Linux) 或Cmd + Enter
(macOS) 在编辑参数值时执行查询。 - 增强的版本控制: 查询结果保留在版本历史记录中,以便更好地协作。
图表可视化更新
2025 年 1 月 15 日
新的图表系统具有改进的性能、增强的配色方案以及更快的交互性现已正式发布。 请参阅 Databricks 笔记本中的可视化效果以及 SQL 编辑器 和 可视化效果类型。