这些功能和 Azure Databricks 平台改进于 2025 年 9 月发布。
注释
下面列出的发行日期和内容在多数情况下只对应于 Azure 公有云的实际部署。
它提供 Azure 公有云上的 Azure Databricks 服务演变史,以供参考,但可能与世纪互联运营的 Azure 上的实际部署情况不一致。
注释
发布过程分阶段进行。 Azure Databricks 帐户可能要等到初始发布日期后的一周或更长时间才会更新。
管道更新时间线表现已可用(公共预览版)
2025 年 9 月 30 日
该 system.lakeflow.pipeline_update_timeline 表提供管道更新的完整历史跟踪,并支持对更新活动、触发器、结果和计算使用情况进行精细分析。
数据分类系统表 Beta
2025 年 9 月 30 日
新的系统表 system.data_classification.results现已在 Beta 版中提供。 此表捕获在您的元数据存储中所有启用的目录内对列级敏感数据的检测。
Anthropic Claude Opus 4.1 现在可用作 Databricks 托管的基础模型
2025 年 9 月 29 日
马赛克 AI 模型服务现在支持 Anthropic 的 Claude Opus 4.1,这是一个由 Databricks 托管的基础模型。 可以使用基础模型 API 按令牌付费访问此模型。
Lakeflow 管道编辑器现在以公共预览版提供
2025 年 9 月 29 日
Lakeflow 管道编辑器(以前称为 多文件编辑器)现在以公共预览版提供。 Lakeflow 管道编辑器在管道资产浏览器中将管道显示为一组文件。 您可以在一个地方编辑文件,并控制管道的配置以及要包含的文件。 这还会将管道的默认源代码格式从笔记本更改为 Python 和 SQL 代码文件。
请参阅 使用 Lakeflow 管道编辑器开发和调试 ETL 管道。
为 Salesforce 数据摄取创建连接的新要求
2025 年 9 月 29 日
2025 年 9 月初,Salesforce 开始限制使用卸载的连接应用。 此限制不会中断与 Salesforce 的现有 Unity 目录连接,但它可防止在未安装 Databricks 连接应用的情况下与新的 Salesforce 实例建立连接。
有关背景信息,请参阅 Salesforce 文档中 的“准备连接应用使用限制更改 ”。
旧版发布模式的 Lakeflow 声明性管道迁移功能现已普遍可用。
2025 年 9 月 24 日
Lakeflow 声明性管道具有仅允许发布到单个目录和架构的旧发布模式。 默认发布模式允许发布到多个目录和架构。 从旧版发布模式迁移到默认发布模式现已正式发布(以前版本的此功能中遇到的问题已修复)。
请参阅 在管道中启用默认发布模式。
Databricks 运行时维护更新
2025 年 9 月 24 日
新的维护更新可用于受支持的 Databricks Runtime 版本。 这些更新包括 bug 修复、安全修补程序和性能改进。 有关详细信息,请参阅 Databricks Runtime 维护更新。
Mosaic AI Agent Framework 支持 Lakebase 资源的身份验证自动传递
2025 年 9 月 23 日
马赛克 AI 代理框架现在支持 Lakebase 资源的自动身份验证直通。 这需要 MLFlow 3.3.2 或更高版本。
路由优化终结点现在需要使用路由优化的 URL 路径进行查询
2025 年 9 月 22 日
必须使用路由优化 URL 查询所有新建的路由优化终结点。 2025 年 9 月 22 日之后创建的路由优化终结点不支持使用标准工作区 URL 路径的查询。
使用 LLM 浏览表数据(公共预览版)
2025 年 9 月 22 日
现在,可以使用目录资源管理器询问有关示例数据的自然语言问题。 助手使用元数据上下文和表使用模式来生成 SQL 查询。 然后,可以验证查询,并针对基础表运行它。 请参阅使用 LLM 浏览表数据。
Databricks One 公共预览版
2025 年 9 月 17 日
Databricks One 是专为业务用户设计的简化用户界面,现在以公共预览版提供。 Databricks One 提供了一个直观的入口点,用于与 Databricks 中的数据和 AI 交互,而无需对计算资源、查询、模型或笔记本具有技术知识。
借助 Databricks One,业务用户可以:
- 查看 AI/BI 仪表板并与之交互,以跟踪 KPI 和分析指标。
- 使用 AI/BI Genie 以自然语言提问数据问题。
- 使用结合分析、AI 和工作流的定制构建的 Databricks 应用。
工作区管理员可以从管理控制台的“预览”页面启用 Databricks One。
请参阅 什么是 Databricks One?。
在不注册的情况下使用文件事件高效发现自动加载程序中的文件(公共预览版)
2025 年 9 月 16 日
Auto Loader 的cloudFiles.useManagedFileEvents选项现在处于公共预览状态。 使用此选项可以有效地发现文件。 有关详细信息,请参阅以下内容:
Databricks Runtime 17.2 现已正式发布
2025 年 9 月 16 日
Databricks Runtime 17.2 现已正式发布。 请参阅 Databricks Runtime 17.2。
Delta Sharing 在 Lakehouse 联合中处于 Beta 测试阶段
2025 年 9 月 16 日
现在,您可以使用 Delta Sharing 在 Databricks 到 Databricks 共享和开放共享中分享通过查询联合创建的外部架构和表。 请参阅将外部架构或表添加到共享中以及在共享的外部表或外部架构中读取数据。
将 Delta shares 挂载到现有共享目录中
2025 年 9 月 12 日
增量共享的接收者现在可以将从其 Delta 共享提供商接收到的共享挂载到现有的共享目录中。 收件人以前需要为每一个新的共享创建一个新目录。 请参阅从共享创建目录。
Python 自定义数据源可以用于 Lakeflow 声明式流水线
2025 年 9 月 10 日
可以在 Lakeflow 声明性管道中的管道定义中使用 Python 自定义数据源和接收器。
有关 Python 自定义数据源的信息,请参阅以下内容:
自动身份管理功能现已普遍可用
2025 年 9 月 10 日
使用自动标识管理,可以将用户、服务主体和组从 Microsoft Entra ID 同步到 Azure Databricks,而无需在 Microsoft Entra ID 中配置应用程序。 启用后,你可以直接在身份联合工作区中搜索 Microsoft Entra ID 的用户、服务主体和组,并将它们添加到工作区中。 Databricks 将 Microsoft Entra ID 用作记录源,因此 Azure Databricks 会采用对组成员身份所做的任何更改。 自动标识管理还支持嵌套组。
请参阅从 Microsoft Entra ID 自动同步用户和组。
Lakeflow 声明性管道现在支持公共预览版中的流进度指标
2025 年 9 月 10 日
Lakeflow 声明性管道现在支持查询事件日志中有关流进度的指标。 请参阅 “监视管道流式处理指标”。
Databricks Runtime 维护更新
2025 年 9 月 8 日
新的维护更新可用于受支持的 Databricks Runtime 版本。 这些更新包括 bug 修复、安全修补程序和性能改进。 有关详细信息,请参阅 Databricks Runtime 维护更新。
Databricks Apps 对 Genie 资源的支持
2025 年 9 月 8 日
Databricks Apps 现在支持将 AI/BI Genie 空间添加为应用资源,以便对特选数据集进行自然语言查询。
Databricks Online 功能存储(公共预览版)
2025 年 9 月 5 日
由 Lakebase 提供支持的 Databricks Online 功能存储提供对功能数据的高度可缩放的低延迟访问,同时保持与脱机功能表的一致性。 与 Unity 目录、MLflow 和马赛克 AI 模型服务的本机集成有助于生产模型终结点、代理和规则引擎,以便它们可以自动安全地从联机功能存储访问功能,同时保持高性能。
MLflow 元数据现已在系统表中可用(公共预览版)
2025 年 9 月 5 日
MLflow 元数据现在可在系统表中使用。 从一个中心位置的整个工作区查看 MLflow 跟踪服务 中管理的元数据,利用 Databricks 产品/服务的所有 Lakehouse 工具,例如生成自定义 AI/BI 仪表板、SQL 警报和大规模数据分析查询。
Databricks 助手代理模式:数据科学代理处于 Beta 版
2025 年 9 月 3 日
Databricks 助手的代理模式现在处于 Beta 版中。 在代理模式下,助手可以通过单个提示协调多步骤工作流。
Data Science Agent 是为数据科学工作流自定义构建的,可为 EDA、预测和机器学习等任务构建整个笔记本。 使用提示,它可以规划解决方案、检索相关资产、运行代码、使用单元格输出来改进结果、自动修复错误等。
默认存储支持的表可以与任何收件人共享 Delta (Beta)
2025 年 9 月 2 日
增量共享提供程序现在可以与任何收件人(包括打开和 Azure Databricks 收件人)共享默认存储支持的表,即使收件人使用的是经典计算也是如此。 启用了分区的表是一个例外。
将 Lakeflow 声明性管道从旧版发布模式回滚到公共预览版
2025 年 9 月 2 日
Lakeflow 声明性管道包括以前限制发布到单个目录和架构的旧发布模式。 默认发布模式允许发布到多个目录和架构。 一项功能(最近发布为正式发布)可帮助从旧发布模式迁移到默认发布模式。 由于发布后发现的问题,迁移功能已回滚到公共预览版状态和功能。
请参阅 在管道中启用默认发布模式
AI 代理:代表用户公共预览版授权
2025 年 9 月 2 日
部署到模型服务终结点的 AI 代理可以使用代表用户授权。 这允许代理充当 Databricks 用户,该用户运行查询以增加对敏感数据的安全性和精细访问。
SQL Server 连接器支持 SCD 类型 2
2025 年 9 月 1 日
Lakeflow Connect 中的 Microsoft SQL Server 连接器现在支持 SCD 类型 2。 此设置称为历史记录跟踪或渐变维度(SCD),用于确定如何随时间推移处理数据中的更改。 使用历史记录跟踪关闭(SCD 类型 1),在源中更新和删除过时的记录时将被覆盖。 使用历史记录跟踪(SCD 类型 2),连接器会保留这些更改的历史记录。