这些功能和 Azure Databricks 平台改进于 2025 年 10 月发布。
注释
下面列出的发行日期和内容在多数情况下只对应于 Azure 公有云的实际部署。
它提供 Azure 公共云上 Azure Databricks 服务的演变历史,供您参考,该历史可能与世纪互联运营的 Azure 实际部署情况不一致。
注释
发布过程分阶段进行。 Azure Databricks 帐户可能要等到初始发布日期后的一周或更长时间才会更新。
Databricks 助手代理模式现在可以使用通过 Databricks 上提供的 Anthropic 模型
2025 年 10 月 31 日
启用合作伙伴支持的 AI 功能时,Databricks 助手代理模式现在可以使用通过 Databricks 部署的 Anthropic 提供的模型。 Databricks 上的 Anthropic 使用托管在 Databricks 安全外围内的 AWS 中的 Databricks Inc. 终结点。
运行笔记本时跳过单元格
2025 年 10 月 31 日
现在,可以使用 %skip 魔法命令在笔记本中运行多个单元格时跳过单个单元格。 在要跳过的任何单元格的开头添加 %skip 。 请参阅 “运行 Databricks 笔记本”。
改进了笔记本调试器体验
2025 年 10 月 31 日
Python 笔记本交互式调试器现在支持多文件调试。 可以设置断点并跨多个工作区文件单步执行函数。 当你单步执行时,调试器会自动在新的选项卡中打开该文件。 通过此改进,可以更轻松地调试跨工作区中多个文件的代码。
请参阅 查看工作区文件。
新的计算策略表单现已正式发布
2025 年 10 月 29 日
新的计算策略表单现已正式发布。 使用新表单,可以通过下拉菜单和其他 UI 元素配置策略定义。 这意味着管理员可以编写策略,而无需了解或引用策略语法。
请参阅 “创建和管理计算策略 ”和 “计算策略参考”。
代理砖块:多代理主管现在支持 Unity 目录函数和外部 MCP 服务器
2025 年 10 月 29 日
使用代理砖块:多代理监督程序来创建一个监督系统,该系统可以协调 Genie Spaces、代理终端和工具,共同完成跨不同专用领域的复杂任务。 现在可以提供监督系统工具,例如 Unity 目录函数和外部 MCP 服务器。 监督代理会将相关任务委托给这些工具。
AI 代理不再推荐使用的反馈模型
2025 年 10 月 29 日
已弃用 AI 代理的实验性反馈模型。 从 2025 年 11 月 1 日起,新部署的代理不包括反馈模型。 升级到 MLflow 3,并使用 log_feedback API 收集有关代理跟踪的评估。 请参阅反馈模型(已弃用)。
请求日志和评估日志表已弃用
2025 年 10 月 29 日
payload_request_logs 表和 payload_assessment_logs 表已弃用。 从 2025 年 11 月 1 日起,新部署的代理不会包含这些表。 从 2025 年 11 月 15 日起,现有表不会填充新数据。 升级到 MLflow 3 进行实时跟踪或使用提供的视图。 请参阅代理推理表:请求和评估日志(已弃用)。
Databricks JDBC 驱动程序 2.7.5
2025 年 10 月 23 日
Databricks JDBC 驱动程序 (Simba) 版本 2.7.5 现已提供以下改进:
新增功能
连接器现在支持具有代理连接的 Kerberos。 若要启用 Kerberos 代理,请设置 UseProxy=1 和 ProxyAuth=2。 若要设置代理详细信息,请使用 ProxyHost、 ProxyPort、 ProxyKrbRealm、 ProxyKrbFQDN和 ProxyKrbService。
已解决的问题
- 修复了连接器无法运行本机模式下包含
?字符的复杂查询的问题。 - 修复了由意外连接器行为导致的 Unity Catalog 数据卷导入中的间歇性故障。
- 修复了在表中包含类型为
getColumns或Void的列并启用了Variant标志时出现的断言错误。
Lakeflow Connect 中的 Zerobus 数据导入连接器(公共预览版)
2025 年 10 月 23 日
Lakeflow Connect 中的 Zerobus Ingest 连接器处于公开预览阶段。 此连接器通过 gRPC API 直接将每条记录的数据引入到 Delta 表中。
列删除行为已更新
2025 年 10 月 22 日
尝试删除被分配了一个或多个受管控标签的列时,操作现在会失败。 若要删除标记列,必须先从中删除所有受治理的标记。 请参阅 “删除包含受治理标记的列”。
Databricks Runtime 17.3 LTS 现已正式发布
2025 年 10 月 22 日
Databricks Runtime 17.3 LTS 现已正式发布。 请参阅 用于机器学习的 Databricks Runtime 17.3 LTS 和 Databricks Runtime 17.3 LTS。
兼容性模式(公共预览版)
2025 年 10 月 21 日
兼容性模式现在以公共预览版提供。 兼容性模式生成 Unity Catalog 托管表、流式表或具体化视图的只读版本,这些版本会与原始表自动同步。 这使外部 Delta Lake 和 Iceberg 客户端(如 Amazon Athena、Snowflake 和 Azure Fabric)能够读取表和视图,而无需牺牲 Azure Databricks 的性能。 可以配置只读版本刷新的频率,直到几乎实时。
Zstd 现在是新托管表的默认压缩
2025 年 10 月 21 日
Databricks Runtime 16.0及更高版本中,所有新创建的托管表现在默认使用Zstandard压缩(Zstd),而不是Snappy。
现有表继续使用其当前压缩编解码器。 若要更改现有表的压缩编解码器,请设置 delta.parquet.compression.codec 表属性。 请参阅 Delta 表属性参考。
Databricks Runtime 维护更新(第 2 轮)
2025 年 10 月 21 日
新的维护更新可用于受支持的 Databricks Runtime 版本。 这些更新包括 bug 修复、安全修补程序和性能改进。 有关详细信息,请参阅 Databricks Runtime 维护更新。
统一运行列表(公测版)
2025 年 10 月 20 日
统一运行列表处于公开预览阶段。 在单个统一列表中监视作业和管道运行。
仪表板标记 (公共预览版)
2025 年 10 月 16 日
现在可以将标记添加到仪表板和 Genie 空间,以改进整个工作区中的组织。 标记可用于自动化。 例如,可以将仪表板标记为“正在进行的工作”,一夜之间过程可以使用 API 自动检索具有该标记的所有仪表板,并将其分配给临时仓库,直到标记为“已认证”。不支持使用仪表板标记进行搜索。
请参阅 “管理仪表板标记”。
现在可以在源表更新时触发作业
2025 年 10 月 16 日
现在可以为更新源表时运行的作业创建触发器。
适用于 Azure Databricks 的 SAP Business Data Cloud (BDC) 连接器已正式发布
2025 年 10 月 15 日
SAP BDC 连接器可在 SAP BDC 与启用了 Unity 目录的 Azure Databricks 工作区之间实现安全的零复制数据共享。 访问和分析 Azure Databricks 上的 SAP BDC 数据,并将 Azure Databricks 数据资产共享回 SAP BDC,以便跨两个平台进行统一分析。
请参阅 SAP Business Data Cloud (BDC) 和 Azure Databricks 之间的共享数据。
创建补填作业任务
2025 年 10 月 14 日
通过作业回填,可以触发作业运行以从过去回填数据。 这对于加载较旧的数据或在处理失败时修复数据非常有用。 有关详细信息,请参阅 回填作业。
改进了马赛克 AI 模型服务的自动缩放行为
2025 年 10 月 13 日
马赛克 AI 模型服务中的自动缩放已被调整,以忽略极其短暂的流量激增,而仅对负载持续增加作出响应。 此更改可防止在瞬间突发期间进行不必要的预配并发缩放,并降低服务成本,而不会影响性能或可靠性。
数据分类(公共预览版)
2025 年 10 月 13 日
Databricks 数据分类现在以公共预览版提供,支持所有目录类型,将所有分类结果合并到单个系统表中,以及用于查看和自动标记分类的新 UI。
基于上下文的入口控件 (Beta)
2025 年 10 月 9 日
基于上下文的入口控件现在处于 Beta 版中。 这使帐户管理员能够设置允许和拒绝规则,这些规则将 谁 呼叫、 呼叫地点 以及他们可以在 Azure Databricks 中访问 的内容 组合在一起。 基于上下文的访问控制确保只有标识、请求类型和网络源的受信任组合能够访问您的工作区。 单个策略可以管理多个工作区,确保在整个组织中实施一致。
计费使用情况表格现在记录无服务器作业和管道的性能模式。
2025 年 10 月 9 日
计费日志现在记录无服务器作业和管道的性能模式。 工作负荷的性能模式记录在product_features.performance_target列中,可以包含值PERFORMANCE_OPTIMIZED或 STANDARDnull。
Databricks Runtime 维护更新(第 1 轮)
2025 年 10 月 7 日
新的维护更新可用于受支持的 Databricks Runtime 版本。 这些更新包括 bug 修复、安全修补程序和性能改进。 有关详细信息,请参阅 Databricks Runtime 维护更新。
Databricks Runtime 17.3 LTS 和 Databricks Runtime 17.3 LTS ML 处于 Beta 阶段
2025 年 10 月 6 日
Databricks Runtime 17.3 LTS 和 Databricks Runtime 17.3 LTS ML 现已推出 Beta 版,由 Apache Spark 4.0.0 提供支持。 此版本包括新的配置选项、改进的错误处理和增强的 Spark Connect 支持。
请参阅 用于机器学习的 Databricks Runtime 17.3 LTS 和 Databricks Runtime 17.3 LTS。
分区元数据现已普遍可用
2025 年 10 月 6 日
现在可以为注册到 Unity 目录的外部表启用分区元数据日志记录(分区发现策略)。 请参阅 “使用分区元数据日志记录”。
Delta Sharing用户可以应用行过滤器和列掩码(GA)
2025 年 10 月 6 日
Delta Sharing 共享的接收者现在可以在共享的表和外部表上应用自己的行筛选器和列掩码。 但是,Delta Sharing 提供程序仍无法共享具有行级安全性或列掩码的数据资产。
有关详细信息,请参阅 “应用行筛选器”和“列掩码”。
认证状态系统标签为公共预览
2025 年 10 月 6 日
现在可以将受治理的 system.certification_status 标记应用于目录、架构、表、视图、卷、仪表板、已注册的模型和 Genie Spaces,以指示数据资产是否已 认证 或 弃用。 这提高了分析和 AI 工作负载的治理、可发现性和信任度。
Claude 模型现在支持提示缓存
2025 年 10 月 3 日
Databricks 托管的 Claude 模型现在支持提示缓存。 可以在查询请求中指定 cache_control 参数来缓存以下内容:
- 在
messages.content数组中处理消息内容。 - 数组中的
messages.content图像内容块。 - 工具的使用、结果和定义在数组
tools中。
笔记本电脑改进
2025 年 10 月 3 日
现在提供以下笔记本功能改进:
单元格执行迷你图现在显示在笔记本的右边距中。 使用迷你图直观地了解笔记本的运行状态,并在单元格之间快速导航。 请参阅 单元格执行迷你图。
使用 Databricks 助手来帮助诊断和修复环境错误,包括库安装错误。
重新连接到无服务器笔记本时,会话会自动使用笔记本的 Python 变量和 Spark 状态进行还原。 请参阅 无服务器笔记本的自动会话还原。
Pyspark 创作完成现在支持
agg、withColumns和withColumnsRenamedfilter/where子句。Databricks 现在支持导入和导出高达 100 MB 的 IPYNB 笔记本。 所有最大容量为100 MB的笔记本都支持修订快照自动保存、手动保存和克隆功能。 请参阅 笔记本大小。
克隆和导出笔记本时,现在可以选择是否包含单元格输出。 请参阅 “管理笔记本”格式。
从外部表转换为 Unity Catalog 托管表
2025 年 10 月 2 日
命令 ALTER TABLE ... SET MANAGED 现已正式发布。 此命令将 Unity 目录外部表无缝转换为托管表。 它允许充分利用 Unity 目录托管表功能,例如增强的治理、可靠性和性能。 请参阅 将外部表转换为托管 Unity 目录表。
Git 文件夹的 Git 电子邮件标识配置
2025 年 10 月 1 日
现在可以在为 Databricks Git 文件夹创建 Git 凭据时指定与用户名分开的 Git 提供程序电子邮件地址。 此电子邮件用作 Git 作者和提交者标识,用于通过 Git 文件夹进行的所有提交,确保 Git 提供程序中的正确归属,并更好地与 Git 帐户集成。
你提供的电子邮件地址将成为GIT_AUTHOR_EMAIL和GIT_COMMITTER_EMAIL,用于提交时,使 Git 提供者能够正确地将提交与您的用户帐户关联,并显示您的个人资料信息。 如果未指定任何电子邮件,Databricks 将使用 Git 用户名作为电子邮件地址(旧行为)。
请参阅 Git 提交标识和电子邮件配置。
为存储访问配置 Azure 虚拟网络服务策略(公共预览版)
2025 年 10 月 1 日
使用 Azure 虚拟网络服务终结点策略筛选来自经典计算平面的出站流量,确保仅连接到特定的 Azure 存储帐户。 请参阅 配置 Azure 虚拟网络服务终结点策略,以便从经典计算访问存储。
Databricks GitHub 应用的新权限
2025 年 10 月 1 日
如果拥有安装了 Azure Databricks GitHub 应用的 Azure Databricks 帐户,可能会收到一封标题为“Databricks 正在请求更新权限”的电子邮件。
这是 Databricks 的合法请求。 它要求你批准允许 Azure Databricks 读取 GitHub 帐户电子邮件的新权限。 授予此权限将允许 Azure Databricks 检索并保存您的主 GitHub 帐户电子邮件到 Azure Databricks 的已链接 Git 凭据中。 在即将推出的功能中,这将确保从 Azure Databricks 进行的提交 正确地链接到 您的 GitHub 账号。
如果不接受新权限,链接的 Git 凭据仍将使用 GitHub 进行身份验证。 但是,来自此凭据的未来提交不会 与 GitHub 帐户标识相关联