2024 年 5 月
这些功能和 Azure Databricks 平台改进已于 2024 年 5 月发布。
注意
下面列出的发行日期和内容在多数情况下只对应于 Azure 公有云的实际部署。
其中提供了 Azure 公有云上 Azure Databricks 服务的演进历史记录以供参考,这些内容可能不适用于由世纪互联运营的 Azure。
注意
发布分阶段进行。 Azure Databricks 帐户可能要等到初始发布日期后的一周或更长时间才会更新。
无服务器防火墙配置现在支持更多计算类型
2024 年 5 月 31 日
Azure Databricks 现在支持使用网络连接配置 (NCC) 为无服务器作业、笔记本、Delta Live Tables 管道以及模型服务 CPU 终结点访问配置防火墙。 帐户管理员可以创建 NCC 并将其附加到工作区,以确保通过稳定的子网进行安全且受控的访问。
对 Databricks Runtime 15.0 系列的支持结束
2024 年 5 月 31 日
对 Databricks Runtime 15.0 和用于机器学习的 Databricks Runtime 15.0 的支持于 5 月 31 日结束。 请参阅 Databricks 支持生命周期。
Databricks Runtime 15.3(beta 版本)
2024 年 5 月 30 日
Databricks Runtime 15.3 和 Databricks Runtime 15.3 ML 现已作为 Beta 版本提供。
请参阅 Databricks Runtime 15.3 和用于机器学习的 Databricks Runtime 15.2。
计算指标 UI 目前在所有 Databricks Runtime 版本上可用
2024 年 5 月 30 日
计算指标 UI 已推出到所有 Databricks Runtime 版本。 以前,这些指标仅适用于在 Databricks Runtime 13.3 及更高版本上运行的计算资源。 请参阅查看计算指标。
改进了笔记本和 SQL 编辑器结果表中的搜索和筛选
2024 年 5 月 28 日
你现在可以在笔记本和 SQL 编辑器中的结果表中轻松地搜索列,并从现有值的下拉列表中选择筛选值。
新仪表板可帮助 Databricks 市场提供程序监视列表使用情况
2024 年 5 月 28 日
新的提供程序分析仪表板使 Databricks 市场提供程序能够监视列表视图、请求和安装。 仪表板从市场系统表中拉取数据。
在 Query Profile
中查看系统生成的联合查询
2024 年 5 月 24 日
Lakehouse Federation 现在支持在查询配置文件中查看系统生成的联合查询及其指标。 单击图形视图中的联合扫描节点可显示推送到数据源中的查询。 请参阅查看系统生成的联合查询。
必须将计算平面出站 IP 地址添加到工作区 IP 允许列表
2024 年 5 月 24 日
如果你在工作区上使用安全群集连接和 IP 访问列表,则必须将计算平面用来访问控制平面的所有公共 IP 添加到允许列表,或者配置后端专用链接。 此更改将于 2024 年 7 月 29 日影响所有新工作区,将于 2024 年 8 月 26 日影响现有工作区。 有关详细信息,请参阅此 Databricks Community 帖子。
例如,如果你在使用 VNet 注入的工作区上启用安全群集连接,则 Databricks 会建议你为工作区使用一个稳定的出口公共 IP。 该公共 IP 和任何其他 IP 都必须出现在允许列表中。 请参阅使用安全群集连接时的出口 IP 地址。 或者,如果使用 Azure Databricks 托管 VNet 并将托管 NAT 网关配置为访问公共 IP,则必须在允许列表中显示这些 IP。
请参阅配置工作区的 IP 访问列表。
适用于 Snowflake 的 Lakehouse Federation 中支持 OAuth
2024 年 5 月 24 日
Unity Catalog 现在允许使用 OAuth 创建 Snowflake 连接。 请参阅在 Snowflake 上运行联合查询。
从工作区浏览器批量移动和删除工作区对象
2024 年 5 月 24 日
现在可以在工作区中选择多个项来移动或删除。 选择多个对象后,将会显示一个操作栏,其中包含用于移动或删除项的选项。 此外,你还可以使用鼠标选择多个项,并将其拖动到新位置。 在执行批量移动和删除操作期间,对象上的现有权限仍适用。
Unity 目录对象在“最近使用“和“收藏夹“中可用
2024 年 5 月 23 日
现在可以在“最近使用“列表中找到 Unity 目录对象,如目录和架构。 还可以在目录资源管理器和架构浏览器中收藏 Unity 目录对象,并在工作区主页上查找收藏的对象。
新的 dbt-databricks 连接器 1.8.0 采用解耦合的 dbt 体系结构
2024 年 5 月 23 日
DBT-Databricks 连接器 1.8.0 是采用新的解耦合 dbt 体系结构的第一个版本。 相较于过去依赖 dbt-core 使客户无需指定两个库的版本,连接器现在依赖于适配器和 dbt-core 之间的共享抽象层。 因此,连接器不再需要将 Databricks 功能版本与 dbt-core 版本匹配,并且可以自由采用语义版本控制。 这意味着连接器开发人员不再需要以补丁的形式发布诸如按模型计算等重要功能。
此版本还带来了以下内容:
- 改进了具体化视图和流式处理表的声明和操作,包括计划自动刷新的功能。
- 支持 Unity Catalog 安全对象标记。 为了将它们与 dbt 标记区分开来,这些元数据通常用于在 dbt 操作中选择模型,这些标记在模型配置中命名为
databricks_tags
。 - 元数据处理性能的多项改进。
新的合规性和安全性设置 API(公共预览版)
2024 年 5 月 23 日
Databricks 针对工作区中的合规性安全配置文件、增强的安全监视和自动群集更新设置引入了新的 API。 请参阅:
Databricks Runtime 15.2 已正式发布
2024 年 5 月 22 日
Databricks Runtime 15.2 和 Databricks Runtime 15.2 ML 现已正式发布。
请参阅 Databricks Runtime 15.2 和用于机器学习的 Databricks Runtime 15.2。
用于 Delta Sharing 的新 Tableau 连接器
2024 年 5 月 22 日
新的 Tableau Delta Sharing 连接器简化了 Tableau Desktop 对使用 Delta Sharing 开放共享协议与你共享的数据的访问。 请参阅 Tableau:读取共享数据。
新的深度学习建议模型示例
2024 年 5 月 22 日
Databricks 发布了两个新示例,展示了现代深度学习推荐模型,包括双塔模型和 Meta 的 DLRM。
将存储凭据和外部位置绑定到特定工作区(公共预览版)
2024 年 5 月 22 日
现在,可以将存储凭据和外部位置绑定到特定工作区,从而阻止从其他工作区访问这些对象。 如果你使用工作区来隔离用户数据访问(例如,如果你有单独的生产和开发工作区或用于处理敏感数据的专用工作区),则此功能特别有用。
有关详细信息,请参阅(可选)将外部位置分配给特定工作区和(可选)向特定工作区分配存储凭据。
Git 文件夹已正式发布
2024 年 5 月 22 日
Git 文件夹现已正式发布。
Unity Catalog 中的预训练模型(公共预览版)
2024 年 5 月 21 日
Databricks 现在在 Unity Catalog 中提供精选的高质量、预训练的 GenAI 模型。 通过这些预训练模型,你可以在推理工作流中访问最先进的 AI 功能,从而节省生成自己的自定义模型所需的时间和费用。
Mosaic AI 矢量搜索正式发布
2024 年 5 月 21 日
Mosaic AI 矢量搜索现已正式发布。 请参阅 Mosaic AI 矢量搜索。
Databricks 助手自动完成(公共预览版)
2024 年 5 月 20 日
在笔记本、查询和文件中键入时,Databricks 助手自动完成会实时提供 AI 支持的建议。 若要启用此功能,请转到“设置”>“开发人员”>“实验性功能”并切换“Databricks 助手自动完成”。
基础模型训练中的 Meta Llama 3 支持
2024 年 5 月 20 日
基础模型训练现在支持 Meta Llama 3。
Git 文件夹 UI 的新变化
2024 年 5 月 17 日
你可能已注意到 Git 文件夹交互用户界面发生了一些变化。 我们添加了以下内容:
当你共享 Git 文件夹时,横幅中会出现一条新的提醒,提示你“复制链接以创建 Git 文件夹”。 单击该按钮时,会将一个 URL 复制到本地剪贴板,你可以将其发送给其他用户。 当接收方用户在浏览器中加载该 URL 时,该用户将转到工作区,他们可以在其中创建自己的从同一个远程 Git 存储库克隆的 Git 文件夹。 当接收方访问该 URL 时,他们将在 UI 中看到“创建 Git 文件夹”对话框,其中预先填充了从你的 Git 文件夹中获取的值。
类似地,当查看其他用户创建的 Git 文件夹时,新的警告横幅上会出现新按钮“创建 Git 文件夹”。 单击此按钮可根据“创建 Git 文件夹”对话框中预先填充的值,为同一 Git 存储库创建你自己的 Git 文件夹。
基础模型训练(公共预览版)
2024 年 5 月 13 日
Databricks 现在支持基础模型训练。 若要进行基础模型训练,你需要使用自己的数据自定义基础模型,以优化其在特定应用程序中的性能。 与从头开始训练模型相比,通过微调或继续训练基础模型,可以使用少得多的数据、时间和计算资源来训练你自己的模型。 训练数据、检查点和微调的模型都驻留在 Databricks 平台上,并与该平台的治理和生产力工具集成。
使用户能够将数据从结果表复制到剪贴板
2024 年 5 月 9 日
管理员现在可以启用或禁用用户将数据从结果表复制到剪贴板的功能。 之前,只有笔记本可使用此功能。 现在,此设置还适用于以下接口:
- Notebook
- 仪表板
- Genie Spaces
- 目录资源管理器
- 文件编辑器
- SQL 编辑器
Unity Catalog 对象的属性值现在可以是 1000 个字符(公共预览版)
2024 年 5 月 8 日
Unity Catalog 中的属性值现在可以长达 1000 个字符。 标记键的字符限制为 255。 请参阅“将标记应用于 Unity Catalog 安全对象”。
“新建预览”页
2024 年 5 月 8 日
在新预览页上启用和管理对 Databricks 预览版的访问。 请参阅管理 Azure Databricks 预览版。
Mosaic AI 矢量搜索的新功能
2024 年 5 月 8 日
新功能包括:
- IP 访问列表:现在受支持。
- 现在,客户管理的密钥 (CMK) 在 2024 年 5 月 8 日或之后创建的终结点上受支持。 对 CMK 的矢量搜索支持:公共预览版。
- 改进的审核日志和成本归因跟踪。 请参阅诊断日志参考。
- 现在可以将生成的嵌入另存为 Delta 表。
已弃用凭据直通和 Hive 元存储表访问控制
2024 年 5 月 7 日
Databricks Runtime 15.0 上已弃用凭据直通和 Hive 元存储表访问控制。在即将推出的 DBR 版本中将删除相关支持。
升级到 Unity Catalog 可提供一个集中位置来管理和审核帐户中多个工作区的数据访问,从而简化数据的安全性和治理。 请参阅什么是 Unity Catalog?。
Databricks JDBC 驱动程序 2.6.38
2024 年 5 月 6 日
已发布 Databricks JDBC 驱动程序版本 2.6.38(下载)。 此版本增加了以下新功能和增强功能:
- 在服务器使用
SPARK_CLI_SERVICE_PROTOCOL_V8
的情况下提供的本机参数化查询支持。 在本机查询模式下,查询中的参数个数限制为256
。 - 使用
Unity Catalog
卷支持进行的数据引入。 请在使用 Unity Catalog 连接到云对象存储中了解有关Unity Catalog
卷的详细信息。 若要使用此功能,请将UseNativeQuery
设置为1
。 QueryProfile
接口添加到IHadoopStatement
使应用程序可以检索查询的query id
。query id
可用于通过 Databricks REST API 提取查询的元数据。- Thrift 在服务器使用
SPARK_CLI_SERVICE_PROTOCOL_V9
的情况下调用的针对元数据的异步操作。 若要使用此功能,请将EnableAsyncModeForMetadataOperation
属性设置为1
。 - JWT 断言支持。 连接器现在支持使用客户端凭据的 JWT 断言 OAuth。 为此,请将
UseJWTAssertion
属性设置为1
。
此版本还解决了以下问题:
- Jackson 库更新。 连接器现在使用 Jackson JSON 分析程序的以下库:jackson-annotations 2.16.0(以前为 2.15.2)、jackson-core 2.16.0(以前为 2.15.2)、jackson-databind-2.16.0(以前为 2.15.2)
- 连接器在 META-INF 目录中包含未改装的类文件。
对工作区存储帐户的防火墙支持已正式发布
2024 年 5 月 6 日
创建新的 Azure Databricks 工作区时,会在托管资源组中创建一个 Azure 存储帐户,称为工作区存储帐户。 现在,可以启用防火墙来限制为只能从已授权的资源和网络访问你的工作区存储帐户。
Databricks Runtime 15.2(Beta 版本)
2024 年 5 月 2 日
Databricks Runtime 15.2 和 Databricks Runtime 15.2 ML 现已作为 Beta 版本提供。
请参阅 Databricks Runtime 15.2 和用于机器学习的 Databricks Runtime 15.2。
Notebooks 现在会检测并自动补全 Spark Connect 数据帧的列名
2024 年 5 月 1 日
Databricks 笔记本现在会自动检测和显示 Spark Connect DataFrames 中的列名,并允许你使用自动补全来选择列。