2021 年 2 月

这些功能和 Azure Databricks 平台改进已于 2021 年 2 月发布。

注意

下面列出的发行日期和内容在多数情况下只对应于 Azure 公有云的实际部署。

其中提供了 Azure 公有云上 Azure Databricks 服务的演进历史记录以供参考,这些内容可能不适用于由世纪互联运营的 Azure。

注意

发布分阶段进行。 Azure Databricks 帐户可能要等到初始发布日期后的一周或更长时间才会更新。

新的 Azure Databricks Power BI 连接器 (GA)

2021 年 2 月 26 日

用于 Azure Databricks 的新 Power BI 连接器在 2020 年 9 月发布了公开预览版,现已推出 GA 版。 提供以下功能:

  • 简单的连接配置:新的 Power BI Azure Databricks 连接器已集成到 Power BI 中,你只需要单击几下鼠标,即可使用简单的对话框对其进行配置。
  • 基于 Microsoft Entra ID 凭据进行身份验证,管理员无需再配置 PAT 令牌。
  • 由于新的 Azure Databricks ODBC 驱动程序提供了显著的性能改进,因此导入操作和优化的元数据调用操作速度更快。
  • 通过 Power BI 访问 Azure Databricks 数据时,将遵守 Azure Databricks 表访问控制以及与你的 Microsoft Entra ID 标识关联的 Azure 存储帐户权限。

有关详细信息,请参阅将 Power BI 连接到 Azure Databricks

Azure Databricks 中的用户活动诊断日志记录推出 GA 版

2021 年 2 月 23 日 - 3 月2日:版本 3.40

可以捕获用户在 Azure Databricks 中执行的活动的详细审核线索(现已正式发布)。

请参阅诊断日志参考

向 DBFS REST API 获取状态和列表响应添加了 modification_time

2021 年 2 月 23 日 - 3 月2日:版本 3.40

现在可以在 DBFS REST API 中获取文件对象的最后修改时间。 现在,通过获取状态和列表 API 终结点,可以在 FileInfo 响应结构中返回 modification_time。 针对目录的获取状态调用的 JSON 响应示例:

{"path": "/test-directory", "is_dir": true, "file_size": 0, "modification_time": 1610366751000}

请参阅 DBFS API

快速复制 MLflow 中的长试验名称

2021 年 2 月 16 日 - 2 月 23 日:版本 3.39

现在可以从试验页复制试验名称,这使得可以更轻松地将活动 MLflow 试验设置为笔记本日志运行的试验。 请参阅复制试验名称

调整了服务群集的内存大小和核心数

2021 年 2 月 16 日 - 2 月 23 日:版本 3.39

现在可以自定义用于 MLflow 模型服务的群集。 请参阅特征存储集成

Web 终端现已正式发布

2021 年 2 月 16 日 - 2 月 23 日:版本 3.39

Web 终端现已正式发布。 它提供了一种便捷且高度交互的方式,使你可以在 Spark 驱动程序节点上运行 shell 命令并使用编辑器。 请参阅在 Azure Databricks Web 终端中运行 Shell 命令

适用于 Azure SQL 数据库的 Apache Spark 连接器和 SQL Server 支持 Databricks Runtime 7.x 及更高版本

2021 年 2 月 16 日

适用于 Azure SQL 数据库和 SQL Server 的 Spark 连接器现在支持 Spark 3,因此支持 Databricks Runtime 7.x 及更高版本。

Databricks Runtime 7.2 系列支持结束

2021 年 2 月 11 日

对 Databricks Runtime 7.2、用于机器学习的 Databricks Runtime 7.2 以及用于基因组学的 Databricks Runtime 7.2 的支持已于 2 月 11 日结束。 请参阅 Databricks 支持生命周期

Databricks Runtime 7.6 GA

2021 年 2 月 8 日

Databricks Runtime 7.6 和 Databricks Runtime 7.6 ML 现已正式发布。

有关信息,请参阅 Databricks Runtime 7.6 (EoS)用于机器学习的 Databricks Runtime 7.6 (EoS) 中的完整发行说明。

Databricks Runtime 8.0(beta 版本)

2021 年 2 月1 日

Databricks Runtime 8.0 和 Databricks Runtime 8.0 ML 现已作为 Beta 版本发布。

有关信息,请参阅 Databricks Runtime 8.0 (EoS)用于 ML 的 Databricks Runtime 8.0 (EoS) 中的完整发行说明。

用于基因组学的 Databricks Runtime 现已弃用

2021 年 2 月1 日

Databricks 不再开发新版本的用于基因组学的 Databricks Runtime,并将在 2022年 9 月 24 日删除对用于基因组学的 Databricks Runtime 的支持,届时用于基因组学的 Databricks Runtime 7.3 LTS 支持将终止。 到那时,创建群集时将无法选择用于基因组学的 Databricks Runtime。

有关 Databricks Runtime 弃用策略和计划的详细信息,请参阅支持的 Databricks Runtime LTS 版本

在 MLflow 运行项目显示中查看更具可读性的 JSON

2021 年 2 月 4 日 - 2 月 11 日:版本 3.38

MLflow 项目面板中的 JSON 输出现在采用可读性更强的格式。

使用 REST API 在模型注册表中提供注释

2021 年 2 月 4 日 - 2 月 11 日:版本 3.38

现在可以使用 REST API 在模型注册表中添加注释。

在 API 调用中轻松指定默认群集值

2021 年 2 月 4 日 - 2 月 11 日:版本 3.38

使用 Databricks 群集 API创建和编辑通用群集时,现在可以使用 applyDefaultPolicyValues 字段。 如果为 true,则对缺少的群集属性使用策略默认值。

根据当前工作分配微调群集辅助角色配置

2021 年 2 月 4 日 - 2 月 11 日:版本 3.38

群集列表显示分配给每个正在运行的群集的工作线程数。 此数字现在显示在群集详细信息页,因此可以轻松地将群集的当前大小与群集配置详细信息进行比较,并根据需要进行配置调整。

使用任务参数变量将上下文特定信息传递给作业的任务

2021 年 2 月 4 日 - 2 月 11 日:版本 3.38

现在可以将变量传递给包含上下文特定信息(如作业 ID 或执行开始时间)的任务。 有关详细信息,请参阅什么是动态值引用?

作业失败的错误消息不再包含可能敏感的信息

2021 年 2 月 4 日 - 2 月 11 日:版本 3.38

作业失败错误消息不再包括来自 Java 异常的堆栈跟踪。 miscMessage 字段中包含的堆栈跟踪可能会向用户公开敏感信息。