2021 年 2 月
这些功能和 Azure Databricks 平台改进已于 2021 年 2 月发布。
注意
下面列出的发行日期和内容在多数情况下只对应于 Azure 公有云的实际部署。
其中提供了 Azure 公有云上 Azure Databricks 服务的演进历史记录以供参考,这些内容可能不适用于由世纪互联运营的 Azure。
注意
发布分阶段进行。 Azure Databricks 帐户可能要等到初始发布日期后的一周或更长时间才会更新。
新的 Azure Databricks Power BI 连接器 (GA)
2021 年 2 月 26 日
用于 Azure Databricks 的新 Power BI 连接器在 2020 年 9 月发布了公开预览版,现已推出 GA 版。 提供以下功能:
- 简单的连接配置:新的 Power BI Azure Databricks 连接器已集成到 Power BI 中,你只需要单击几下鼠标,即可使用简单的对话框对其进行配置。
- 基于 Microsoft Entra ID 凭据进行身份验证,管理员无需再配置 PAT 令牌。
- 由于新的 Azure Databricks ODBC 驱动程序提供了显著的性能改进,因此导入操作和优化的元数据调用操作速度更快。
- 通过 Power BI 访问 Azure Databricks 数据时,将遵守 Azure Databricks 表访问控制以及与你的 Microsoft Entra ID 标识关联的 Azure 存储帐户权限。
有关详细信息,请参阅将 Power BI 连接到 Azure Databricks。
Azure Databricks 中的用户活动诊断日志记录推出 GA 版
2021 年 2 月 23 日 - 3 月2日:版本 3.40
可以捕获用户在 Azure Databricks 中执行的活动的详细审核线索(现已正式发布)。
请参阅诊断日志参考。
向 DBFS REST API 获取状态和列表响应添加了 modification_time
2021 年 2 月 23 日 - 3 月2日:版本 3.40
现在可以在 DBFS REST API 中获取文件对象的最后修改时间。 现在,通过获取状态和列表 API 终结点,可以在 FileInfo 响应结构中返回 modification_time
。 针对目录的获取状态调用的 JSON 响应示例:
{"path": "/test-directory", "is_dir": true, "file_size": 0, "modification_time": 1610366751000}
请参阅 DBFS API。
快速复制 MLflow 中的长试验名称
2021 年 2 月 16 日 - 2 月 23 日:版本 3.39
现在可以从试验页复制试验名称,这使得可以更轻松地将活动 MLflow 试验设置为笔记本日志运行的试验。 请参阅复制试验名称。
调整了服务群集的内存大小和核心数
2021 年 2 月 16 日 - 2 月 23 日:版本 3.39
现在可以自定义用于 MLflow 模型服务的群集。 请参阅特征存储集成。
Web 终端现已正式发布
2021 年 2 月 16 日 - 2 月 23 日:版本 3.39
Web 终端现已正式发布。 它提供了一种便捷且高度交互的方式,使你可以在 Spark 驱动程序节点上运行 shell 命令并使用编辑器。 请参阅在 Azure Databricks Web 终端中运行 Shell 命令。
适用于 Azure SQL 数据库的 Apache Spark 连接器和 SQL Server 支持 Databricks Runtime 7.x 及更高版本
2021 年 2 月 16 日
适用于 Azure SQL 数据库和 SQL Server 的 Spark 连接器现在支持 Spark 3,因此支持 Databricks Runtime 7.x 及更高版本。
Databricks Runtime 7.2 系列支持结束
2021 年 2 月 11 日
对 Databricks Runtime 7.2、用于机器学习的 Databricks Runtime 7.2 以及用于基因组学的 Databricks Runtime 7.2 的支持已于 2 月 11 日结束。 请参阅 Databricks 支持生命周期。
Databricks Runtime 7.6 GA
2021 年 2 月 8 日
Databricks Runtime 7.6 和 Databricks Runtime 7.6 ML 现已正式发布。
有关信息,请参阅 Databricks Runtime 7.6 (EoS) 和用于机器学习的 Databricks Runtime 7.6 (EoS) 中的完整发行说明。
Databricks Runtime 8.0(beta 版本)
2021 年 2 月1 日
Databricks Runtime 8.0 和 Databricks Runtime 8.0 ML 现已作为 Beta 版本发布。
有关信息,请参阅 Databricks Runtime 8.0 (EoS) 和用于 ML 的 Databricks Runtime 8.0 (EoS) 中的完整发行说明。
用于基因组学的 Databricks Runtime 现已弃用
2021 年 2 月1 日
Databricks 不再开发新版本的用于基因组学的 Databricks Runtime,并将在 2022年 9 月 24 日删除对用于基因组学的 Databricks Runtime 的支持,届时用于基因组学的 Databricks Runtime 7.3 LTS 支持将终止。 到那时,创建群集时将无法选择用于基因组学的 Databricks Runtime。
有关 Databricks Runtime 弃用策略和计划的详细信息,请参阅支持的 Databricks Runtime LTS 版本。
在 MLflow 运行项目显示中查看更具可读性的 JSON
2021 年 2 月 4 日 - 2 月 11 日:版本 3.38
MLflow 项目面板中的 JSON 输出现在采用可读性更强的格式。
使用 REST API 在模型注册表中提供注释
2021 年 2 月 4 日 - 2 月 11 日:版本 3.38
现在可以使用 REST API 在模型注册表中添加注释。
在 API 调用中轻松指定默认群集值
2021 年 2 月 4 日 - 2 月 11 日:版本 3.38
使用 Databricks 群集 API创建和编辑通用群集时,现在可以使用 applyDefaultPolicyValues
字段。 如果为 true
,则对缺少的群集属性使用策略默认值。
根据当前工作分配微调群集辅助角色配置
2021 年 2 月 4 日 - 2 月 11 日:版本 3.38
群集列表显示分配给每个正在运行的群集的工作线程数。 此数字现在显示在群集详细信息页,因此可以轻松地将群集的当前大小与群集配置详细信息进行比较,并根据需要进行配置调整。
使用任务参数变量将上下文特定信息传递给作业的任务
2021 年 2 月 4 日 - 2 月 11 日:版本 3.38
现在可以将变量传递给包含上下文特定信息(如作业 ID 或执行开始时间)的任务。 有关详细信息,请参阅什么是动态值引用?。
作业失败的错误消息不再包含可能敏感的信息
2021 年 2 月 4 日 - 2 月 11 日:版本 3.38
作业失败错误消息不再包括来自 Java 异常的堆栈跟踪。 miscMessage
字段中包含的堆栈跟踪可能会向用户公开敏感信息。