2018 年 6 月

注意

下面列出的发行日期和内容在多数情况下只对应于 Azure 公有云的实际部署。

其中提供了 Azure 公有云上 Azure Databricks 服务的演进历史记录以供参考,这些内容可能不适用于由世纪互联运营的 Azure。

这些功能和 Databricks 平台改进已于 2018 年 6 月发布。

RStudio 集成

2018 年 6 月 19 日:版本 2.74

Azure Databricks 现在与 RStudio Server(适用于 R 的常用 IDE)集成。利用此功能强大的新集成,你可以:

  • 直接从 Azure Databricks 启动 RStudio UI。
  • 在 RStudio IDE 中导入 SparkR 和 sparklyr 包。
  • 使用 Apache Spark 从 RStudio IDE 访问、浏览和转换大型数据集。
  • 在 Azure Databricks 群集上执行和监视 Spark 作业。
  • 使用版本控制来管理代码。
  • 使用 Azure Databricks 上的 RStudio Server 的开源版或专业版。

RStudio 集成需要高级计划。 必须在高并发群集上安装集成。 有关详细信息,请参阅 Azure Databricks 上的 RStudio

群集日志清除

2018 年 6 月 19 日:版本 2.74

默认情况下,群集日志保留 30 天。 现在,可以通过转到管理控制台上的“工作区存储”选项卡来立即永久地删除它们。 请参阅清除工作区存储

新区域

2018 年 6 月 7 日

目前,Azure Databricks 在以下区域中可用:

  • 澳大利亚东部
  • 澳大利亚东南部
  • 英国南部
  • 英国西部

回收站文件夹

2018 年 6 月 7 日:版本 2.73

新的 回收站回收站”文件夹包含已删除的所有笔记本、库和文件夹。 30 天后,“回收站”文件夹会被自动清除。 可以通过将已删除的对象从“回收站”文件夹拖放到另一个文件夹中来还原该对象。

有关详细信息,请参阅删除对象

缩短了日志保留期

2018 年 6 月 7 日:版本 2.73

群集日志现在会保留 30 天。 这些日志过去会无限期保留。

Gzip 压缩的 API 响应

2018 年 6 月 7 日:版本 2.73

使用 Accept-Encoding: gzip 标头发送的请求会返回 gzip 压缩响应。

表导入 UI

2018 年 6 月 7 日:版本 2.73

创建表 UI 现在支持推断 CSV 文件架构的选项:

推断表架构选项