2018 年 6 月
注意
下面列出的发行日期和内容在多数情况下只对应于 Azure 公有云的实际部署。
其中提供了 Azure 公有云上 Azure Databricks 服务的演进历史记录以供参考,这些内容可能不适用于由世纪互联运营的 Azure。
这些功能和 Databricks 平台改进已于 2018 年 6 月发布。
RStudio 集成
2018 年 6 月 19 日:版本 2.74
Azure Databricks 现在与 RStudio Server(适用于 R 的常用 IDE)集成。利用此功能强大的新集成,你可以:
- 直接从 Azure Databricks 启动 RStudio UI。
- 在 RStudio IDE 中导入 SparkR 和 sparklyr 包。
- 使用 Apache Spark 从 RStudio IDE 访问、浏览和转换大型数据集。
- 在 Azure Databricks 群集上执行和监视 Spark 作业。
- 使用版本控制来管理代码。
- 使用 Azure Databricks 上的 RStudio Server 的开源版或专业版。
RStudio 集成需要高级计划。 必须在高并发群集上安装集成。 有关详细信息,请参阅 Azure Databricks 上的 RStudio。
群集日志清除
2018 年 6 月 19 日:版本 2.74
默认情况下,群集日志保留 30 天。 现在,可以通过转到管理控制台上的“工作区存储”选项卡来立即永久地删除它们。 请参阅清除工作区存储。
新区域
2018 年 6 月 7 日
目前,Azure Databricks 在以下区域中可用:
- 澳大利亚东部
- 澳大利亚东南部
- 英国南部
- 英国西部
回收站文件夹
2018 年 6 月 7 日:版本 2.73
新的 “回收站”文件夹包含已删除的所有笔记本、库和文件夹。 30 天后,“回收站”文件夹会被自动清除。 可以通过将已删除的对象从“回收站”文件夹拖放到另一个文件夹中来还原该对象。
有关详细信息,请参阅删除对象。
缩短了日志保留期
2018 年 6 月 7 日:版本 2.73
群集日志现在会保留 30 天。 这些日志过去会无限期保留。
Gzip 压缩的 API 响应
2018 年 6 月 7 日:版本 2.73
使用 Accept-Encoding: gzip
标头发送的请求会返回 gzip 压缩响应。
表导入 UI
2018 年 6 月 7 日:版本 2.73
创建表 UI 现在支持推断 CSV 文件架构的选项: