2018 年 6 月June 2018

这些功能和 Databricks 平台改进已于 2018 年 6 月发布。These features and Databricks platform improvements were released in June 2018.

RStudio 集成RStudio integration

2018 年 6 月 19 日:版本 2.74June 19, 2018: Version 2.74

Azure Databricks 现在与 RStudio Server(适用于 R 的常用 IDE)集成。利用此功能强大的新集成,你可以:Azure Databricks now integrates with RStudio Server, the popular IDE for R. With this powerful new integration, you can:

  • 直接从 Azure Databricks 启动 RStudio UI。Launch the RStudio UI directly from Azure Databricks.
  • 在 RStudio IDE 中导入 SparkR 和 sparklyr 包。Import SparkR and sparklyr packages inside the RStudio IDE.
  • 使用 Apache Spark 从 RStudio IDE 访问、浏览和转换大型数据集。Access, explore, and transform large datasets from RStudio IDE using Apache Spark.
  • 在 Azure Databricks 群集上执行和监视 Spark 作业。Execute and monitor Spark jobs on an Azure Databricks cluster.
  • 使用版本控制来管理代码。Manage your code using version control.
  • 使用 Azure Databricks 上的 RStudio Server 的开源版或专业版。Use either the Open Source or Pro editions of RStudio Server on Azure Databricks.

RStudio 集成需要 Azure Databricks 高级计划RStudio integration requires the Azure Databricks Premium Plan. 必须在高并发群集上安装集成。You must install the integration on a high concurrency cluster. 有关详细信息,请参阅 Azure Databricks 上的 RStudioFor details, see RStudio on Azure Databricks.

群集日志清除Cluster log purge

2018 年 6 月 19 日:版本 2.74June 19, 2018: Version 2.74

默认情况下,群集日志保留 30 天。By default, cluster logs are retained for 30 days. 现在,可以通过转到管理控制台上的“工作区存储”选项卡来立即永久地删除它们。You can now delete them permanently and immediately by going to the Workspace Storage tab on the Admin Console. 请参阅管理工作区存储See Manage workspace storage.

新区域New regions

2018 年 6 月 7 日June 7, 2018

目前,Azure Databricks 在以下区域中可用:Azure Databricks is now available in the following regions:

  • 澳大利亚东部East Australia
  • 澳大利亚东南部Southeast Australia
  • 英国南部South UK
  • 英国西部West UK

回收站文件夹Trash folder

2018 年 6 月 7 日:版本 2.73June 7, 2018: Version 2.73

新的 回收站“回收站”文件夹包含已删除的所有笔记本、库和文件夹。A new Trash Trash folder contains all notebooks, libraries, and folders that you have deleted. 30 天后,“回收站”文件夹会被自动清除。The Trash folder is automatically purged after 30 days. 可以通过将已删除的对象从“回收站”文件夹拖放到另一个文件夹中来还原该对象。You can restore a deleted object by dragging it out of the Trash folder into another folder.

有关详细信息,请参阅删除对象For details, see Delete an object.

缩短了日志保留期Reduced log retention period

2018 年 6 月 7 日:版本 2.73June 7, 2018: Version 2.73

群集日志现在会保留 30 天。Cluster logs are now retained for 30 days. 这些日志过去会无限期保留。They used to be retained indefinitely.

Gzip 压缩的 API 响应Gzipped API responses

2018 年 6 月 7 日:版本 2.73June 7, 2018: Version 2.73

使用 Accept-Encoding: gzip 标头发送的请求会返回 gzip 压缩响应。Requests sent with the Accept-Encoding: gzip header return gzipped responses. 有关示例,请参阅获取群集的 gzip 压缩列表For an example, see Get a gzipped list of clusters.

表导入 UITable import UI

2018 年 6 月 7 日:版本 2.73June 7, 2018: Version 2.73

创建表 UI 现在支持推断 CSV 文件架构的选项:The create table UI now supports an option to infer the schema of CSV files:

推断表架构选项Infer table schema option