2018 年 1 月

发布分阶段进行。 Databricks 帐户可能会在初始发布日期一周后才会更新。

注意

下面列出的发行日期和内容在多数情况下只对应于 Azure 公有云的实际部署。

其中提供了 Azure 公有云上 Azure Databricks 服务的演进历史记录以供参考,这些内容可能不适用于由世纪互联运营的 Azure。

Azure Blob 存储容器和 Data Lake Store 的装入点

2018 年 1 月 16-23 日:版本 2.63

我们提供了有关通过 Databricks 文件系统 (DBFS) 装载 Azure Blob 存储容器和 Data Lake Store 的说明。 这样,同一工作区中的所有用户都可以通过装入点访问 Blob 存储容器或 Data Lake Store(或者容器或存储中的文件夹)。 DBFS 管理用于访问已装载的 Blob 存储容器或 Data Lake Store 的凭据,并在后台自动处理通过 Azure Blob 存储或 Data Lake Store 进行的身份验证。

装载 Blob 存储容器和 Data Lake Store 需要 Databricks Runtime 4.0 及更高版本。 装载容器或存储后,可以使用 Runtime 3.4 或更高版本来访问装入点。

有关详细信息,请参阅连接到 Azure Data Lake Storage Gen2 和 Blob 存储和从 Azure Databricks 访问 Azure Data Lake Storage Gen1。

群集标记

2018 年 1 月 4-11 日:版本 2.62

现在可以指定将传播到与群集关联的所有 Azure 资源(VM、磁盘、NIC 等)的群集标记。 除了用户提供的标记外,资源还将自动标记有群集名称、群集 ID 和群集创建者用户名。

有关详细信息,请参阅标记

SQL 和 Python 的表访问控制(个人预览版)

2018 年 1 月 4-11 日:版本 2.62

注意

此功能在个人预览版中提供。 请联系你的帐户管理员以请求访问权限。 此功能还需要 Databricks Runtime 3.5+。

去年,我们为 SQL 用户引入了数据对象访问控制。 今天,我们很高兴地宣布为 SQL 和 Python 用户提供表访问控制 (ACL) 的专用预览版。 使用表访问控制,可以限制对安全对象(如表、数据库、视图或函数)的访问。 还可以对包含任意查询的派生视图设置权限来提供细粒度的访问控制(例如,针对符合特定条件的行和列)。

有关详细信息,请参阅 Hive 元存储特权和安全对象(旧版)

通过 API 导出笔记本作业运行结果

2018 年 1 月 4 日至 11 日:版本 2.62

为了提高你在作业结果上进行共享和协作的能力,我们现在提供一个新的作业 API 终结点 jobs/runs/export,它允许你在代码和仪表板视图中检索笔记本作业运行结果的静态 HTML 表示形式。

有关详细信息,请参阅运行导出

Apache Airflow 1.9.0 包括 Databricks 集成

2018 年 1 月 2 日

去年,我们发布了 Airflow(一种常用的管理 ETL 计划的解决方案)的预览版功能,使客户能够以原生方式创建在 Airflow DAG 中触发 Databricks 运行的任务。 我们很高兴地宣布,这些集成已在 Airflow 1.9.0 版中公开发布。

有关详细信息,请参阅使用 Apache Airflow 协调 Azure Databricks 作业