2018 年 7 月
这些功能和 Azure Databricks 平台的改进已于 2018 年 7 月发布。
注意
下面列出的发行日期和内容在多数情况下只对应于 Azure 公有云的实际部署。
其中提供了 Azure 公有云上 Azure Databricks 服务的演进历史记录以供参考,这些内容可能不适用于由世纪互联运营的 Azure。
库 API 支持 Python wheel 文件
2018 年 7 月 31 日 - 8 月 7 日:版本 2.77
现在可以使用库 API 来安装 wheel 库。 在运行 Databricks Runtime 4.2 或更高版本的群集上安装 wheel 库时,会包括在库 setup.py
文件中指定的所有依赖项。 在运行 Databricks Runtime 4.1 或更低版本的群集上安装 wheel 库时,该文件会添加到 PYTHONPATH
变量,而不会安装依赖项。
IPython 笔记本导出
2018 年 7 月 31 日 - 8 月 7 日:版本 2.77
现在,在将 Azure Databricks 笔记本导出到 IPython 笔记本格式时,结果会包含在导出中。
Azure Key Vault 支持的机密范围
2018 年 7 月 19 日 - 24 日:版本 2.76
现在,机密支持由 Azure Key Vault 支持的范围。 在创建范围后,可以从该范围访问相应 Key Vault 中的所有机密。 有关详细信息,请参阅创建 Azure Key Vault 支持的机密范围。
注意
Azure Key Vault 支持的机密范围是 Key Vault 的只读接口。 若要在 Azure 密钥保管库中管理机密,必须使用 Azure 设置机密 REST API 或 Azure 门户 UI。
高级试用版工作区
2018 年 7 月 20 日 - 24 日:版本 2.76
Azure Databricks 现在提供了试用版高级工作区。 在 14 天的试用期中,你可以访问免费的 Azure Databricks DBU。 有关详细信息,请参阅创建工作区。
群集模式和高并发性群集
2018 年 7 月 19 日 - 24 日:版本 2.76
在创建群集时,“群集类型”选项已重命名为“群集模式” 。 “无服务器池”选项已由“高并发性”群集模式替代 。 高并发性群集已经过优化,在由多个并发活动用户共享时可以提供高效的资源利用率、隔离、安全性和最佳性能。 高并发性群集只支持 SQL、Python 和 R 语言。 高并发性群集提供了无服务器池的所有优点,同时还允许灵活地进行 Spark 和资源配置。 有关详细信息,请参阅高并发群集。
表访问控制
2018 年 7 月 19 日 - 24 日:版本 2.76
“表访问控制”复选框只适用于高并发群集。
不可用的群集节点类型已灰显
2018 年 7 月 3 日 - 10 日:版本 2.75
现在,不适用于你的订阅和区域的群集节点类型已灰显,你在创建群集时无法选择它们。
R Markdown 支持
2018 年 7 月 3 日 - 10 日:版本 2.75
Azure Databricks R 笔记本可以导出到 R Markdown 格式,R Markdown 文档可以作为 Azure Databricks 笔记本导入。
重新设计了主页,可以通过拖放文件来导入数据
2018 年 7 月 3 日 - 10 日:版本 2.75
新主页添加了更加清晰简洁的界面,其中有指向改进后的入门教程的链接,并且提供了通过拖放文件来导入数据的功能。 请参阅在 DBFS 中浏览和创建表。
小组件默认行为
2018 年 7 月 3 日 - 10 日:版本 2.75
现在,在为小组件选择新值时的默认执行行为是“不执行任何操作”。 在更改小组件值时,如果需要重新运行完整的笔记本,或者只重新运行与值相关的命令,则必须更新小组件设置。 请参阅配置小组件设置。
表创建 UI
2018 年 7 月 3 日 - 10 日:版本 2.75
现在,在该 UI 中创建表时,请从“数据”页选择“添加数据”。
请参阅在 DBFS 中浏览和创建表。
多行 JSON 数据导入
2018 年 7 月 3 日 - 10 日:版本 2.75
现在,在创建表时可以导入多行 JSON 数据文件。 以前,JSON 数据文件必须平展到一行。 请参阅在 DBFS 中浏览和创建表。