什么是 Visual Studio Code 的 Databricks 扩展?
若要立即开始使用 Visual Studio Code 的 Databricks 扩展,请跳到 Databricks 的 VSCode 扩展教程:在群集上将 Python 作为作业运行。
使用 Visual Studio Code 的 Databricks 扩展,可以从本地开发计算机上运行的 Visual Studio Code 集成开发环境 (IDE) 连接到远程 Azure Databricks 工作区。 通过这些连接,可以:
- 将你在 Visual Studio Code 中开发的本地代码与远程工作区中的代码同步。
- 在远程工作区中的 Azure Databricks 群集上从 Visual Studio Code 运行本地 Python 代码文件。
- 从 Visual Studio Code 将本地 Python 代码文件 (
.py
) 及 Python、R、Scala 和 SQL 笔记本(.py
、.ipynb
、.r
、.scala
和.sql
)作为远程工作区中的自动化 Azure Databricks 作业运行。
注意
Visual Studio Code 的 Databricks 扩展支持将 R、Scala 和 SQL 笔记本作为自动化作业运行,但不在 Visual Studio Code 中为这些语言提供任何更深入的支持。
使用入门
- 从动手实践教程开始试用该扩展。 请参阅 Databricks 的 VSCode 扩展教程:在群集上将 Python 作为作业运行。
- 完成该教程后,请使用该扩展执行以下一项或多项操作:
- 使用 Azure Databricks 个人访问令牌身份验证以外的 Azure Databricks 身份验证类型,向 Azure Databricks 工作区对 Visual Studio Code 的 Databricks 扩展进行身份验证。 请参阅Visual Studio Code 的 Databricks 扩展的身份验证设置。
- 在工作区中选择要连接的其他群集。 请参阅为 Visual Studio Code 的 Databricks 扩展选择群集。
- 在工作区中选择要连接的其他工作区目录。 请参阅为 Visual Studio Code 的 Databricks 扩展选择工作区目录。
- 使用 Databricks Connect 集成调试代码。 请参阅使用 Databricks Connect 为 Visual Studio Code 的 Databricks 扩展调试代码。
- 使用
pytest
测试代码。 请参阅使用 pytest 为 Visual Studio Code 的 Databricks 扩展运行测试。