如何将 Visual Studio Code 与 Azure Databricks 配合使用?
Microsoft 的 Visual Studio Code 是一种在桌面上运行的轻型但功能强大的源代码编辑器,适用于 Windows、macOS 和 Linux。 它随附对 JavaScript、TypeScript 和 Node.js 的内置支持,并具有适用于其他语言和运行时(例如 C++、C#、Java、Python、PHP、Go 和 .NET)的扩展的丰富生态系统。 Visual Studio Code 将源代码编辑器的简单性与强大的开发人员工具(如 IntelliSense 代码完成和调试)相结合。 可以在本地开发计算机上使用 Visual Studio Code 在 Azure Databricks 中编写、运行和调试代码,与远程 Azure Databricks 工作区中的 Databricks SQL 仓库进行交互,如下所示:
名称 | 在想要执行以下操作时使用此工具... |
---|---|
适用于 Visual Studio Code 的 Databricks 扩展 | 使用 Visual Studio Code 在远程 Azure Databricks 工作区上编写和运行本地 Python、R、Scala 和 SQL 代码。 |
使用 Python 在 Visual Studio Code 中的 Databricks Connect | 使用 Visual Studio Code 在远程 Azure Databricks 工作区上编写、运行和调试本地 Python 代码。 |
使用 Scala 在 Visual Studio Code 中的 Databricks Connect | 使用 Visual Studio Code 在远程 Azure Databricks 工作区上编写、运行和调试本地 Scala 代码。 |
Databricks 资产捆绑包 | 使用 Visual Studio Code 可以更轻松地创作、部署和运行捆绑包。 有了 Databricks 资产捆绑包(或简称捆绑包),你就可以使用 CI/CD 最佳做法和工作流以编程方式定义、部署和运行 Azure Databricks 作业、Delta Live Tables 管道和 MLOps 堆栈。 |
Databricks CLI | 通过 Visual Studio Code 中的内置 Terminal 从命令行使用 Azure Databricks。 |
Databricks SDKs | 使用 Visual Studio Code 中的内置编程语言支持编写、运行和调试适用于 Azure Databricks 的 Python、Java 和 Go 代码。 |
Databricks Driver for SQLTools | 使用 Visual Studio Code 中的图形用户界面在远程 Azure Databricks 工作区中查询 Databricks SQL 仓库。 |
Databricks SQL 连接器、驱动程序和 API | 使用 Visual Studio Code 中的内置编程语言支持编写、运行和调试 Python、Go、JavaScript、TypeScript 和 Node.js 代码,这些代码适用于远程 Azure Databricks 工作区中的 Databricks SQL 仓库。 |
预配基础结构 | 使用适用于 Visual Studio Code 的 Hashicorp Terraform 扩展等第三方插件,以便更轻松地使用 Terraform 预配 Azure Databricks 基础结构,并遵循基础结构即代码 (IaC) 最佳做法。 使用 Visual Studio Code 中的内置编程语言支持通过第三方产品(例如 Terraform (CDKTF) 和 Pulumi 等)第三方产品/服务编写和部署 Azure Databricks 基础结构的 Python、TypeScript、Java、C# 和 Go 定义。 |