Azure Data Science Virtual Machine 包含哪些工具?

可以使用 Data Science Virtual Machine (DSVM) 轻松探索数据并在云中处理机器学习。 DSVM 预配置了安全修补程序、驱动程序、流行的数据科学和开发软件以及完整的操作系统。 你可以选择适合自己的硬件环境,选择范围包括低成本的以 CPU 为中心的计算机,以及具有多个 GPU、NVMe 存储和大量内存的强大计算机。 对于配备 GPU 的计算机,所有驱动程序均已安装,并且所有机器学习框架都经过了版本匹配,以实现 GPU 兼容性。 此外,所有支持 GPU 的应用程序软件都启用了加速。

DSVM 预装了最有用的数据科学工具。

构建深度学习和机器学习解决方案

工具 Windows Server 2019 DSVM Windows Server 2022 DSVM Ubuntu 20.04 DSVM 使用注意事项
CUDA、cuDNN、NVIDIA 驱动程序
DSVM 上的 CUDA、cuDNN、NVIDIA 驱动程序
Horovod DSVM 上的 Horovod
NVidia System Management Interface (nvidia-smi) DSVM 上的 nvidia-smi
PyTorch DSVM 上的 PyTorch
TensorFlow
DSVM 上的 TensorFlow
与 Azure 机器学习 (Python) 集成
(Python SDK、示例)

(Python SDK、示例)

(Python SDK、CLI、示例)
Azure 机器学习 SDK
XGBoost
(CUDA 支持)

(CUDA 支持)

(CUDA 支持)
DSVM 上的 XGBoost
Vowpal Wabbit
DSVM 上的 Vowpal Wabbit
Weka
LightGBM
(GPU 和 MPI 支持)
H2O
CatBoost
Intel MKL
OpenCV
Dlib
Docker
(仅限 Windows 容器)

(仅限 Windows 容器)
Nccl
Rattle
ONNX 运行时

存储、检索和操作数据

工具 Windows Server 2019 DSVM Windows Server 2022 DSVM Ubuntu 20.04 DSVM 使用注意事项
关系数据库 SQL Server 2019
Developer Edition
SQL Server 2019
Developer Edition
SQL Server 2019
Developer Edition
DSVM 上的 SQL Server
数据库工具 SQL Server Management Studio
SQL Server Integration Services
bcp、sqlcmd
SQL Server Management Studio
SQL Server Integration Services
bcp、sqlcmd
SQuirreL SQL(查询工具)
bcp、sqlcmd
ODBC/JDBC 驱动程序
Azure 存储资源管理器

Azure CLI


AzCopy

DSVM 上的 AzCopy
Blob FUSE 驱动程序
DSVM 上的 blobfuse
Azure Cosmos DB 数据迁移工具 DSVM 上的 Azure Cosmos DB
Unix/Linux 命令行工具
Apache Spark 3.1(独立版)

使用 Python、R、Julia 和 Node.js 编程

工具 Windows Server 2019 DSVM Windows Server 2022 DSVM Ubuntu 20.04 DSVM 使用注意事项
预装了 CRAN-R 和流行包
预装了 Anaconda Python 和流行包
(Miniconda)

(Miniconda)
Julia (Julialang)
JupyterHub(多用户 Notebook 服务器)
JupyterLab(多用户 Notebook 服务器)
Node.js
带有以下内核的 Jupyter Notebook Server

Jupyter Notebook 示例
     R R Jupyter 示例
     Python Python Jupyter 示例
     Julia Julia Jupyter 示例
     PySpark pySpark Jupyter 示例

Ubuntu 20.04 DSVM、Windows Server 2019 DSVM 和 Windows Server 2022 DSVM 具有以下 Jupyter 内核

  • Python3.8-default
  • Python3.8-Tensorflow-Pytorch
  • Python3.8-AzureML
  • R
  • Python 3.7 - Spark(本地)
  • Julia 1.6.0
  • R Spark – HDInsight
  • Scala Spark – HDInsight
  • Python 3 Spark - HDInsight

Ubuntu 20.04 DSVM、Windows Server 2019 DSVM 和 Windows Server 2022 DSVM 具有以下 conda 环境

  • Python3.8-default
  • Python3.8-Tensorflow-Pytorch
  • Python3.8-AzureML

使用你喜欢的编辑器或 IDE

工具 Windows Server 2019 DSVM Windows Server 2022 DSVM Ubuntu 20.04 DSVM 使用注意事项
Notepad++


Nano


Visual Studio 2019 Community Edition
DSVM 上的 Visual Studio
Visual Studio Code


DSVM 上的 Visual Studio Code
PyCharm Community Edition


DSVM 上的 PyCharm
IntelliJ IDEA
Vim
Emacs
Git 和 Git Bash


OpenJDK 11


.NET Framework

Azure SDK

组织和展示结果

工具 Windows Server 2019 DSVM Windows Server 2022 DSVM Ubuntu 20.04 DSVM 使用注意事项
Microsoft 365(Word、Excel、PowerPoint)
Microsoft Teams
Power BI Desktop
Microsoft Edge 浏览器