可以使用 Data Science Virtual Machine (DSVM) 轻松探索数据并在云中处理机器学习。 DSVM 预配置了安全修补程序、驱动程序、流行的数据科学和开发软件以及完整的操作系统。 你可以选择适合自己的硬件环境,选择范围包括低成本的以 CPU 为中心的计算机,以及具有多个 GPU、NVMe 存储和大量内存的强大计算机。 对于配备 GPU 的计算机,所有驱动程序均已安装,并且所有机器学习框架都经过了版本匹配,以实现 GPU 兼容性。 此外,所有支持 GPU 的应用程序软件都启用了加速。
DSVM 预装了最有用的数据科学工具。
构建深度学习和机器学习解决方案
| 工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
|---|---|---|---|---|
| CUDA、cuDNN、NVIDIA 驱动程序 | ✅ | ✅ | ✅ |
DSVM 上的 CUDA、cuDNN、NVIDIA 驱动程序 |
| Horovod | ❌ | ❌ | ✅ | DSVM 上的 Horovod |
| NVidia System Management Interface (nvidia-smi) | ✅ | ✅ | ✅ | DSVM 上的 nvidia-smi |
| PyTorch | ✅ | ✅ | ✅ | DSVM 上的 PyTorch |
| TensorFlow | ✅ | ✅ |
✅ | DSVM 上的 TensorFlow |
| 与 Azure 机器学习 (Python) 集成 | ✅ (Python SDK、示例) |
✅ (Python SDK、示例) |
✅ (Python SDK、CLI、示例) |
Azure 机器学习 SDK |
| XGBoost | ✅ (CUDA 支持) |
✅ (CUDA 支持) |
✅ (CUDA 支持) |
DSVM 上的 XGBoost |
| Vowpal Wabbit | ✅ | ✅ | ✅ |
DSVM 上的 Vowpal Wabbit |
| Weka | ❌ | ❌ | ❌ | |
| LightGBM | ❌ | ❌ | ✅ (GPU 和 MPI 支持) |
|
| H2O | ❌ | ❌ | ✅ | |
| CatBoost | ❌ | ❌ | ✅ | |
| Intel MKL | ❌ | ❌ | ✅ | |
| OpenCV | ❌ | ❌ | ✅ | |
| Dlib | ❌ | ❌ | ✅ | |
| Docker | ✅ (仅限 Windows 容器) |
✅ (仅限 Windows 容器) |
✅ | |
| Nccl | ❌ | ❌ | ✅ | |
| Rattle | ❌ | ❌ | ❌ | |
| ONNX 运行时 | ❌ | ❌ | ✅ |
存储、检索和操作数据
| 工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
|---|---|---|---|---|
| 关系数据库 | SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
DSVM 上的 SQL Server |
| 数据库工具 | SQL Server Management Studio SQL Server Integration Services bcp、sqlcmd |
SQL Server Management Studio SQL Server Integration Services bcp、sqlcmd |
SQuirreL SQL(查询工具) bcp、sqlcmd ODBC/JDBC 驱动程序 |
|
| Azure 存储资源管理器 | ✅ |
✅ |
||
| Azure CLI | ✅ |
✅ |
✅ |
|
| AzCopy | ✅ |
✅ |
❌ | DSVM 上的 AzCopy |
| Blob FUSE 驱动程序 | ❌ | ❌ | ❌ |
DSVM 上的 blobfuse |
| Azure Cosmos DB 数据迁移工具 | ✅ | ✅ | ❌ | DSVM 上的 Azure Cosmos DB |
| Unix/Linux 命令行工具 | ❌ | ❌ | ✅ | |
| Apache Spark 3.1(独立版) | ✅ | ✅ | ✅ |
使用 Python、R、Julia 和 Node.js 编程
| 工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
|---|---|---|---|---|
| 预装了 CRAN-R 和流行包 | ✅ | ✅ | ✅ | |
| 预装了 Anaconda Python 和流行包 | ✅ | ✅ (Miniconda) |
✅ (Miniconda) |
|
| Julia (Julialang) | ✅ | ✅ | ✅ | |
| JupyterHub(多用户 Notebook 服务器) | ❌ | ❌ | ✅ | |
| JupyterLab(多用户 Notebook 服务器) | ✅ | ✅ | ✅ | |
| Node.js | ✅ | ✅ | ✅ | |
| 带有以下内核的 Jupyter Notebook Server | ✅ |
✅ |
✅ | Jupyter Notebook 示例 |
| R | R Jupyter 示例 | |||
| Python | Python Jupyter 示例 | |||
| Julia | Julia Jupyter 示例 | |||
| PySpark | pySpark Jupyter 示例 |
Ubuntu 20.04 DSVM、Windows Server 2019 DSVM 和 Windows Server 2022 DSVM 具有以下 Jupyter 内核:
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
- R
- Python 3.7 - Spark(本地)
- Julia 1.6.0
- R Spark – HDInsight
- Scala Spark – HDInsight
- Python 3 Spark - HDInsight
Ubuntu 20.04 DSVM、Windows Server 2019 DSVM 和 Windows Server 2022 DSVM 具有以下 conda 环境:
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
使用你喜欢的编辑器或 IDE
| 工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
|---|---|---|---|---|
| Notepad++ | ✅ |
✅ |
❌ |
|
| Nano | ✅ |
✅ |
❌ |
|
| Visual Studio 2019 Community Edition | ✅ |
✅ | ❌ | DSVM 上的 Visual Studio |
| Visual Studio Code | ✅ |
✅ |
✅ |
DSVM 上的 Visual Studio Code |
| PyCharm Community Edition | ✅ |
✅ |
✅ |
DSVM 上的 PyCharm |
| IntelliJ IDEA | ❌ | ❌ | ✅ | |
| Vim | ❌ | ❌ | ✅ |
|
| Emacs | ❌ | ❌ | ✅ |
|
| Git 和 Git Bash | ✅ |
✅ |
✅ |
|
| OpenJDK 11 | ✅ |
✅ |
✅ |
|
| .NET Framework | ✅ |
✅ |
❌ | |
| Azure SDK | ✅ |
✅ | ✅ |
组织和展示结果
| 工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
|---|---|---|---|---|
| Microsoft 365(Word、Excel、PowerPoint) | ✅ | ✅ | ❌ | |
| Microsoft Teams | ✅ | ✅ | ❌ | |
| Power BI Desktop | ✅ | ✅ |
❌ | |
| Microsoft Edge 浏览器 | ✅ | ✅ | ✅ |