Azure Data Science Virtual Machine 包含哪些工具?
可以使用 Data Science Virtual Machine (DSVM) 轻松探索数据并在云中处理机器学习。 DSVM 预配置了安全修补程序、驱动程序、流行的数据科学和开发软件以及完整的操作系统。 你可以选择适合自己的硬件环境,选择范围包括低成本的以 CPU 为中心的计算机,以及具有多个 GPU、NVMe 存储和大量内存的强大计算机。 对于配备 GPU 的计算机,所有驱动程序均已安装,并且所有机器学习框架都经过了版本匹配,以实现 GPU 兼容性。 此外,所有支持 GPU 的应用程序软件都启用了加速。
DSVM 预装了最有用的数据科学工具。
构建深度学习和机器学习解决方案
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
---|---|---|---|---|
CUDA、cuDNN、NVIDIA 驱动程序 | ✅ | ✅ | ✅ |
DSVM 上的 CUDA、cuDNN、NVIDIA 驱动程序 |
Horovod | ❌ | ❌ | ✅ | DSVM 上的 Horovod |
NVidia System Management Interface (nvidia-smi) | ✅ | ✅ | ✅ | DSVM 上的 nvidia-smi |
PyTorch | ✅ | ✅ | ✅ | DSVM 上的 PyTorch |
TensorFlow | ✅ | ✅ |
✅ | DSVM 上的 TensorFlow |
与 Azure 机器学习 (Python) 集成 | ✅ (Python SDK、示例) |
✅ (Python SDK、示例) |
✅ (Python SDK、CLI、示例) |
Azure 机器学习 SDK |
XGBoost | ✅ (CUDA 支持) |
✅ (CUDA 支持) |
✅ (CUDA 支持) |
DSVM 上的 XGBoost |
Vowpal Wabbit | ✅ | ✅ | ✅ |
DSVM 上的 Vowpal Wabbit |
Weka | ❌ | ❌ | ❌ | |
LightGBM | ❌ | ❌ | ✅ (GPU 和 MPI 支持) |
|
H2O | ❌ | ❌ | ✅ | |
CatBoost | ❌ | ❌ | ✅ | |
Intel MKL | ❌ | ❌ | ✅ | |
OpenCV | ❌ | ❌ | ✅ | |
Dlib | ❌ | ❌ | ✅ | |
Docker | ✅ (仅限 Windows 容器) |
✅ (仅限 Windows 容器) |
✅ | |
Nccl | ❌ | ❌ | ✅ | |
Rattle | ❌ | ❌ | ❌ | |
ONNX 运行时 | ❌ | ❌ | ✅ |
存储、检索和操作数据
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
---|---|---|---|---|
关系数据库 | SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
DSVM 上的 SQL Server |
数据库工具 | SQL Server Management Studio SQL Server Integration Services bcp、sqlcmd |
SQL Server Management Studio SQL Server Integration Services bcp、sqlcmd |
SQuirreL SQL(查询工具) bcp、sqlcmd ODBC/JDBC 驱动程序 |
|
Azure 存储资源管理器 | ✅ |
✅ |
||
Azure CLI | ✅ |
✅ |
✅ |
|
AzCopy | ✅ |
✅ |
❌ | DSVM 上的 AzCopy |
Blob FUSE 驱动程序 | ❌ | ❌ | ❌ |
DSVM 上的 blobfuse |
Azure Cosmos DB 数据迁移工具 | ✅ | ✅ | ❌ | DSVM 上的 Azure Cosmos DB |
Unix/Linux 命令行工具 | ❌ | ❌ | ✅ | |
Apache Spark 3.1(独立版) | ✅ | ✅ | ✅ |
使用 Python、R、Julia 和 Node.js 编程
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
---|---|---|---|---|
预装了 CRAN-R 和流行包 | ✅ | ✅ | ✅ | |
预装了 Anaconda Python 和流行包 | ✅ | ✅ (Miniconda) |
✅ (Miniconda) |
|
Julia (Julialang) | ✅ | ✅ | ✅ | |
JupyterHub(多用户 Notebook 服务器) | ❌ | ❌ | ✅ | |
JupyterLab(多用户 Notebook 服务器) | ✅ | ✅ | ✅ | |
Node.js | ✅ | ✅ | ✅ | |
带有以下内核的 Jupyter Notebook Server | ✅ |
✅ |
✅ | Jupyter Notebook 示例 |
R | R Jupyter 示例 | |||
Python | Python Jupyter 示例 | |||
Julia | Julia Jupyter 示例 | |||
PySpark | pySpark Jupyter 示例 |
Ubuntu 20.04 DSVM、Windows Server 2019 DSVM 和 Windows Server 2022 DSVM 具有以下 Jupyter 内核:
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
- R
- Python 3.7 - Spark(本地)
- Julia 1.6.0
- R Spark – HDInsight
- Scala Spark – HDInsight
- Python 3 Spark - HDInsight
Ubuntu 20.04 DSVM、Windows Server 2019 DSVM 和 Windows Server 2022 DSVM 具有以下 conda 环境:
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
使用你喜欢的编辑器或 IDE
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
---|---|---|---|---|
Notepad++ | ✅ |
✅ |
❌ |
|
Nano | ✅ |
✅ |
❌ |
|
Visual Studio 2019 Community Edition | ✅ |
✅ | ❌ | DSVM 上的 Visual Studio |
Visual Studio Code | ✅ |
✅ |
✅ |
DSVM 上的 Visual Studio Code |
PyCharm Community Edition | ✅ |
✅ |
✅ |
DSVM 上的 PyCharm |
IntelliJ IDEA | ❌ | ❌ | ✅ | |
Vim | ❌ | ❌ | ✅ |
|
Emacs | ❌ | ❌ | ✅ |
|
Git 和 Git Bash | ✅ |
✅ |
✅ |
|
OpenJDK 11 | ✅ |
✅ |
✅ |
|
.NET Framework | ✅ |
✅ |
❌ | |
Azure SDK | ✅ |
✅ | ✅ |
组织和展示结果
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
---|---|---|---|---|
Microsoft 365(Word、Excel、PowerPoint) | ✅ | ✅ | ❌ | |
Microsoft Teams | ✅ | ✅ | ❌ | |
Power BI Desktop | ✅ | ✅ |
❌ | |
Microsoft Edge 浏览器 | ✅ | ✅ | ✅ |