Azure Data Science Virtual Machine 发行说明
本文介绍 Azure Data Science Virtual Machine 版本。 若要获取所含工具的完整列表及其版本号,请访问此资源。
由于需求和包更新的快速发展,我们每个月都会发布适用于 Windows 的 Azure Data Science Virtual Machine 和 Ubuntu 映像的新版本。
Azure 门户用户可以查找可用于预配 Data Science Virtual Machine 的最新映像。 对于 CLI 或 Azure 资源管理器 (ARM) 用户,我们将每个版本的映像保留 12 个月。 在此期限之后,特定的映像版本将不再可用于预配。
如需了解已知 bug 和解决方法,请访问已知问题列表。
2024 年 10 月 21 日
Data Science Virtual Machine – Ubuntu 22.04
说明:
DSVM-Ubuntu-22.04 映像是在可靠的 Ubuntu 22.04 平台上构建的定制 Data Science Virtual Machine。 它预装了一套全面的常用数据科学和 AI 工具,包括深度学习框架、Jupyter Notebook 和可视化资料库。 针对无缝开发和部署进行了优化,该镜像提供了与现代硬件的增强兼容性,使数据科学家、机器学习工程师和 AI 研究人员能够高效地加速他们的工作流程。 无论是构建模型、运行模拟还是分析大型数据集,DSVM-Ubuntu-22.04 都能为您提供推动创新所需的工具和性能。
- OS:
Ubuntu-22.04
- ImageVersion:
24.10.02
- SDK 版本:
1.57.0
- Python 版本:
3.10.8
DSVM 22.04 包含我们安装以及 20.04 附带的所有最新的包
2024 年 10 月 18 日
Data Science Virtual Machine - Ubuntu 20.04
版本 24.10.01
- SDK
1.57.0
- NVIDIA
535.183.01
- Cuda
cuda_12.2.r12
- Python 版本
3.10.8
Data Science Virtual Machine – Windows 2022
版本 24.09.26
- SDK
1.57.0
Data Science Virtual Machine - Windows 2019
版本 24.10.07
- SDK
1.57.0
2024 年 6 月 17 日
Data Science Virtual Machine – Windows 2022
版本 24.05.20
- SDK
1.56.0
Data Science Virtual Machine - Windows 2019
版本 24.05.20
- SDK
1.56.0
Data Science VM - Ubuntu 20.04
版本 24.05.24
- SDK
1.56.0
2024 年 5 月 4 日
Data Science Virtual Machine – Windows 2022
版本 24.05.03
- SDK
1.55
azureml-dataset-runtime
版本1.55.0
azureml-train-automl-client
azureml-dataset-runtime [fuse,pandas]
版本1.55.0
GitPython
版本3.1.41
pyarrow
版本14.0.2
已解决的问题:Office365ProPlus 安装
2023 年 12 月 20 日
Data Science VM - Ubuntu 20.04
版本 23.12.18
主要更改:
numpy
版本1.22.3
pytz
版本2022.6
torch
版本1.12.0
certifi
版本2023.7.2
azure-mgmt-network
到版本25.1.0
scikit-learn
版本1.0.2
scipy
版本1.9.2
accuracy
pickle5
pillow
版本10.1.0
experimental
ipykernel
版本6.14.0
en_core_web_sm
2023 年 12 月 18 日
Data Science Virtual Machine - Windows 2019
版本 23.12.11
主要更改:
- SDK
1.54.0
- numba
- Scipy
azure-core
到版本1.29.4
azure-identity
到版本1.14.0
azure-storage-queue
到版本12.7.2
2023 年 12 月 5 日
适用于 Data Science VM - Windows 2022 的 Data Science Virtual Machine (DSVM) 产品/服务现已在市场中正式发布。
版本 23.11.23
主要更改:
- SDK
1.54.0
- numba
- Scipy
azure-core
到版本1.29.4
azure-identity
到版本1.14.0
azure-storage-queue
到版本12.7.2
2023 年 7 月 26 日
适用于 Data Science VM - Windows 2022(预览版)的新 Data Science Virtual Machine (DSVM) 产品/服务现已在市场中推出。
版本 23.06.25
主要更改:
- SDK
1.51.0
2023 年 4 月 26 日
Data Science VM - Ubuntu 20.04
版本 23.04.24
主要更改:
- SDK
1.50.0
- Dotnet 已升级到
6.0
SDK - PyTorch GPU 功能已在 `azureml_py38_PT_and_TF 环境中修复。
- Blobfuse 已升级到 blobfuse2
2023 年 4 月 4 日
Data Science Virtual Machine - Windows 2019
版本:23.03.31
主要更改:
- SDK
1.49
- Cuda 驱动程序已升级到
11.4
- 已在
azureml_py38
和azureml_py28_PT_and_TF
环境中修复 PyTorch GPU 功能 Dotnet
已升级到6.0
2023 年 1 月 10 日
Data Science VM - Ubuntu 20.04
版本:23.01.06
主要更改:
- 添加了 R 包“ranger”
- 固定了
azureml_py38
环境中的pandas==1.1.5
和numpy==1.23.0
2022 年 11 月 30 日
Data Science VM - Ubuntu 20.04
版本:22.11.25
主要更改:
- 包括了
Azure Machine Learning SDK V2
示例 Ray
到版本2.0.0
- 添加了
clock
、recipes
R
包 azureml-core
到版本1.47.0
azure-ai-ml
到版本1.1.1
Data Science Virtual Machine - Windows 2019
版本:22.11.27
主要更改:
- 包括了
Azure Machine Learning SDK V2
示例 RScirpt
环境路径对齐Ray
版2.0.0
包已添加到azureml_py38
和azureml_py38_PT_TF
环境。azureml-core
到版本1.47.0
azure-ai-ml
到版本1.1.1
2022 年 9 月 20 日
公告:从 2022 年 10 月 1 日起,Ubuntu 18 Data Science Virtual Machine (DSVM) 将不再在市场中发售。 建议用户切换到 Ubuntu 20 DSVM,因为我们会继续在最新的 Data Science VM - Ubuntu 20.04 上交付更新/补丁
使用 Azure 资源管理器 (ARM) 模板/虚拟机规模集来部署 Ubuntu DSVM 计算机的用户应将配置设置为
产品 | SKU |
---|---|
ubuntu-2004 | 2004(对于 Gen1 VM 大小)或 2004-gen2(对于 Gen2 VM 大小) |
而不是:
产品/服务 | SKU |
---|---|
ubuntu-1804 | 1804(对于 Gen1 VM 大小)或 1804-gen2(对于 Gen2 VM 大小) |
注意
截至 2022 年 10 月更新版,仍在使用 Ubuntu-18 DSVM 的现有客户不会遇到任何问题。 然而,弃用计划定于 2022 年 12 月实施。 建议尽早切换到 Ubuntu-20 DSVM。
2022 年 9 月 19 日
Data Science VM - Ubuntu 20.04
版本 22.09.19
主要更改:
.NET Framework
到版本3.1.423
Azure Cli
到版本2.40.0
Intelijidea
到版本2022.2.2
- Microsoft Edge 浏览器到版本
107.0.1379.1
Nodejs
到版本v16.17.0
Pycharm
到版本2022.2.1
特定于环境的更新:
azureml_py38
:
azureml-core
到版本1.45.0
py38_default
:
Jupyter Lab
到版本3.4.7
azure-core
到版本1.25.1
keras
到版本2.10.0
tensorflow-gpu
到版本2.10.0
2022 年 9 月 12 日
Data Science Virtual Machine - Windows 2019
版本 22.09.06
主要更改:
- 基础 OS 级别映像更新。
2022 年 8 月 16 日
Data Science VM - Ubuntu 20.04
版本 22.08.11
主要更改:
- Jupyterlab 已升级到版本
3.4.5
matplotlib
、azureml-mlflow
已添加到sdkv2
环境。- Jupyterhub 生成器已重新配置为根环境。
2022 年 7 月 28 日
Data Science VM - Ubuntu 20.04
版本 22.07.19
主要更改:
已将
Azure Cli
更新为版本2.38.0
已将
Nodejs
更新为版本v16.16.0
已将
Scala
更新为版本2.12.15
已将
Spark
更新为版本3.2.2
MMLSpark
笔记本功能v0.10.0
其他 4 个 R 库:
已添加新的 Azure 机器学习环境
azureml_310_sdkv2
Data Science Virtual Machine - Windows 2019
版本 22.07.18
主要更改:
- 常规 OS 级别更新。
2022 年 7 月 11 日
Data Science VM – Ubuntu 18.04 Data Science VM – Ubuntu 20.04
版本 22.07.08
主要更改:
- 小 bug 修复。
2022 年 6 月 28 日
Data Science Virtual Machine - Windows 2019Data Science VM - Ubuntu 20.04
版本 22.06.10
Data Science VM – Ubuntu 18.04
版本 22.06.13
主要更改:
- 从 Data Science Virtual Machine (DSVM) 映像中删除了
Rstudio
软件工具。
2022 年 5 月 17 日
Data Science VM - Ubuntu 20.04
版本 22.05.11
主要更改:
- 将
log4j(v2)
升级到了版本2.17.2
2022 年 4 月 29 日
Data Science VM - Ubuntu 18.04Data Science VM - Ubuntu 20.04
版本 22.04.27
主要更改:
Plotly
和summarytools
R Studio 扩展运行时导入修复。- 将
Cudatoolkit
和CUDNN
分别更新为13.1
和2.8.1
。 - 修复了
Python 3.8
- Azure 机器学习笔记本运行,已在Azureml_py38
环境中将matplotlib
固定到了3.2.1
包并将cycler
固定到了0.11.0
包。
2022 年 4 月 26 日
Data Science Virtual Machine - Windows 2019
版本:22.04.21
主要更改:
Plotly
R Studio 扩展补丁。- 更新
Rscript
环境路径以支持最新的 R Studio 版本4.1.3
。
2022 年 4 月 14 日
适用于 Data Science VM - Ubuntu 20.04 的新 Data Science Virtual Machine (DSVM) 产品/服务目前已在市场中推出。
版本:22.04.05
2022 年 4 月 4 日
适用于 Data Science VM - Ubuntu 18.04 的新映像
版本:22.04.01
主要更改:
更新了 R 环境 - 添加了以下库:
Cluster
Devtools Factoextra
GlueHere
Ottr
Paletteer
Patchwork
Plotly
Rmd2jupyter
Scales
Statip
Summarytools
Tidyverse
Tidymodels
Testthat
进一步缓解
Log4j
漏洞 - 尽管未使用,但我们将所有log4j
移至版本v2
,删除了旧的log4j jars1.0
,并移动了log4j
版本 2.0 jarAzure CLI
到版本2.33.1
解决了使用公共 IP 地址的
jupyterhub
访问问题重新设计了 Conda 环境 - 随着我们继续调整和完善 Conda 环境,我们创建了:
azureml_py38
:基于 Python 3.8 的环境,其中预装了 Azure 机器学习 SDK,同时包含 AutoML 环境azureml_py38_PT_TF
:附加的azureml_py38
环境,预装了最新的TensorFlow
和PyTorch
py38_default
:基于Python 3.8
的默认系统环境- 我们删除了
azureml_py36_tensorflow
azureml_py36_pytorch
py38_tensorflow
py38_pytorch
环境
2022 年 3 月 18 日
Data Science Virtual Machine - Windows 2019
版本:22.03.09
主要更改:
更新了 R 环境 - 添加了以下库:
Cluster
Devtools Factoextra
GlueHere
Ottr
Paletteer
Patchwork
Plotly
Rmd2jupyter
Scales
Statip
Summarytools
Tidyverse
Tidymodels
Testthat
进一步缓解
Log4j
漏洞 - 尽管未使用,但我们将所有log4j
移至 v2 版本,删除了旧的 log4j jars1.0,并移动了log4j
2.0 版本 jar。Azure CLI 更新到 2.33.1 版本
重新设计了 Conda 环境 - 随着继续调整和完善 Conda 环境,我们创建了:
azureml_py38
:基于 Python 3.8 的环境,预安装了 Azure 机器学习 SDK,还包含 AutoML 环境azureml_py38_PT_TF
:补充环境azureml_py38
,预安装了最新的 TensorFlow 和 PyTorchpy38_default
:基于 Python 3.8 的默认系统环境- 我们删除了
azureml_py36_tensorflow
、azureml_py36_pytorch
、py38_tensorflow
和py38_pytorch
环境。
2022 年 3 月 9 日
Data Science Virtual Machine - Windows 2019
版本:21.12.03
Windows 2019 Data Science Virtual Machine (DSVM) 由以下发行商提供支持:microsoft-dsvm,产品/服务 ID:dsvm-win-2019,计划 ID/SKU ID:winserver-2019
使用 Azure 资源管理器 (ARM) 模板/虚拟机规模集部署 Windows DSVM 计算机的用户应使用 winserver-2019
而不是 server-2019
来配置 SKU,因为我们将从 2022 年 3 月开始继续为新 SKU 上的 Windows DSVM 映像交付更新。
2021 年 12 月 3 日
适用于 Windows Server 2019 的新映像
版本:21.12.03
主要更改:
- 已将 pytorch 更改为版本 1.10.0
- 已将 TensorFlow 更新为版本 2.7.0
- 修复了 Azure 机器学习 SDK 和 AutoML 环境
- Windows 安全更新
- 改进了稳定性和次要 bug 修补程序
2021 年 11 月 4 日
适用于 Ubuntu 18.04 的新映像
版本:21.11.04
主要更改:
- 将 .NET Framework 更改为了版本 3.1.414
- 将 Azcopy 更改为了版本 10.13.0
- 将 Azure CLI 更改为了版本 2.30.0
- 将 CUDA 更改为了版本 11.5
- 将 Docker 更改为了版本 20.10.10
- 将 Intellijidea 更改为了版本 2021.2.3
- 将 NVIDIA 驱动程序更改为版本 470.103.01
- 将 NVIDIA SMI 更改为版本 470.103.01
- 将 Nodejs 更改为了版本 v16.13.0
- 将 Pycharm 更改为了版本 2021.2.3
- 将 VS Code 更改为了版本 1.61.2
- Conda
- azureml_py36_automl
- 将 azureml-core 更改为了版本 1.35.0
- py38_default
- 将 Jupyter Lab / jupyterlab 更改为了版本 3.2.1
- 将 Jupyter Notebook / 笔记本更改为了版本 6.4.5
- 将 Jupyter 服务器/jupyter_server 更改为了版本 1.11.2
- 将 PyTorch 探测器 TensorBoard 插件/torch-tb-profiler 更改为了版本 0.3.1
- 将 azureml-core 更改为了版本 1.19.1
- 将 matplotlib 更改为了版本 3.4.3
- 将 mkl 更改为了版本 2021.4.0
- 将 onnx 更改为了版本 1.10.2
- 将 opencv-python 更改为了版本 4.5.4.58
- 将 pandas 更改为了版本 1.3.4
- 将 pytorch 更改为了版本 1.10.0
- 将 scikit-learn 更改为了版本 1.0.1
- 将 tensorflow-gpu 更改为了版本 2.6.2
- azureml_py36_automl
2021 年 10 月 7 日
适用于 Ubuntu 18.04 的新映像
版本:21.10.07
主要更改:
- 将 pytorch 更改为了版本 1.9.1
- 将 Docker 更改为了版本 20.10.9
- 将 Intellijidea 更改为了版本 2021.2.2
- 将 Nodejs 更改为了版本 v14.18.0
- 将 Pycharm 更改为了版本 2021.2.2
- 将 VS Code 更改为了版本 1.60.2
- 修复了 AutoML 环境 (azureml_py36_automl)
- 修复了 Azure 存储资源管理器稳定性
- 改进了稳定性和次要 bug 修补程序
2021 年 8 月 11 日
适用于 Windows Server 2019 的新映像
版本:21.08.11
主要更改:
- Windows 安全更新
- 将 Nvidia CuDNN 更新到 8.1.0
- 将 Jupyter Lab 更新到 3.0.16
- 添加了用于试验跟踪的 MLFLow
- 改进了稳定性和次要 bug 修补程序
2021 年 7 月 12 日
适用于 Ubuntu 18.04 的新映像
主要更改:
- 已更新到 PyTorch 1.9.0
- 已将 Azure CLI 更新到 2.26.1
- 已将 Azure CLI Azure 机器学习扩展更新到 1.29.0
- 更新 VS Code 版本 1.58.1
- 改进了稳定性和次要 bug 修补程序
2021 年 6 月 22 日
适用于 Windows Server 2019 的新映像
版本:21.06.22
主要更改:
- 已更新到 PyTorch 1.9.0
- 修复了“Git 不可用”这一 bug
2021 年 6 月 1 日
适用于 Ubuntu 18.04 的新映像
版本:21.06.01
主要更改:
- 默认情况下启用 Docker。
- JupyterHub 默认使用 JupyterLab
- 更新了 Python 版本以修复 CVE-2020-15523
- 将 IntelliJ IDEA 更新到版本 2021.1 以修复 CVE-2021-25758
- 将 PyCharm 社区更新为 2021.1
- 将 TensorFlow 更新为版本 2.5.0
从桌面中删除了几个图标。
2021 年 5 月 22 日
适用于 Windows Server 2019 的新映像
版本:21.05.22
所选版本更新包括:
- AzCopy 10.10.0
- Azure CLI 2.23.0
- Azure Data Studio 1.28.0
- CUDA 11.1
- Java 11
- Julia 1.0.5
- Jupyter Lab 2.2.6
- Microsoft Edge 浏览器
- NodeJS 16.2.0
- Power BI Desktop 2.93.641.0 64 位(2021 年 5 月)
- PyCharm 社区版 2021.1.1
- Python 3.8
- PyTorch 1.8.1
- R 4.1.0
- RStudio 1.4.1106
- Spark 3.1.1
- 存储资源管理器 1.19.1
- TensorFlow 2.5.0
- Visual Studio Code 1.56.2,包括 Azure 机器学习扩展
- Visual Community Edition 2019(版本 16.9.6)
删除了 Firefox、Apache Drill 和 Azure Integration Runtime。
深色模式;桌面上图标的更改;墙纸背景更改。
2021 年 5 月 12 日
适用于 Ubuntu 18.04 的新映像
所选版本更新包括:
- azcopy 10.10
- Azure CLI 2.23.0
- Azure Data Studio 1.22.1
- Azure 存储资源管理器 1.19.1
- CUDA 11.3、cuDNN 8、NCCL2
- dask 2021.01.0
- Java 11 (OpenJDK)
- Jupyter Lab 3.0.14
- Microsoft Edge 浏览器(beta 版本)
- Python 3.8
- PyTorch 1.8.1 包括 torchaudio torchtext torchvision 和 torch-tb-profiler
- R 4.0.5
- Spark 3.1,包括 mmlspark、指向 Blob 存储、数据湖和 Azure Cosmos DB 的连接器
- TensorFlow 2.4.1,包括 TensorBoard
- VS.Code 1.56
添加了 docker。 为节省资源,默认情况下不会启动 Docker 服务。 若要启动 docker 服务,请在命令行中运行以下命令:
sudo systemctl start docker
注意
如果计算机具有 GPU,则可以通过向 docker 命令中添加 --gpus
参数,而在容器内使用 GPU。
例如,此命令
sudo docker run --gpus all -it --rm -v local_dir:container_dir nvcr.io/nvidia/pytorch:18.04-py3
运行预装了 PyTorch 且已启用所有 GPU 的 Ubuntu 18.04 容器。 它还在容器中的 container_dir 下生成本地 local_dir 文件夹。
2020 年 2 月 24 日
适用于 Ubuntu 18.04 和 Windows 2019 的 Data Science Virtual Machine (DSVM) 映像现已推出。
2019 年 10 月 8 日
Windows DSVM 上的软件更新
- Azure 存储资源管理器 1.10.1
- Firefox 69.0.2
- Power BI Desktop 2.73.55xx
- PyCharm 19.2.3
- RStudio 1.2.50xx
Windows 的默认浏览器已更新
默认浏览器在之前设置为 Internet Explorer。 现在,用户首次登录时,系统会提示他们选择默认浏览器。