Azure Data Science Virtual Machine 发行说明

本文介绍 Azure Data Science Virtual Machine 版本。 若要获取所含工具的完整列表及其版本号,请访问此资源

由于需求和包更新的快速发展,我们每个月都会发布适用于 Windows 的 Azure Data Science Virtual Machine 和 Ubuntu 映像的新版本

Azure 门户用户可以查找可用于预配 Data Science Virtual Machine 的最新映像。 对于 CLI 或 Azure 资源管理器 (ARM) 用户,我们将每个版本的映像保留 12 个月。 在此期限之后,特定的映像版本将不再可用于预配。

如需了解已知 bug 和解决方法,请访问已知问题列表

2024 年 6 月 17 日

Data Science Virtual Machine – Windows 2022

版本 24.05.20

  • SDK 1.56.0

Data Science Virtual Machine - Windows 2019

版本 24.05.20

  • SDK 1.56.0

Data Science VM - Ubuntu 20.04

版本 24.05.24

  • SDK 1.56.0

2024 年 5 月 4 日

Data Science Virtual Machine – Windows 2022

版本 24.05.03

  • SDK 1.55
  • azureml-dataset-runtime 版本 1.55.0
  • azureml-train-automl-client
  • azureml-dataset-runtime [fuse,pandas] 版本 1.55.0
  • GitPython 版本 3.1.41
  • pyarrow 版本 14.0.2

已解决的问题:Office365ProPlus 安装

2023 年 12 月 20 日

Data Science VM - Ubuntu 20.04

版本 23.12.18

主要更改:

  • numpy 版本 1.22.3
  • pytz 版本 2022.6
  • torch 版本 1.12.0
  • certifi 版本 2023.7.2
  • azure-mgmt-network 到版本 25.1.0
  • scikit-learn 版本 1.0.2
  • scipy 版本 1.9.2
  • accuracy
  • pickle5
  • pillow 版本 10.1.0
  • experimental
  • ipykernel 版本 6.14.0
  • en_core_web_sm

2023 年 12 月 18 日

Data Science Virtual Machine - Windows 2019

版本 23.12.11

主要更改:

  • SDK 1.54.0
  • numba
  • Scipy
  • azure-core 到版本 1.29.4
  • azure-identity 到版本 1.14.0
  • azure-storage-queue 到版本 12.7.2

2023 年 12 月 5 日

适用于 Data Science VM - Windows 2022 的 Data Science Virtual Machine (DSVM) 产品/服务现已在市场中正式发布。

版本 23.11.23

主要更改:

  • SDK 1.54.0
  • numba
  • Scipy
  • azure-core 到版本 1.29.4
  • azure-identity 到版本 1.14.0
  • azure-storage-queue 到版本 12.7.2

2023 年 7 月 26 日

适用于 Data Science VM - Windows 2022(预览版)的新 Data Science Virtual Machine (DSVM) 产品/服务现已在市场中推出。

版本 23.06.25

主要更改:

  • SDK 1.51.0

2023 年 4 月 26 日

Data Science VM - Ubuntu 20.04

版本 23.04.24

主要更改:

  • SDK 1.50.0
  • Dotnet 已升级到 6.0 SDK
  • PyTorch GPU 功能已在 `azureml_py38_PT_and_TF 环境中修复。
  • Blobfuse 已升级到 blobfuse2

2023 年 4 月 4 日

Data Science Virtual Machine - Windows 2019

版本:23.03.31

主要更改:

  • SDK 1.49
  • Cuda 驱动程序已升级到 11.4
  • 已在 azureml_py38azureml_py28_PT_and_TF 环境中修复 PyTorch GPU 功能
  • Dotnet 已升级到 6.0

2023 年 1 月 10 日

Data Science VM - Ubuntu 20.04

版本:23.01.06

主要更改:

  • 添加了 R 包“ranger”
  • 固定了 azureml_py38 环境中的 pandas==1.1.5numpy==1.23.0

2022 年 11 月 30 日

Data Science VM - Ubuntu 20.04

版本:22.11.25

主要更改:

  • 包括了 Azure Machine Learning SDK V2 示例
  • Ray 到版本 2.0.0
  • 添加了 clockrecipes R
  • azureml-core 到版本 1.47.0
  • azure-ai-ml 到版本 1.1.1

Data Science Virtual Machine - Windows 2019

版本:22.11.27

主要更改:

  • 包括了 Azure Machine Learning SDK V2 示例
  • RScirpt 环境路径对齐
  • Ray2.0.0 包已添加到 azureml_py38azureml_py38_PT_TF 环境。
  • azureml-core 到版本 1.47.0
  • azure-ai-ml 到版本 1.1.1

2022 年 9 月 20 日

公告:从 2022 年 10 月 1 日起,Ubuntu 18 Data Science Virtual Machine (DSVM) 将不再在市场中发售。 建议用户切换到 Ubuntu 20 DSVM,因为我们会继续在最新的 Data Science VM - Ubuntu 20.04 上交付更新/补丁

使用 Azure 资源管理器 (ARM) 模板/虚拟机规模集来部署 Ubuntu DSVM 计算机的用户应将配置设置为

产品 SKU
ubuntu-2004 2004(对于 Gen1 VM 大小)或 2004-gen2(对于 Gen2 VM 大小)

而不是:

产品/服务 SKU
ubuntu-1804 1804(对于 Gen1 VM 大小)或 1804-gen2(对于 Gen2 VM 大小)

注意

截至 2022 年 10 月更新版,仍在使用 Ubuntu-18 DSVM 的现有客户不会遇到任何问题。 然而,弃用计划定于 2022 年 12 月实施。 建议尽早切换到 Ubuntu-20 DSVM。

2022 年 9 月 19 日

Data Science VM - Ubuntu 20.04

版本 22.09.19

主要更改:

  • .NET Framework 到版本 3.1.423
  • Azure Cli 到版本 2.40.0
  • Intelijidea 到版本 2022.2.2
  • Microsoft Edge 浏览器到版本 107.0.1379.1
  • Nodejs 到版本 v16.17.0
  • Pycharm 到版本 2022.2.1

特定于环境的更新:

azureml_py38

  • azureml-core 到版本 1.45.0

py38_default

  • Jupyter Lab 到版本 3.4.7
  • azure-core 到版本 1.25.1
  • keras 到版本 2.10.0
  • tensorflow-gpu 到版本 2.10.0

2022 年 9 月 12 日

Data Science Virtual Machine - Windows 2019

版本 22.09.06

主要更改:

  • 基础 OS 级别映像更新。

2022 年 8 月 16 日

Data Science VM - Ubuntu 20.04

版本 22.08.11

主要更改:

  • Jupyterlab 已升级到版本 3.4.5
  • matplotlibazureml-mlflow 已添加到 sdkv2 环境。
  • Jupyterhub 生成器已重新配置为根环境。

2022 年 7 月 28 日

Data Science VM - Ubuntu 20.04

版本 22.07.19

主要更改:

  • 已将 Azure Cli 更新为版本 2.38.0

  • 已将 Nodejs 更新为版本 v16.16.0

  • 已将 Scala 更新为版本 2.12.15

  • 已将 Spark 更新为版本 3.2.2

  • MMLSpark 笔记本功能 v0.10.0

  • 其他 4 个 R 库:

  • 已添加新的 Azure 机器学习环境 azureml_310_sdkv2

Data Science Virtual Machine - Windows 2019

版本 22.07.18

主要更改:

  • 常规 OS 级别更新。

2022 年 7 月 11 日

Data Science VM – Ubuntu 18.04 Data Science VM – Ubuntu 20.04

版本 22.07.08

主要更改:

  • 小 bug 修复。

2022 年 6 月 28 日

Data Science Virtual Machine - Windows 2019Data Science VM - Ubuntu 20.04

版本 22.06.10

Data Science VM – Ubuntu 18.04

版本 22.06.13

主要更改:

  • 从 Data Science Virtual Machine (DSVM) 映像中删除了 Rstudio 软件工具。

2022 年 5 月 17 日

Data Science VM - Ubuntu 20.04

版本 22.05.11

主要更改:

  • log4j(v2) 升级到了版本 2.17.2

2022 年 4 月 29 日

Data Science VM - Ubuntu 18.04Data Science VM - Ubuntu 20.04

版本 22.04.27

主要更改:

  • Plotlysummarytools R Studio 扩展运行时导入修复。
  • CudatoolkitCUDNN 分别更新为 13.12.8.1
  • 修复了 Python 3.8 - Azure 机器学习笔记本运行,已在 Azureml_py38 环境中将 matplotlib 固定到了 3.2.1 包并将 cycler 固定到了 0.11.0 包。

2022 年 4 月 26 日

Data Science Virtual Machine - Windows 2019

版本:22.04.21

主要更改:

  • Plotly R Studio 扩展补丁。
  • 更新 Rscript 环境路径以支持最新的 R Studio 版本 4.1.3

2022 年 4 月 14 日

适用于 Data Science VM - Ubuntu 20.04 的新 Data Science Virtual Machine (DSVM) 产品/服务目前已在市场中推出。

版本:22.04.05

2022 年 4 月 4 日

适用于 Data Science VM - Ubuntu 18.04 的新映像

版本:22.04.01

主要更改:

  • 更新了 R 环境 - 添加了以下库:

    • Cluster
    • Devtools Factoextra
    • GlueHere
    • Ottr
    • Paletteer
    • Patchwork
    • Plotly
    • Rmd2jupyter
    • Scales
    • Statip
    • Summarytools
    • Tidyverse
    • Tidymodels
    • Testthat
  • 进一步缓解 Log4j 漏洞 - 尽管未使用,但我们将所有 log4j 移至版本 v2,删除了旧的 log4j jars1.0,并移动了 log4j 版本 2.0 jar

  • Azure CLI 到版本 2.33.1

  • 解决了使用公共 IP 地址的 jupyterhub 访问问题

  • 重新设计了 Conda 环境 - 随着我们继续调整和完善 Conda 环境,我们创建了:

    • azureml_py38:基于 Python 3.8 的环境,其中预装了 Azure 机器学习 SDK,同时包含 AutoML 环境
    • azureml_py38_PT_TF:附加的 azureml_py38 环境,预装了最新的 TensorFlowPyTorch
    • py38_default:基于 Python 3.8 的默认系统环境
    • 我们删除了
      • azureml_py36_tensorflow
      • azureml_py36_pytorch
      • py38_tensorflow
      • py38_pytorch 环境

2022 年 3 月 18 日

Data Science Virtual Machine - Windows 2019

版本:22.03.09

主要更改:

  • 更新了 R 环境 - 添加了以下库:

    • Cluster
    • Devtools Factoextra
    • GlueHere
    • Ottr
    • Paletteer
    • Patchwork
    • Plotly
    • Rmd2jupyter
    • Scales
    • Statip
    • Summarytools
    • Tidyverse
    • Tidymodels
    • Testthat
  • 进一步缓解 Log4j 漏洞 - 尽管未使用,但我们将所有 log4j 移至 v2 版本,删除了旧的 log4j jars1.0,并移动了 log4j 2.0 版本 jar。

  • Azure CLI 更新到 2.33.1 版本

  • 重新设计了 Conda 环境 - 随着继续调整和完善 Conda 环境,我们创建了:

    • azureml_py38:基于 Python 3.8 的环境,预安装了 Azure 机器学习 SDK,还包含 AutoML 环境
    • azureml_py38_PT_TF:补充环境 azureml_py38,预安装了最新的 TensorFlow 和 PyTorch
    • py38_default:基于 Python 3.8 的默认系统环境
    • 我们删除了 azureml_py36_tensorflowazureml_py36_pytorchpy38_tensorflowpy38_pytorch 环境。

2022 年 3 月 9 日

Data Science Virtual Machine - Windows 2019

版本:21.12.03

Windows 2019 Data Science Virtual Machine (DSVM) 由以下发行商提供支持:microsoft-dsvm,产品/服务 ID:dsvm-win-2019,计划 ID/SKU ID:winserver-2019

使用 Azure 资源管理器 (ARM) 模板/虚拟机规模集部署 Windows DSVM 计算机的用户应使用 winserver-2019 而不是 server-2019 来配置 SKU,因为我们将从 2022 年 3 月开始继续为新 SKU 上的 Windows DSVM 映像交付更新。

2021 年 12 月 3 日

适用于 Windows Server 2019 的新映像

版本:21.12.03

主要更改:

  • 已将 pytorch 更改为版本 1.10.0
  • 已将 TensorFlow 更新为版本 2.7.0
  • 修复了 Azure 机器学习 SDK 和 AutoML 环境
  • Windows 安全更新
  • 改进了稳定性和次要 bug 修补程序

2021 年 11 月 4 日

适用于 Ubuntu 18.04 的新映像

版本:21.11.04

主要更改:

  • 将 .NET Framework 更改为了版本 3.1.414
  • 将 Azcopy 更改为了版本 10.13.0
  • 将 Azure CLI 更改为了版本 2.30.0
  • 将 CUDA 更改为了版本 11.5
  • 将 Docker 更改为了版本 20.10.10
  • 将 Intellijidea 更改为了版本 2021.2.3
  • 将 NVIDIA 驱动程序更改为版本 470.103.01
  • 将 NVIDIA SMI 更改为版本 470.103.01
  • 将 Nodejs 更改为了版本 v16.13.0
  • 将 Pycharm 更改为了版本 2021.2.3
  • 将 VS Code 更改为了版本 1.61.2
  • Conda
    • azureml_py36_automl
      • 将 azureml-core 更改为了版本 1.35.0
    • py38_default
      • 将 Jupyter Lab / jupyterlab 更改为了版本 3.2.1
      • 将 Jupyter Notebook / 笔记本更改为了版本 6.4.5
      • 将 Jupyter 服务器/jupyter_server 更改为了版本 1.11.2
      • 将 PyTorch 探测器 TensorBoard 插件/torch-tb-profiler 更改为了版本 0.3.1
      • 将 azureml-core 更改为了版本 1.19.1
      • 将 matplotlib 更改为了版本 3.4.3
      • 将 mkl 更改为了版本 2021.4.0
      • 将 onnx 更改为了版本 1.10.2
      • 将 opencv-python 更改为了版本 4.5.4.58
      • 将 pandas 更改为了版本 1.3.4
      • 将 pytorch 更改为了版本 1.10.0
      • 将 scikit-learn 更改为了版本 1.0.1
      • 将 tensorflow-gpu 更改为了版本 2.6.2

2021 年 10 月 7 日

适用于 Ubuntu 18.04 的新映像

版本:21.10.07

主要更改:

  • 将 pytorch 更改为了版本 1.9.1
  • 将 Docker 更改为了版本 20.10.9
  • 将 Intellijidea 更改为了版本 2021.2.2
  • 将 Nodejs 更改为了版本 v14.18.0
  • 将 Pycharm 更改为了版本 2021.2.2
  • 将 VS Code 更改为了版本 1.60.2
  • 修复了 AutoML 环境 (azureml_py36_automl)
  • 修复了 Azure 存储资源管理器稳定性
  • 改进了稳定性和次要 bug 修补程序

2021 年 8 月 11 日

适用于 Windows Server 2019 的新映像

版本:21.08.11

主要更改:

  • Windows 安全更新
  • 将 Nvidia CuDNN 更新到 8.1.0
  • 将 Jupyter Lab 更新到 3.0.16
  • 添加了用于试验跟踪的 MLFLow
  • 改进了稳定性和次要 bug 修补程序

2021 年 7 月 12 日

适用于 Ubuntu 18.04 的新映像

主要更改:

  • 已更新到 PyTorch 1.9.0
  • 已将 Azure CLI 更新到 2.26.1
  • 已将 Azure CLI Azure 机器学习扩展更新到 1.29.0
  • 更新 VS Code 版本 1.58.1
  • 改进了稳定性和次要 bug 修补程序

2021 年 6 月 22 日

适用于 Windows Server 2019 的新映像

版本:21.06.22

主要更改:

  • 已更新到 PyTorch 1.9.0
  • 修复了“Git 不可用”这一 bug

2021 年 6 月 1 日

适用于 Ubuntu 18.04 的新映像

版本:21.06.01

主要更改:

  • 默认情况下启用 Docker。
  • JupyterHub 默认使用 JupyterLab
  • 更新了 Python 版本以修复 CVE-2020-15523
  • 将 IntelliJ IDEA 更新到版本 2021.1 以修复 CVE-2021-25758
  • 将 PyCharm 社区更新为 2021.1
  • 将 TensorFlow 更新为版本 2.5.0

从桌面中删除了几个图标。

2021 年 5 月 22 日

适用于 Windows Server 2019 的新映像

版本:21.05.22

所选版本更新包括:

  • AzCopy 10.10.0
  • Azure CLI 2.23.0
  • Azure Data Studio 1.28.0
  • CUDA 11.1
  • Java 11
  • Julia 1.0.5
  • Jupyter Lab 2.2.6
  • Microsoft Edge 浏览器
  • NodeJS 16.2.0
  • Power BI Desktop 2.93.641.0 64 位(2021 年 5 月)
  • PyCharm 社区版 2021.1.1
  • Python 3.8
  • PyTorch 1.8.1
  • R 4.1.0
  • RStudio 1.4.1106
  • Spark 3.1.1
  • 存储资源管理器 1.19.1
  • TensorFlow 2.5.0
  • Visual Studio Code 1.56.2,包括 Azure 机器学习扩展
  • Visual Community Edition 2019(版本 16.9.6)

删除了 Firefox、Apache Drill 和 Azure Integration Runtime。

深色模式;桌面上图标的更改;墙纸背景更改。

2021 年 5 月 12 日

适用于 Ubuntu 18.04 的新映像

所选版本更新包括:

  • azcopy 10.10
  • Azure CLI 2.23.0
  • Azure Data Studio 1.22.1
  • Azure 存储资源管理器 1.19.1
  • CUDA 11.3、cuDNN 8、NCCL2
  • dask 2021.01.0
  • Java 11 (OpenJDK)
  • Jupyter Lab 3.0.14
  • Microsoft Edge 浏览器(beta 版本)
  • Python 3.8
  • PyTorch 1.8.1 包括 torchaudio torchtext torchvision 和 torch-tb-profiler
  • R 4.0.5
  • Spark 3.1,包括 mmlspark、指向 Blob 存储、数据湖和 Azure Cosmos DB 的连接器
  • TensorFlow 2.4.1,包括 TensorBoard
  • VS.Code 1.56

添加了 docker。 为节省资源,默认情况下不会启动 Docker 服务。 若要启动 docker 服务,请在命令行中运行以下命令:

sudo systemctl start docker

注意

如果计算机具有 GPU,则可以通过向 docker 命令中添加 --gpus 参数,而在容器内使用 GPU。

例如,此命令

sudo docker run --gpus all -it --rm -v local_dir:container_dir nvcr.io/nvidia/pytorch:18.04-py3

运行预装了 PyTorch 且已启用所有 GPU 的 Ubuntu 18.04 容器。 它还在容器中的 container_dir 下生成本地 local_dir 文件夹

2020 年 2 月 24 日

适用于 Ubuntu 18.04Windows 2019 的 Data Science Virtual Machine (DSVM) 映像现已推出。

2019 年 10 月 8 日

Windows DSVM 上的软件更新

  • Azure 存储资源管理器 1.10.1
  • Firefox 69.0.2
  • Power BI Desktop 2.73.55xx
  • PyCharm 19.2.3
  • RStudio 1.2.50xx

Windows 的默认浏览器已更新

默认浏览器在之前设置为 Internet Explorer。 现在,用户首次登录时,系统会提示他们选择默认浏览器。