可以使用 Data Science Virtual Machine (DSVM) 轻松探索数据并在云中处理机器学习。 DSVM 预配置了安全修补程序、驱动程序、流行的数据科学和开发软件以及完整的操作系统。 你可以选择适合自己的硬件环境,选择范围包括低成本的以 CPU 为中心的计算机,以及具有多个 GPU、NVMe 存储和大量内存的强大计算机。 对于配备 GPU 的计算机,所有驱动程序均已安装,并且所有机器学习框架都经过了版本匹配,以实现 GPU 兼容性。 此外,所有支持 GPU 的应用程序软件都启用了加速。
DSVM 预装了最有用的数据科学工具。
构建深度学习和机器学习解决方案
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
---|---|---|---|---|
CUDA、cuDNN、NVIDIA 驱动程序 | ✅ | ✅ | ✅ |
DSVM 上的 CUDA、cuDNN、NVIDIA 驱动程序 |
Horovod | ❌ | ❌ | ✅ | DSVM 上的 Horovod |
NVidia System Management Interface (nvidia-smi) | ✅ | ✅ | ✅ | DSVM 上的 nvidia-smi |
PyTorch | ✅ | ✅ | ✅ | DSVM 上的 PyTorch |
TensorFlow | ✅ | ✅ |
✅ | DSVM 上的 TensorFlow |
与 Azure 机器学习 (Python) 集成 | ✅ (Python SDK、示例) |
✅ (Python SDK、示例) |
✅ (Python SDK、CLI、示例) |
Azure 机器学习 SDK |
XGBoost | ✅ (CUDA 支持) |
✅ (CUDA 支持) |
✅ (CUDA 支持) |
DSVM 上的 XGBoost |
Vowpal Wabbit | ✅ | ✅ | ✅ |
DSVM 上的 Vowpal Wabbit |
Weka | ❌ | ❌ | ❌ | |
LightGBM | ❌ | ❌ | ✅ (GPU 和 MPI 支持) |
|
H2O | ❌ | ❌ | ✅ | |
CatBoost | ❌ | ❌ | ✅ | |
Intel MKL | ❌ | ❌ | ✅ | |
OpenCV | ❌ | ❌ | ✅ | |
Dlib | ❌ | ❌ | ✅ | |
Docker | ✅ (仅限 Windows 容器) |
✅ (仅限 Windows 容器) |
✅ | |
Nccl | ❌ | ❌ | ✅ | |
Rattle | ❌ | ❌ | ❌ | |
ONNX 运行时 | ❌ | ❌ | ✅ |
存储、检索和操作数据
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
---|---|---|---|---|
关系数据库 | SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
DSVM 上的 SQL Server |
数据库工具 | SQL Server Management Studio SQL Server Integration Services bcp、sqlcmd |
SQL Server Management Studio SQL Server Integration Services bcp、sqlcmd |
SQuirreL SQL(查询工具) bcp、sqlcmd ODBC/JDBC 驱动程序 |
|
Azure 存储资源管理器 | ✅ |
✅ |
||
Azure CLI | ✅ |
✅ |
✅ |
|
AzCopy | ✅ |
✅ |
❌ | DSVM 上的 AzCopy |
Blob FUSE 驱动程序 | ❌ | ❌ | ❌ |
DSVM 上的 blobfuse |
Azure Cosmos DB 数据迁移工具 | ✅ | ✅ | ❌ | DSVM 上的 Azure Cosmos DB |
Unix/Linux 命令行工具 | ❌ | ❌ | ✅ | |
Apache Spark 3.1(独立版) | ✅ | ✅ | ✅ |
使用 Python、R、Julia 和 Node.js 编程
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
---|---|---|---|---|
预装了 CRAN-R 和流行包 | ✅ | ✅ | ✅ | |
预装了 Anaconda Python 和流行包 | ✅ | ✅ (Miniconda) |
✅ (Miniconda) |
|
Julia (Julialang) | ✅ | ✅ | ✅ | |
JupyterHub(多用户 Notebook 服务器) | ❌ | ❌ | ✅ | |
JupyterLab(多用户 Notebook 服务器) | ✅ | ✅ | ✅ | |
Node.js | ✅ | ✅ | ✅ | |
带有以下内核的 Jupyter Notebook Server | ✅ |
✅ |
✅ | Jupyter Notebook 示例 |
R | R Jupyter 示例 | |||
Python | Python Jupyter 示例 | |||
Julia | Julia Jupyter 示例 | |||
PySpark | pySpark Jupyter 示例 |
Ubuntu 20.04 DSVM、Windows Server 2019 DSVM 和 Windows Server 2022 DSVM 具有以下 Jupyter 内核:
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
- R
- Python 3.7 - Spark(本地)
- Julia 1.6.0
- R Spark – HDInsight
- Scala Spark – HDInsight
- Python 3 Spark - HDInsight
Ubuntu 20.04 DSVM、Windows Server 2019 DSVM 和 Windows Server 2022 DSVM 具有以下 conda 环境:
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
使用你喜欢的编辑器或 IDE
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
---|---|---|---|---|
Notepad++ | ✅ |
✅ |
❌ |
|
Nano | ✅ |
✅ |
❌ |
|
Visual Studio 2019 Community Edition | ✅ |
✅ | ❌ | DSVM 上的 Visual Studio |
Visual Studio Code | ✅ |
✅ |
✅ |
DSVM 上的 Visual Studio Code |
PyCharm Community Edition | ✅ |
✅ |
✅ |
DSVM 上的 PyCharm |
IntelliJ IDEA | ❌ | ❌ | ✅ | |
Vim | ❌ | ❌ | ✅ |
|
Emacs | ❌ | ❌ | ✅ |
|
Git 和 Git Bash | ✅ |
✅ |
✅ |
|
OpenJDK 11 | ✅ |
✅ |
✅ |
|
.NET Framework | ✅ |
✅ |
❌ | |
Azure SDK | ✅ |
✅ | ✅ |
组织和展示结果
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用注意事项 |
---|---|---|---|---|
Microsoft 365(Word、Excel、PowerPoint) | ✅ | ✅ | ❌ | |
Microsoft Teams | ✅ | ✅ | ❌ | |
Power BI Desktop | ✅ | ✅ |
❌ | |
Microsoft Edge 浏览器 | ✅ | ✅ | ✅ |