基于数据科学虚拟机的团队分析和 AI 环境

Data Science Virtual Machine (DSVM) 在 Azure 平台上提供了一个丰富的环境,其中包含为人工智能 (AI) 和数据分析预建的软件。

传统上,DSVM 已被用作单独的分析桌面。 这种共享的预生成的分析环境可提高科学家的工作效率。 当大型分析团队为其数据科学家和 AI 开发人员规划环境时,其中一个反复出现的主题是共享的开发和实验分析基础结构。 该基础结构的托管方式符合企业 IT 策略,这些策略还有助于促进数据科学和分析团队之间的协作和一致性。

共享基础结构使 IT 部门能够更好地利用该分析环境。 某些组织将基于团队的数据科学/分析基础结构描述为“分析沙盒”。 它使数据科学家能够访问各种数据资产,以便快速了解和处理数据。 此沙盒环境还帮助数据科学家运行实验、验证假设并构建预测模型,且不影响生产环境。

由于 DSVM 在 Azure 基础结构级别运行,因此 IT 管理员可以轻松配置 DSVM,使其在遵守企业 IT 策略的情况下运行。 DSVM 提供了完全灵活性,可实现各种共享体系结构,并提供对公司数据资产的受控访问。

本节讨论可以用来将 DSVM 部署为基于团队的数据科学基础结构的模式和指南。 由于这些模式的构建基块来自 Azure 基础结构即服务 (IaaS),因此它们适用于任何 Azure VM。 此系列的文章侧重于这些标准 Azure 基础结构功能在 DSVM 中的应用。

企业团队分析环境的关键构建基块包括:

此系列针对前面的每个主题提供指导和技巧。 它不包括在大型企业配置中部署 DSVM 的所有注意事项和需求。 以下是在企业中实现 DSVM 实例时可以使用的其他一些 Azure 资源:

最后,Azure 体系结构中心为构建和管理基于云的分析基础结构提供了详细的端到端体系结构和模型。