适用于:Azure Stack HCI 版本 22H2
本文讨论 Azure Stack HCI 的物理(结构)网络注意事项和要求,尤其是网络交换机。
注意
未来 Azure Stack HCI 版本的要求可能会改变。
Azure Stack HCI 网络交换机
Microsoft 对 Azure Stack HCI 进行测试,以符合下述“网络交换机要求”部分中标识的标准和协议。 虽然 Microsoft 不认证网络交换机,但我们确实会与供应商合作确定支持 Azure Stack HCI 要求的设备。
重要
尽管使用此处未列出的技术和协议的其他网络交换机可能有效,但我们无法保证它们将与 Azure Stack HCI 一起运行,并且可能无法帮助排查发生的问题。
购买网络交换机时,请与交换机供应商联系,确保设备满足指定角色类型的 Azure Stack HCI 要求。 以下供应商(按字母顺序排序)已确认其交换机支持 Azure Stack HCI 要求:
单击供应商选项卡,查看适用于每种 Azure Stack HCI 流量类型的已验证交换机。 可在此处找到这些网络分类。
重要
我们会根据网络交换机供应商的更改通知更新这些列表。
如果你的交换机不包括在内,请联系交换机供应商以确保交换机型号和交换机操作系统版本支持下一部分中的要求。
网络交换机要求
本部分列出了 Azure Stack HCI 部署中使用的网络交换机特定角色必须遵循的行业标准。 这些标准有助于确保 Azure Stack HCI 群集部署中的节点之间的可靠通信。
注意
用于计算、存储和管理流量的网络适配器需要以太网。 有关详细信息,请参阅主机网络要求。
下面是必需的 IEEE 标准和规范:
22H2 角色要求
要求 | 管理 | 存储 | 计算(标准) | 计算 (SDN) |
---|---|---|---|---|
虚拟 LAN | ✓ | ✓ | ✓ | ✓ |
优先级流控制 | ✓ | |||
增强的传输选择 | ✓ | |||
LLDP 端口 VLAN ID | ✓ | |||
LLDP VLAN 名称 | ✓ | ✓ | ✓ | |
LLDP 链路聚合 | ✓ | ✓ | ✓ | ✓ |
LLDP ETS 配置 | ✓ | |||
LLDP ETS 建议 | ✓ | |||
LLDP PFC 配置 | ✓ | |||
LLDP 最大帧大小 | ✓ | ✓ | ✓ | ✓ |
最大传输单元 | ✓ | |||
边界网关协议 | ✓ | |||
DHCP 中继代理 | ✓ |
注意
来宾 RDMA 需要“计算(标准)”和“存储”。
标准:IEEE 802.1Q
以太网交换机必须符合定义 VLAN 的 IEEE 802.1Q 规范。 Azure Stack HCI 的多个方面都需要 VLAN,并且所有场景下都需要 VLAN。
标准:IEEE 802.1Qbb
用于 Azure Stack HCI 存储流量的以太网交换机必须符合定义了优先级流控制 (PFC) 的 IEEE 802.1Qbb 规范。 使用数据中心桥接 (DCB) 的情况下需要 PFC。 由于 DCB 可以在 RoCE 和 iWARP RDMA 场景中使用,因此所有场景中都需要 802.1Qbb。 在不降低交换机功能或端口速度的情况下,至少需要三个服务等级 (CoS) 优先级。 其中至少有一个通信类必须提供无损通信。
标准:IEEE 802.1Qaz
用于 Azure Stack HCI 存储流量的以太网交换机必须符合定义了增强的传输选择 (ETS) 的 IEEE 802.1Qaz 规范。 使用 DCB 时需要 ETS。 由于 DCB 可以在 RoCE 和 iWARP RDMA 场景中使用,因此所有场景中都需要 802.1Qaz。
在不降低交换机功能或端口速度的情况下,至少需要三个 CoS 优先级。 此外,如果设备允许定义入口 QoS 速率,建议不要配置入口速率,也不要将其配置为与出口 (ETS) 速率完全相同的值。
注意
超聚合基础结构高度依赖于同一机架内的东-西向 2 层通信,因此需要 ETS。 Microsoft 不使用差分服务码位 (DSCP) 测试 Azure Stack HCI。
标准:IEEE 802.1AB
以太网交换机必须符合定义链接层发现协议 (LLDP) 的 IEEE 802.1AB 规范。 Azure Stack HCI 需要 LLDP,并支持物理网络配置故障排除。
必须动态启用 LLDP Type-Length-Value (TLV) 配置。 除了启用特定 TLV 以外,交换机不得要求额外配置。 例如,启用 802.1 子类型 3 应会自动播发交换机端口上所有可用的 VLAN。
自定义 TLV 要求
LLDP 使组织可定义并编码自己的自定义 TLV。 这些称为组织特定的 TLV。 所有组织特定的 TLV 都以 LLDP TLV 类型值 127 开始。 下表显示了哪些组织特定的自定义 TLV(TLV 类型 127)子类型是必需的。
组织 | TLV 子类型 |
---|---|
IEEE 802.1 | 端口 VLAN ID(子类型 = 1) |
IEEE 802.1 | VLAN 名称(子类型 = 3) 至少 10 个 VLAN |
IEEE 802.1 | 链路聚合(子类型 = 7) |
IEEE 802.1 | ETS 配置(子类型 = 9) |
IEEE 802.1 | ETS 建议(子类型 = A) |
IEEE 802.1 | PFC 配置(子类型 = B) |
IEEE 802.3 | 最大帧大小(子类型 = 4) |
最大传输单元
22H2 中的新要求
最大传输单元 (MTU) 是可以通过数据链路传输的最大帧或数据包大小。 SDN 封装所需的大小范围为 1514 - 9174。
边界网关协议
22H2 中的新要求
用于 Azure Stack HCI SDN 计算流量的以太网交换机必须支持边界网关协议 (BGP)。 BGP 是用于在两个或更多网络之间交换路由和可访问性信息的标准路由协议。 路由会自动添加到所有启用了“BGP 传播”的子网的路由表中。 启用具有 SDN 和动态对等互连的租户工作负载时需要此项。 RFC 4271:边界网关协议 4
DHCP 中继代理
22H2 中的新要求
用于 Azure Stack HCI 管理流量的以太网交换机必须支持 DHCP 中继代理。 DHCP 中继代理是任意 TCP/IP 主机,用于在服务器位于不同的网络上时,在 DHCP 服务器和客户端之间转发请求和答复。 PXE 启动服务需要此项。 RFC 3046: DHCPv4 或 RFC 6148: DHCPv4
网络流量和体系结构
本部分主要针对网络管理员。
Azure Stack HCI 可在各种数据中心体系结构中运行,包括 2 层(叶脊)和 3 层(核心聚合访问)。 本部分详细介绍了叶脊拓扑中的概念,该拓扑通常用于超聚合基础结构中的工作负载,如 Azure Stack HCI。
网络模型
网络流量可以按其方向进行分类。 传统存储区域网络 (SAN) 环境主要是北-南向,其中流量从计算层跨 3 层 (IP) 边界流向存储层。 超聚合基础结构主要是东-西向,其中很大一部分流量停留在 2 层 (VLAN) 边界内。
重要
我们需要站点中的所有群集节点都物理位于同一机架中,并连接到同一机架顶部(ToR)交换机。
注意
拉伸群集功能仅在 Azure Stack HCI 版本 22H2 中可用。
Azure Stack HCI 北-南向流量
北-南向流量具有以下特征:
- 流量从 ToR 交换机流向脊或从脊流向 ToR 交换机。
- 流量离开物理机架或跨越网络第3层边界 (IP)。
- 包括管理(PowerShell、Windows Admin Center)、计算 (VM) 和站点间拉伸群集流量。
- 使用以太网交换机连接到物理网络。
Azure Stack HCI 东-西向流量
东-西向流量具有以下特征:
- 流量保留在 ToR 交换机和 2 层边界 (VLAN) 内。
- 包括在同一群集内的节点之间的存储流量或实时迁移流量,以及(如果使用拉伸群集时)同一站点内的节点之间的流量。
- 可以使用以太网交换机(交换机式)或直接(无交换机)连接,如接下来的两部分所述。
使用交换机
北-南向流量需要使用交换机。 除了使用支持 Azure Stack HCI 所需协议的以太网交换机,最重要的方面是正确调整网络结构大小。
必须理解以太网交换机所能支持的“无阻塞”网络架构带宽,并尽量减少(或最好消除)网络的过度订阅。
可以通过正确使用子网和 VLAN 来消除常见的拥塞点和超额订阅,如用于路径冗余的多底盘链路聚合组。 另请参阅主机网络要求。
与你的网络供应商或网络支持团队协作,确保网络交换机已根据要运行的工作负载适当调整大小。
使用无交换机
只要群集中的每个节点都与群集中的每个节点建立冗余连接,Azure Stack HCI 就支持所有群集大小东-西向流量的无交换机(直接)连接。 这称为“交错”连接。
接口对 | 子网 | VLAN(虚拟局域网) |
---|---|---|
Mgmt 主机 vNIC | 特定于客户 | 特定于客户 |
SMB01 | 192.168.71.x/24 | 711 |
SMB02 | 192.168.72.x/24 | 712 |
SMB03 | 192.168.73.x/24 | 713 |
注意
由于所需的网络适配器数,当群集大于 3 个节点时,无交换机部署的好处就会减少。
无交换机连接的优点
- 对于东-西向流量,无需购买交换机。 北-南向流量需要交换机。 这可能会导致资本支出 (CAPEX) 成本降低,但具体取决于群集中的节点数。
- 由于没有交换机,因此配置仅限于主机,这可能会减少所需的潜在配置步骤数。 当群集大小增加时,此值会减小。
无交换机连接的缺点
- IP 和子网寻址方案需要进行更多规划。
- 仅提供本地存储访问。 管理流量、VM 流量和需要北-南向访问的其他流量不能使用这些适配器。
- 随着群集中节点数的增长,网络适配器的成本可能会超过使用网络交换机的成本。
- 在三节点群集之外,缩放效果不佳。 更多节点会产生额外的布线和配置,可能超过使用交换机的复杂性。
- 群集扩展很复杂,需要更改硬件和软件配置。