RoCE 网络上的交换机配置 (AIX)

此文档概述为 RoCE 配置交换机时所需的功能部件和过程。

准备工作

此配置过程特定于具有 AIX® 系统的环境中的交换机,以及基于融合以太网 (RoCE) 网络的远程直接内存访问 (RDMA)。 交换机故障转移功能是通过在交换机上配置链路聚集控制协议 (LACP) 提供的高可用性功能。

开始之前:
  1. 确保您已经创建了 Db2 pureScale Feature 安装计划。 您的安装计划可帮助确保系统满足先决条件,并且您已执行每个安装任务。
  2. 请确保您已阅读 环境的网络拓扑配置支持中有关环境的支持网络拓扑的内容。 Db2 pureScale® Db2 pureScale 环境的网络拓扑配置支持
  3. 打开交换机电源,并将串行电缆或以太网电缆连接到交换机。

关于本任务

RoCE 网络交换机必须支持:
  • 用于交换机故障转移配置的链路聚集控制协议 (LACP)。
  • 全局暂停流量控制 (IEEE 802.3x) 或优先级流量控制 (PFC) (IEEE 802.1Qbb)。
  • 可选: 支持交换机上可由同一 IP 子网上的 IP 地址执行 ping 操作的本地回送 IP 地址。 有关此操作的更多详细信息和限制,请参阅自动适配器活动性测试的限制上的技术说明。
  • VLAN 标识在每个特定集群中使用的所有交换机中必须相同。
    注: 目前, Db2 pureScale 仅支持 RoCE v1。

该过程详细描述了配置两个交换机以支持交换机故障转移的步骤。 交换机故障转移功能有助于改进网络的弹性或容错。

要创建具有多个交换机的 Db2 pureScale 环境,必须在 CF 服务器上具有多个集群互连,并在交换机上配置交换机故障转移。


限制

  • 需要对交换机的管理访问权。

过程

  1. 将两个交换机连接在一起。
    • 指定每个交换机上要用作交换机间链路 (ISL) 的两个或更多端口,然后实际连接这些端口。
    • 使用链路聚集控制协议 (LACP) 聚集所有 ISL。
    • 必须将两个交换机上的所有 ISL 端口都设置为处于活动状态。
  2. 禁用“融合增强型以太网 (CEE)”功能部件。
  3. 启用全局暂停流量控制 (IEEE 802.3x) 或基于优先级的流量控制 (PFC) (IEEE 802.1Qbb)。 只能使用其中一个流量控制设置,并且必须在网络交换机和适配器上进行配置。 请参阅网络交换机文档以了解正确的配置,因为配置因制造商而异。
    注: 对于固件级别为 6.5.2 及更高的 BNT 交换机,通过将所有 Db2 相关端口 (包括 ISL 端口) 的流量控制发送和接收设置为 "开启" 来启用全局暂停。 Db2® 相关端口,包括 ISL 端口。
  4. 执行以下两个生成树协议 (STP) 配置之一。
    1. 禁用 STP:
      • 此配置将降低整体配置复杂性,适合于专用私有 pureScale 网络,该网络中的 pS 交换机限制为由 pureScale 主机使用。
    2. 启用 STP:
      • 建议对共享 pureScale 网络使用此配置,该网络中的非 pureScale 流量可以流经 pureScale 交换机。 启用 STP 可以防止意外创建网络回路。 实际命令随交换机品牌和型号而变。 对于 BNT 交换机,需要进行下列设置:
        • 将所有非 ISL 端口 (包括未使用的端口) 标记为边缘端口。
        • 在所有边缘端口上启用 BPDU 保护。
        • 在所有边缘端口上启用根保护。
  5. 对于技术说明的 Answer 部分中列出的环境,此步骤是必需的: 自动适配器性能测试的限制,其中无法利用增强和简化的适配器性能测试。 对于该技术说明中未列示的环境,仍然建议执行此步骤,因为它可以在多层交换机设置中捕获网络故障。

    如果交换机用于具有 IP 支持的 RoCE 网络,请分配可在交换机上执行 ping 操作的 IP 地址。 分配给交换机的这些 IP 地址(作为 IP 接口)与用于 RoCE 网络上的主机的 IP 地址位于同一 IP 子网中。 如果主机上的 IP 地址连接到同一交换机但位于不同的 IP 子网中,那么其中每个 IP 子网都必须具有相应 IP 地址,该 IP 地址分配给直接与该子网连接的交换机。 完成主机 IP 地址的设置之后,可以从主机对交换机 IP 地址执行 Ping 操作。

    例如,如果将 IP 地址 10.1.1.1(网络掩码为 255.255.255.0)分配给主机的 en1 网络接口,而将 IP 地址 10.1.2.1 分配给主机的 en2 网络接口,并且每个 IP 地址连接到不同的交换机,那么可以将 IP 地址 10.1.1.24 分配给交换机 1,而 IP 地址 10.1.2.23 可以分配给交换机 2。

    再举一个例子,如果将 10.1.1.1 和 10.1.3.1(网络掩码为 255.255.255.0)分配给主机的 en1 和 en3,并且这两个 IP 地址连接到同一交换机(10.1.2.1 和 10.1.4.1 分配给主机的 en2 和 en4,并且这两个 IP 地址连接到不同的交换机)。 那么,10.1.1.24 和 10.1.3.24 将分配给交换机 1,而 10.1.2.23 和 10.1.4.23 将分配给交换机 2。

  6. 对集群中的所有交换机重复以上步骤。

示例

注: 上述步骤 2-4 在单交换机 RoCE 配置中也是必需的。

后续操作

配置计划包含在 Db2 pureScale 环境中的主机的网络设置。