Db2 pureScale 环境的共享存储器支持

IBM® Db2 pureScale Feature 支持的共享存储设备分为三类。 这些类别根据两个存储器功能部件将成对的存储设备和多路径 I/O 驱动程序进行分组。 这两个功能部件 (快速 I/O 隔离支持和 Db2 集群服务 仲裁支持) 为发生故障的主机提供了更快的恢复时间,提高了弹性并提高了可用性。

防止出现恰好是半数主机发生故障的情况在具有偶数个主机的双机器配置中特别重要。 在本例中,当单台机器的故障导致半数主机发生故障时,需要仲裁来获得工作定额。

Db2 pureScale Feature 支持作为逻辑单元号 (LUN) 引用的所有存储区域网络 (SAN) 和直接连接的共享块存储器。

快速 I/O 隔离

Db2 pureScale 实例中恢复发生故障的 成员 之前, Db2 集群服务 确保发生故障的 成员 无法修改磁盘上的共享数据。 此预防措施称为 I/O 隔离。 某些存储控制器和多路径 I/O 驱动程序组合支持专用功能,称为 SCSI-3 持久性预留 (PR) , 写互斥所有注册者 持久性预留类型 (type 7h)。 此类型使 Db2 集群服务 能够在 1-2 秒内执行快速 I/O 隔离。

恢复时间是从主机发生故障到释放对未落实事务的锁定时的耗用时间。 对于具有短期事务的典型 OLTP 工作负载,快速 I/O 隔离将导致大约 20 秒的恢复时间。 快速 I/O 隔离远远快于基于锁定租赁到期的备用方法。 决定要使用的类别时,请评估是否需要快速 I/O 隔离来满足服务级别协议 (SLA)。

Db2 集群服务 仲裁支持

主机的子集群需要 IBM Reliable Scalable Cluster Technology (RSCT) 的操作定额,以允许该子集群在发生主机故障时继续运行 Db2 pureScale 实例 。 要获得 RSCT 的工作定额,子集群必须包含大部分主机。 如果恰好是集群中的半数主机在进行通信,那么该子集群可以独占保留决定性规则以获得工作定额。

Db2 11.1 和更高版本的修订包中,在受支持的 Linux® 操作系统上,用作集群管理器仲裁磁盘的设备必须启用 SCSI-3 PR WRITE EXCLUSIVE REGISTRANTS ONLY 预留类型代码 0x50 。

在受支持的 AIX® 操作系统上,用作集群管理器仲裁磁盘的设备可以是 SCSI-3 PR WRITE EXCLUSIVE REGISTRANTS ONLY 预留类型代码 0x50 已启用或 SCSI-2 预留类型已启用。

要在 Linux上检查 SCSI-3 PR 状态,请使用语法如下所示的命令 sg_persist 。 确保 Write Exclusive, registrants only 的值为 1

样本输出如下所示:
sg_persist -c /dev/dm-7
    IBM       2145         0000
    Peripheral device type: disk
    Report capabilities response: Compatible
    Reservation Handling (CRH): 1
    Specify Initiator Ports Capable (SIP_C): 0
    All Target Ports Capable (ATP_C): 0
    Persist Through Power Loss Capable (PTPL_C): 1 
    Type Mask Valid (TMV): 1
    Allow Commands: 0
    Persist Through Power Loss Active(PTPL_A): 1
     Support indicated in Type mask:
      Write Exclusive, all registrants: 1
      Exclusive Access, registrants only: 1     
      Write Exclusive, registrants only: 1
      Exclusive Access: 1
      Write Exclusive: 1
      Exclusive Access, all registrants: 1

有关命令 sg_persist的详细信息,请参阅此命令的 Linux 联机页面。

要在 AIX上检查 SCSI-3 PR 状态,请使用语法如下所示的命令 lsattr 。 确保已列示 PR_exclusive
lsattr -R -l hdisk1 -a reserve_policy
no_reserve
single_path
PR_exclusive
PR_shared

有关命令 lsattr的详细信息,请参阅 AIX 联机页面。

不要求使用仲裁磁盘。 但是,如果集群中的机器数为偶数而您没有仲裁磁盘,那么在集群中的半数机器发生故障时,工作定额将丢失。 必须具有工作定额才能使集群启动并运行。 如果没有工作定额,那么数据库将不可用。

子系统设备驱动程序路径控制模块 (SDDPCM)

如果升级的设备上的 algorithm 属性设置为 fail_over,那么将 SDDPCM 升级到 2.6.3.x 可能导致设备配置失败。 如果设备配置设置失败,那么 Db2 pureScale 集群可能会受到影响。 如果要使用 algorithm 属性的 fail_over 选项,那么必须将 timeout_policy 属性设置为 retry_path。 有关更多信息,请参阅此 IBM 支持技术说明

多路径服务配置

要在 Linux 上配置 DM-MP 多路径服务,请参阅 IBM Spectrum Scale FAQ 页面的 Q4.6。 有关更多信息,请参阅 IBM Spectrum Scale 常见问题及解答

类别 1 存储设备和多路径 I/O 驱动程序组合

此类别中列出的存储设备和多路径 I/O 驱动程序组合可成功支持 Db2 集群服务 仲裁和快速 I/O 隔离。 类别 1 设备已通过 Db2 pureScale Feature 进行验证,从而获得最高的弹性和最快的恢复时间。
表 1. 类别 1 存储设备和多路径 I/O 驱动程序组合
存储设备 AIX 系统所需的多路径 I/O 驱动程序 Linux 系统所需的多路径 I/O 驱动程序 协议
IBM Storwize ® V7000 (6.4.0.1 或更高版本) SDDPCM 和 MPIO DM-MP 光纤通道
IBM SAN Volume Controller (6.4.0.1 或更高版本) SDDPCM 和 MPIO DM-MP 光纤通道
IBM System Storage® DS8000® 系列 IBM 提供的 SDDPCM 驱动程序 (驱动程序文件 devices.fcp.disk.ibm.mpio.rtedevices.sddpcm<Your specific AIX version>.rte) DM-MP 光纤通道
IBM System Storage DS5000 系列 由 IBM 提供的 MPIO 驱动程序(驱动程序文件 devices.fcp.disk.ibm.mpio.rte DM-MP 光纤通道
IBM System Storage DS4000® 系列 由 IBM 提供的 MPIO 驱动程序(驱动程序文件 devices.fcp.disk.ibm.mpio.rte DM-MP 光纤通道
IBM System Storage DS3000 系列 由 IBM 提供的 MPIO 驱动程序(驱动程序文件 devices.fcp.disk.ibm.mpio.rte DM-MP 光纤通道
EMC VMAX/Symmetrix 系列 1

EMC PowerPath 5.5 P04 B00310 和 EMC AIX ODM 软件包 5.3.0.6

EMC 提供的 MPIO 驱动程序 (驱动程序文件 EMC.Symmetrix.fcp.MPIO.rte)

DM-MP 光纤通道
NetApp FAS 归档器 由 NetApp 提供的 MPIO 驱动程序 DM-MP iSCSI
虚拟 I/O 服务器 (VIOS) 2 MPIO 或 SDDPCM 不适用 光纤通道
Hitachi Virtual Storage Platform (VSP)5 Hitachi 提供的 MPIO 驱动程序 (devices.fcp.disk.Hitachi.array.mpio.rte)

HDLM 驱动程序 ( AIX V 7.3.1 或更高版本) ,由 Hitachi 提供

DM-MP 光纤通道
Hitachi Universal Storage (HUS) 100 系列6 Hitachi 提供的 MPIO 驱动程序 (devices.fcp.disk.Hitachi.array.mpio.rte)

HDLM 驱动程序 ( AIX V 7.3.1 或更高版本) ,由 Hitachi 提供

DM-MP 光纤通道
Hitachi Universal Storage (HUS) VM7 Hitachi 提供的 MPIO 驱动程序 (devices.fcp.disk.Hitachi.array.mpio.rte)

HDLM 驱动程序 ( AIX V 7.3.1 或更高版本) ,由 Hitachi 提供

DM-MP 光纤通道
Hitachi VSP G10007 Hitachi 提供的 MPIO 驱动程序 (devices.fcp.disk.Hitachi.array.mpio.rte)

HDLM 驱动程序 ( AIX V 7.3.1 或更高版本) ,由 Hitachi 提供

DM-MP 光纤通道
IBM XIV® Storage System MPIO DM-MP 光纤通道
IBM FlashSystem 840 IBM 提供的 MPIO 驱动程序 (驱动程序文件 devices.fcp.disk.ibm.mpio.rte) DM-MP 光纤通道
IBM Storwize V5000 (7.3.0 或更高版本) SDDPCM DM-MP 光纤通道
IBM Flash System 900 MPIO DM-MP 光纤通道
IBM Flash System v9000 MPIO   光纤通道
Huawei OceanStor 5500 V3   DM-MP 光纤通道
IBM FlashSystem™ A900010 MPIO DM-MP 光纤通道
IBM FlashSystem™ A9000R10 MPIO DM-MP 光纤通道
IBM FlashSystem™ 7200 MPIO DM-MP 光纤通道
IBM FlashSystem™ 9200 MPIO DM-MP 光纤通道
IBM FlashSystem™ 5000 MPIO DM-MP 光纤通道
注:
  1. 在前端适配器端口配置中,连接至 EMC VMAX/Symmetrix 系列存储系统的每台主机端口必须已设置 SCSI_3 (SC3) 标志。 在超卷上,必须设置用于 Db2 集群服务 仲裁的逻辑单元号 (LUN) SCSI3_persist_reserv 选项。

    在受支持的 Linux 系统上,为集群管理器 (RSCT) 仲裁选择的设备必须支持保留类型 WRITE EXCLUSIVE REGISTRANTS ONLY 类型代码 5h。 借助 SCSI-3 PR,有一个永久性预留占位符是要获得仲裁设备的节点。 使用 EMC VMAX 共享存储器的 Db2 pureScale 集群必须对映射的磁盘启用 SCSI3_persist_reserve 类型选项。 缺省情况下不启用该选项。

  2. 对于存储系统和 AIX 系统多路径 I/O 驱动程序组合,必须将 Virtual I/O Server 与 N_Port 标识虚拟化 (NPIV) 配合使用。 VIOS 存储器与底层的物理硬件存储系统具有相同的存储器类别。 要考虑将 VIOS 存储器用作类别 1 存储器,物理存储器硬件和驱动程序组合必须在类别 1 表中。
  3. 从 SDDPCM v2630 和更高版本开始,在安装 Db2 pureScale Feature之前,必须将 timeout_policy 属性更改为仲裁磁盘上的 retry_path。 要更改 timeout_policy 属性的值,请输入以下命令:
    chdev -l hdiskX -a timeout_policy=retry_path 
  4. 有关这些驱动程序的更多信息,请参阅:
  5. 下列限制适用:
    • 由 Hitachi 提供的 HDLM (Hitachi Dynamic Link Manager) for AIX V7.3.1 或更高版本
    • Linux 系统所需要的多路径 I/O 驱动程序 - 仅限于 DM-MP
    • 最低微代码级别 70-04-31-00/00
    • 如果使用了 HDLM:
      • 请使用 HGLM (Hitachi Global Link Manager Software) 将仲裁磁盘的负载均衡设置设定为 OFF。
      • 通过运行“/usr/DynamicLinkManager/bin/dlmodmset -r on”将 LUN RESET 选项设置为 ON。
    • DB2 使用的所有磁盘的特定设置:
      • 启用主机方式选项 02 和 72
      • 当使用 HDLM 时仅限光纤通道
  6. 下列限制适用:
    • HHitachi 提供的 HDLM for AIX V7.3.1 或更高版本
    • Linux 系统所需要的多路径 I/O 驱动程序 - 仅限于 DM-MP
    • 最低微代码级别 0945/A
    • 如果该磁盘将用作仲裁磁盘,请选中分配长度扩展方式 复选框
    • 快速 I/O 隔离 (SCSI-3PR) 已启用
    • 为属于 GPFS 文件系统且已启用快速 I/O 隔离的磁盘选中独有预留量方式 2 复选框
  7. 下列限制适用:
    • HHitachi 提供的 HDLM for AIX V7.3.1 或更高版本
    • Linux 系统所需要的多路径 I/O 驱动程序 - 仅限于 DM-MP
    • HUS VM 最小微代码级别 73-01-32-00/00
    • VSP G1000 最低微代码级别 80-01-41-00/00
    • 如果使用了 HDLM:
      • 请使用 HGLM 将仲裁磁盘的负载均衡设置设定为 OFF。
      • 通过运行“/usr/DynamicLinkManager/bin/dlmodmset -r on”将 LUN RESET 选项设置为 ON。
    • DB2 使用的所有磁盘的特定设置:
      • 启用主机方式选项 02 和 72
      • 当使用 HDLM 时仅限光纤通道
  8. 要在 EMC PowerPath 5.5 P04 B003 中支持 SCSI-3 PR 更改,EMC Symmetrix 必须运行 Enginunity 代码 5876 基本级别或更高级别。
  9. 对于建议的设置,请查看 类别 1 存储设备的共享存储磁盘设置
  10. 在 DB2 发行版 11.1.2.2 及更高版本修订包中受支持。

类别 2 存储设备和多路径 I/O 驱动程序组合

此类别中列出的存储设备和多路径 I/O 驱动程序组合受支持,并且已通过 Db2 pureScale Feature进行验证。 此类别中的组合可成功支持 Db2 集群服务 仲裁,但不支持快速 I/O 隔离。
表 2. 类别 2 存储设备和多路径 I/O 驱动程序组合
存储设备 AIX 系统所需的多路径 I/O 驱动程序 Linux 系统所需的多路径 I/O 驱动程序 协议
EMC VMAX/Symmetrix 系列 EMC PowerPath   光纤通道
Hitachi Universal Storage Platform V (USP V) MPIO   光纤通道

类别 3 存储设备和多路径 I/O 驱动程序组合

未标识为类别 1 或类别 2 的所有存储设备和多路径 I/O 驱动程序组合属于类别 3。 尚未使用 Db2 pureScale Feature验证类别 3 组合,尽管它们受支持。

Db2 pureScale 环境中主机故障的恢复时间与其他供应商解决方案相比具有竞争力,无论存储设备和多路径 I/O 驱动程序的类别如何。
注: 此类别中的存储设备可能无法支持快速 I/O 隔离或磁盘仲裁功能。