拆分策略

当一组节点无法与集群中的其余节点进行通信时,站点之间可能会发生集群拆分事件。 例如,在链接集群中,如果两个站点之间的所有通信链路都失败,那么将进行拆分。 集群拆分事件会将集群拆分为两个或两个以上的分区。

您可以使用 PowerHA® SystemMirror® 配置拆分策略,指定对群集拆分事件的响应。

下列选项可用于配置拆分策略:
此选项指示在检测到集群拆分事件时不执行操作。 由集群拆分事件创建的每个分区都将成为独立集群。 每个分区可以独立于其他分区启动工作负载。 如果正在使用共享卷组,那么可能会导致数据被破坏。 此选项是缺省设置,因为需要进行手动配置来建立备用策略。 如果您的环境配置为使用 HyperSwap® for PowerHA SystemMirror ,请勿使用此选项。
仲裁
可以使用此选项来指定磁盘或 NFS 文件。

如果您指定磁盘用于仲裁,那么每个分区都会尝试通过锁定仲裁磁盘来获取仲裁磁盘。 如果您指定磁盘用于仲裁,那么将使用集群中所有节点都可访问的 SCSI 磁盘。 按照操作计划中所指定那样,会重新引导无法锁定磁盘的分区。

如果您指定了 NFS 文件用于仲裁,那么集群中的每个节点上都必须已从所选 NFS 服务器安装了 NFS。 第一个保留 NFS 文件的分区将继续起作用。 按照操作计划中所指定那样,会重新引导无法锁定 NFS 文件的分区。

注: 缺省 NFS 安装选项为 vers=4,fg,soft,retry=1,timeo=10。 修改缺省值可能会导致获取 NFS 锁定失败。
云是另一个仲裁选项,对于此选项,您必须在集群的所有节点上具有云通信。 在集群拆分事件期间,每个分区都尝试通过将文件上载到配置的云服务来获取锁定。 成功将文件上载到配置的云服务的分区将继续工作。 将重新引导无法将文件上载到已配置的云服务的分区,或者按照策略设置中所选操作计划的指定重新启动集群服务。

如果将 Cloud 选项用于拆分策略,那么还必须将合并策略配置为使用 Cloud 选项。

手动
此选项指示发生集群拆分事件时,要手动解决问题。

分区中的每个节点提供一条消息,以选择继续运行集群服务或者恢复集群服务(将重新启动该节点)。 使用此选项,可以指定需要您的输入的尝试次数和尝试频率。 还可以指定在达到需要您的输入的尝试次数、但是您尚未提供任何输入之后要执行的缺省操作。

对于指定了手动选项的链接集群,发生集群拆分事件时,将显示以下消息:

Broadcast message from root@e08m138.ausprv.stglabs.ibm.com (tty) at 04:09:48 ...
A cluster split has been detected.
You must decide if this side of the partitioned cluster is to continue.
To have it continue, enter
        /usr/es/sbin/cluster/utilities/cl_sm_continue
To have the recovery action - Reboot - taken on all nodes on this partition, enter
        /usr/es/sbin/cluster/utilities/cl_sm_recover
LOCAL_PARTITION 1 e08m138 OTHER_PARTITION 2 e08m140
在此示例中,您可以使用手动选项来检查拆分事件或合并事件是否正在等待来自 Problem Determination Tools > 手动响应拆分或合并 > 显示任何所需的手动响应 SMIT 菜单的手动响应
如果要将手动选项用于延伸集群和标准集群,那么环境必须正在运行下列版本的软件:
  • IBM® AIX® 7.2 with Technology Level 1或以后
  • PowerHA SystemMirror Version 7.2.1或以后
注: 对于在达到指定的尝试次数之后使用手动选项且未提供任何输入的任何类型的集群,将选择具有最低节点标识的分区作为获胜分区。