Problemas de red y conmutación
En esta sección se describen las soluciones para posibles problemas de red y conmutación.
- Anomalía inesperada de interfaz de red en redes conmutadas
- Comunicación de multidifusión de verificación
- Persistencia de direcciones IPv6 durante el reinicio del sistema
- Los nodos de clúster no se pueden comunicar
- Distributed SMIT genera resultados imprevisibles
- Recuperación de una anomalía de NIC de conexión en caliente PCI
- Etiqueta IP para PowerHA® SystemMirror® desconectada de la interfaz AIX®
- Paquetes perdidos durante la transmisión de datos
- Resolución de problemas de multidifusión
- Resolución de problemas de difusión única
- Resolución de problemas de redes de área local virtual
Anomalía de interfaz de red inesperada en redes conmutadas
- Problema
En las configuraciones PowerHA SystemMirror pueden producirse fallos inesperados de las interfaces de red al utilizar redes conmutadas si las redes y los conmutadores están configurados incorrectamente.
- Solución
Tenga cuidado de configurar los conmutadores y las redes correctamente.
Comunicación de multidifusión de verificación
- Problema
- Por defecto, PowerHA SystemMirror utiliza comunicaciones unicast para el heartbeat. Para la comunicación de clúster, puede seleccionar opcionalmente configurar una dirección de multidifusión o hacer que CAA seleccione automáticamente la dirección de multidifusión si la red está configurada para dar soporte a la comunicación de multidifusión. Si utiliza la comunicación de multidifusión, no cree un clúster hasta que verifique que los paquetes de multidifusión se pueden enviar correctamente a través de todos los nodos que forman parte del clúster.
- Solución
Para probar la comunicación de multidifusión de extremo a extremo para todos los nodos utilizados para crear el clúster en la red, ejecute el mandato mping para enviar y recibir paquetes entre nodos.
Si está ejecutando PowerHA SystemMirror Versión 7.1.1, o posterior, no podrá crear un clúster si el comando mping falla. Si el comando mping falla, su red no está configurada correctamente para la comunicación multicast. Si es así, revise la documentación de los conmutadores y direccionadores para habilitar la comunicación multidifusión.
Puede ejecutar el mandato mping con una dirección de multidifusión específica; de lo contrario, el mandato utiliza una dirección de multidifusión predeterminada. Debe utilizar las direcciones de multidifusión que se utilizan para crear el clúster como entrada para el mandato mping .Nota: El mandato mping utiliza la interfaz que tiene la ruta predeterminada. Para utilizar el mandato mping para probar la comunicación de multidifusión en una interfaz diferente que no tiene la ruta predeterminada, debe añadir temporalmente una ruta estática con la interfaz necesaria a la dirección IP de multidifusión.El ejemplo siguiente muestra un caso de éxito y un caso de anomalía para el mandato mping , donde el nodo A es el receptor y el nodo B es el emisor.
Caso de éxito:Receiver root@nodeA:/# mping -r -R -c 5 mping version 1.1 Listening on 227.1.1.1/4098: Replying to mping from 9.3.207.195 (nodeB.aus.stglabs.ibm.com) bytes=32 seqno=0 ttl=1 Replying to mping from 9.3.207.195 (nodeB.aus.stglabs.ibm.com) bytes=32 seqno=1 ttl=1 Replying to mping from 9.3.207.195 (nodeB.aus.stglabs.ibm.com) bytes=32 seqno=2 ttl=1 Replying to mping from 9.3.207.195 (nodeB.aus.stglabs.ibm.com) bytes=32 seqno=3 ttl=1 Replying to mping from 9.3.207.195 (nodeB.aus.stglabs.ibm.com) bytes=32 seqno=4 ttl=1 Sender root@nodeB:/# mping -R -s -c 5 mping version 1.1 mpinging 227.1.1.1/4098 with ttl=1: 32 bytes from 9.3.207.190 (nodeA.aus.stglabs.ibm.com) seqno=0 ttl=1 time=0.985 ms 32 bytes from 9.3.207.190 (nodeA.aus.stglabs.ibm.com) seqno=1 ttl=1 time=0.958 ms 32 bytes from 9.3.207.190 (nodeA.aus.stglabs.ibm.com) seqno=2 ttl=1 time=0.998 ms 32 bytes from 9.3.207.190 (nodeA.aus.stglabs.ibm.com) seqno=3 ttl=1 time=0.863 ms 32 bytes from 9.3.207.190 (nodeA.aus.stglabs.ibm.com) seqno=4 ttl=1 time=0.903 ms --- 227.1.1.1 mping statistics --- 5 packets transmitted, 5 packets received, 0% packet loss round-trip min/avg/max = 0.863/0.941/0.998 msCaso de error:Receiver root@nodeA:/# mping -r -R -c 5 -6 mping version 1.1 Listening on ff05::7F01:0101/4098: Replying to mping from fe80::18ae:19ff:fe72:1a15 bytes=48 seqno=0 ttl=1 Replying to mping from fe80::18ae:19ff:fe72:1a15 bytes=48 seqno=1 ttl=1 Replying to mping from fe80::18ae:19ff:fe72:1a15 bytes=48 seqno=2 ttl=1 Replying to mping from fe80::18ae:19ff:fe72:1a15 bytes=48 seqno=3 ttl=1 Replying to mping from fe80::18ae:19ff:fe72:1a15 bytes=48 seqno=4 ttl=1 Sender root@nodeB:/# mping -R -s -c 5 -6 mping version 1.1 mpinging ff05::7F01:0101/4098 with ttl=1: --- ff05::7F01:0101 mping statistics --- 5 packets transmitted, 0 packets received, 100% packet loss round-trip min/avg/max = 0.000/0.000/0.000 msNota: Para verificar un resultado, sólo debe comprobar el lado del remitente del mandato mping . Además, tenga en cuenta el porcentaje de pérdida de paquetes. Para verificar si la multidifusión funciona en una red, debe realizar las pruebas de mping con ambos nodos probados como emisor y receptor. Normalmente, la salida no detallada proporciona la información necesaria. Sin embargo, si opta por utilizar el distintivo -v con el mandato mping , es necesario tener un buen conocimiento sobre los elementos internos del programa, sin los cuales la salida detallada puede entenderse incorrectamente. También puede comprobar el código de retorno del lado del remitente del mandato mping . Si se produce un error, el remitente devuelve 255. Tras el éxito, devuelve 0.AIX (CAA) con reconocimiento de clúster selecciona una dirección de multidifusión predeterminada si no especifica una dirección de multidifusión al crear el clúster. La dirección de multidifusión predeterminada se crea combinando el OR lógico del valor (228.0.0.0) con los 24 bits inferiores de la dirección IP del nodo. Por ejemplo, si la dirección IP es 9.3.199.45, la dirección de multidifusión predeterminada sería 228.3.199.45.
Las direcciones Internet Protocol versión 6 ( IPv6 ) son compatibles con PowerHA SystemMirror Versión 7.1.2, o posterior. Cuando se configuran direcciones IPv6 en el clúster, Cluster Aware AIX (CAA) activa el heartbeat para las direcciones IPv6 con una dirección multicast IPv6. Debe comprobar que las conexiones IPv6 de su entorno pueden comunicarse con direcciones multidifusión.
Para verificar que las comunicaciones de multidifusión IPv6 se han configurado correctamente en el entorno, puede ejecutar el mandato mping con la opción -6 . Cuando ejecuta el mandato mping , verifica las comunicaciones de multidifusión IPv6 con la dirección de multidifusión IPv6 predeterminada. Para especificar una dirección de multidifusión IPv6 específica, ejecute el mandato mping con la opción -a y especifique una dirección de multidifusión IPv6 . No es necesario especificar la opción -6 cuando se utiliza la opción -a . El mandato mping determina automáticamente la familia de la dirección que se pasa con la opción -a .
Persistencia de direcciones IPv6 durante el reinicio del sistema
- Problema
Internet Protocol versión 6 (IPv6) está diseñado para la configuración dinámica al igual que el sistema operativo AIX . Las direcciones IPv6 no persisten durante una operación de rearranque del sistema.
- Solución
Para configurar direcciones IPv6 después de un rearranque, puede ejecutar manualmente el mandato autoconf6 . Como alternativa, PowerHA SystemMirror ejecutará automáticamente el comando autoconf6 antes de iniciar los servicios del clúster.
Para configurar el mandato autoconf6 para que se ejecute automáticamente para el sistema operativo AIX , realice los pasos siguientes para cambiar el archivo /etc/rc.tcpip :- Elimine el comentario de las líneas siguientes para ejecutar el mandato autoconf6 :
# Start up autoconf6 process start /usr/sbin/autoconf6Nota: Puede especificar interfaces individuales especificando el distintivo -i . Por ejemplo:# Start up autoconf6 process start /usr/sbin/autoconf6 "" "-i en1" - Elimine el comentario de las líneas siguientes para iniciar los daemons de
ndpd:# Start up ndpd-host daemon start /usr/sbin/ndpd-host "$src_running" # Start up the ndpd-router daemon start /usr/sbin/ndpd-router "$src_running"
- Elimine el comentario de las líneas siguientes para ejecutar el mandato autoconf6 :
Los nodos de clúster no se pueden comunicar
- Problema
Si la configuración tiene dos o más nodos conectados mediante una sola red, es posible que tenga un clúster particionado. Un clúster particionado se produce cuando los nodos de clúster no se pueden comunicar. En circunstancias normales, una anomalía de la interfaz de red de servicio en un nodo hace que el gestor de clúster reconozca y gestione un suceso swap_adapter , donde la etiqueta IP de servicio o la dirección IP se sustituye por otra etiqueta IP o dirección IP. Los latidos se intercambian por medio de discos compartidos. Sin embargo, existe la posibilidad de que el nodo se aísle del clúster. Aunque los gestores de clúster de otros nodos son conscientes del suceso swap_adapter intentado, no se pueden comunicar con el nodo ahora aislado (particionado) porque no existe ninguna vía de acceso de comunicación.
- Solución
Asegúrese de que la red no está configurada para ningún punto único de anomalía.
La SMIT distribuida genera resultados imprevisibles
- Problema
El uso de la utilidad DSMIT de AIX en operaciones que no sean iniciar o detener los servicios de clúster de PowerHA SystemMirror , puede causar resultados impredecibles.
- Solución
DSMIT gestiona el funcionamiento de los procesadores de red IBM® System p™. Incluye la lógica necesaria para controlar la ejecución de mandatos AIX en todos los nodos de red. Para evitar conflictos con PowerHA SystemMirror, utilice DSMIT únicamente para iniciar y detener los servicios de clúster de PowerHA SystemMirror .
Recuperación de una anomalía de NIC de conexión en caliente PCI
- Problema
Si un error irrecuperable hace que falle un proceso de sustitución en caliente PCI, es posible que el NIC se abandone en un estado no configurado y que el nodo se abandone en modalidad de mantenimiento. La ranura PCI que contiene la NIC o la nueva NIC puede estar dañada.
- Solución
Es necesaria la intervención del usuario para que el nodo vuelva a estar en orden de funcionamiento completo.
Etiqueta IP para PowerHA SystemMirror desconectada de la interfaz AIX
- Problema
Cuando se definen interfaces de red para la configuración del clúster introduciendo o seleccionando una etiqueta IPPowerHA SystemMirror , PowerHA SystemMirror descubre el nombre de la interfaz de red AIX asociada. PowerHA SystemMirror espera que esta relación no cambie. Si cambia el nombre de la interfaz de red AIX después de configurar y sincronizar el clúster, PowerHA SystemMirror no funcionará correctamente.
- Solución
Si ocurre este problema, puede restablecer el nombre de la interfaz de red desde SMIT PowerHA SystemMirror Panel de gestión del sistema (C-SPOC).
Paquetes perdidos durante la transmisión de datos
- Problema
Si los datos se pierden de forma intermitente durante la transmisión, es posible que la unidad de transmisión máxima (MTU) se establezca en distintos tamaños en distintos nodos. Por ejemplo, si el nodo A envía paquetes de 8 K al nodo B, que puede aceptar paquetes de 1.5 K, el nodo B presupone que el mensaje está completo y que los datos pueden perderse.
- Solución
Ejecute el programa de utilidad de verificación de clúster para asegurarse de que todas las tarjetas de interfaz de red en todos los nodos de clúster durante la misma red tienen el mismo valor para el tamaño de MTU. Si el tamaño de MTU es incoherente en toda la red, se visualiza un error y puede determinar qué nodos se deben ajustar.
Resolución de problemas de multidifusión
- Problema
- Utilice el mandato mping para probar si los nodos pueden enviar y recibir paquetes de multidifusión. Si el mandato mping falla, debe identificar cuál es el problema en el entorno de red.
- Solución
- Para resolver problemas de multidifusión en la red, revise las directrices siguientes:
- Revise la documentación de los conmutadores que se utilizan para la comunicación de multidifusión.
- Inhabilite el snooping Internet Group Management Protocol (IGMP) en los conmutadores que se utilizan para la comunicación multidifusión.Nota: Si la infraestructura de red no permite que el snooping IGMP se inhabilite de forma permanente, es posible que pueda resolver los problemas inhabilitando temporalmente el snooping en los conmutadores y, a continuación, añadiendo más componentes de red de uno en uno.
- Elimine los conmutadores en cascada entre los nodos del clúster. En otras palabras, solo tiene un único conmutador entre los nodos del clúster.
Resolución de problemas de difusión única
- Problema
- Por defecto, PowerHA SystemMirror utiliza comunicaciones unicast basadas en sockets entre los nodos del clúster.
Si tiene problemas con las comunicaciones de difusión única, siga los procedimientos generales de resolución de problemas de red. Por ejemplo:
- Utilice los mandatos ifconfig y netstat para verificar la configuración y el direccionamiento de la dirección IP.
- Utilice los mandatos ping y traceroute para verificar que los nodos y adaptadores se pueden comunicar.
Resolución de problemas de redes de área local virtual
- Problema
Para solucionar los problemas de las interfaces VLAN definidas en PowerHA SystemMirror y detectar un fallo de la interfaz, considere estas interfaces como interfaces definidas en redes de adaptador único.
En concreto, liste las interfaces de red que pertenecen a una VLAN en la variable ping_client_list en el script /usr/es/sbin/cluster/etc/clinfo.rc y ejecute el mandato clinfo . Siempre que se produce un suceso de clúster, clinfo supervisa y detecta una anomalía de las interfaces de red listadas. Debido a la naturaleza de las redes de área local virtual, otros mecanismos para detectar la anomalía de las interfaces de red no son efectivos.