Accueil Logiciel Z Transactions Z Lifeline IBM Multi-site Workload Lifeline

Activer la disponibilité continue en cas de panne pour les workloads stratégiques de l’entreprise exécutés sur z/OS

Lire le Redpaper IBM

Le Multi-site Workload Lifeline, ou plus simplement « Lifeline », est un logiciel de surveillance et de routage des workloads. Il permet d’équilibrer la charge des transactions critiques en distribuant les connexions pour les workloads TCP/IP et des messages pour les workloads de cluster IBM MQ sur deux sites, garantissant ainsi une disponibilité quasi continue.

Ce produit est disponible à la fois en tant qu’offre indépendante et dans le cadre de la solution GDPS Continuous Availability.

En cas de panne, IBM Multi-site Workload Lifeline permet de réduire de plusieurs heures à quelques minutes le temps de reprise des workloads critiques par rapport à une reprise après sinistre traditionnelle. Le temps de reprise en cas de panne non planifiée est réduit grâce à la détection des défaillances du workload et au reroutage vers un autre site. L’impact des pannes planifiées est atténué grâce au basculement des workloads vers un autre site avec un minimum d’interruption.

Lifeline prend en charge les types de workloads suivants :

  • Workloads basés sur TCP/IP. 

  • Workloads Linux on z Systems  

  • Workloads SNA 

  • Workloads de cluster IBM MQ 

  • Workloads routés par Sysplex Db2  

Nouveautés

Résumé des récentes mises à jour de Lifeline V2.5

Prise en charge de l’API de commande à distance et des workloads multicluster IBM MQ

Avantages Améliorez les performances

Acheminez les nouvelles connexions de workloads vers les applications, les serveurs et les systèmes les plus à même de les traiter afin de réduire le temps de réponse des transactions. Les ressources système sont utilisées plus efficacement.

Parvenir à un niveau de disponibilité plus élevé

En cas de panne d’une application, d’un système ou d’un site, les nouvelles connexions de workloads sont acheminées vers d’autres applications disponibles. Cela permet de minimiser les interruptions dues aux mises à jour de maintenance ou à d’autres événements planifiés.

Réduire le délai de reprise

Réduisez le temps de réponse en harmonisant les nouvelles connexions de workloads avec les applications et les systèmes les plus performants. Réduisez le temps de récupération de plusieurs heures à quelques minutes après une défaillance de workload.

Améliorer l’évolutivité

Ajoutez des instances d’application à la demande. Contrôlez et incluez automatiquement les instances ajoutées dans les décisions de routage du workload.

Améliorer l’accessibilité pendant la migration des workloads

Acheminez les workloads d’un site à l’autre avec un minimum de perturbations. Les connexions pour les workloads de requête peuvent être distribuées sur les deux sites simultanément.

Simplifier les procédures de reprise après sinistre

Profitez de tests simplifiés et non perturbants de vos procédures de reprise après sinistre qui garantissent une accessibilité ininterrompue des workloads sur le site de récupération sans nécessiter l’arrêt du site de production.

IBM Multi-site Workload Lifeline peut nous aider à savoir si un site fonctionne normalement et si les données sont synchronisées. Ce n’est que lorsqu’IBM Multi-site Workload Lifeline est déployé qu’IBM GDPS Continuous Availability (GDPS CA) peut achever le basculement du workload pour atteindre une disponibilité continue. Responsable senior du centre de données Une grande banque asiatique
Fonctionnalités
Équilibrage de charge des workloads

Lifeline utilise deux niveaux d’équilibrage de charge pour les workloads ciblant les applications TCP/IP. Lifeline demande aux équilibreurs de charge de premier niveau d’acheminer les connexions de workloads vers les équilibreurs de charge de second niveau du site sélectionné, qui acheminent ensuite les connexions vers les applications du site. Lifeline s’appuie sur les clusters IBM MQ pour les workloads qui utilisent la messagerie. La solution demande au cluster d’acheminer les messages du workload vers les gestionnaires de file d’attente IBM MQ sur le site sélectionné, qui mettent ensuite les messages à la disposition des applications.

Découvrir les équilibreurs de charge externes Découvrir les équilibreurs de charge internes
Recommandations de routage du site

Pour les workloads qui utilisent deux niveaux d’équilibreurs de charge, Lifeline fournit aux équilibreurs de charge de premier niveau des recommandations de routage de connexion de site basées sur la disponibilité et l’état des applications du workload, des systèmes z/OS et (le cas échéant) des systèmes Linux on IBM Z sur les deux sites. Pour les workloads qui utilisent des clusters IBM MQ, Lifeline donne au cluster des recommandations de routage de messages sur site basées sur la disponibilité et la santé des gestionnaires de file d’attente IBM MQ et des systèmes z/OS sur les deux sites.

Découvrir les clusters IBM MQ
Agents de Lifeline

Un agent Lifeline est démarré sur chaque système z/OS et Linux on Z Management Guest où les workloads sont présents sur les deux sites. L’agent est chargé de surveiller les applications de workload qui résident sur son système et de transmettre ces informations à un conseiller Lifeline. L’agent sur z/OS est également chargé de communiquer avec un gestionnaire de file d’attente IBM MQ afin de surveiller et d’orienter le routage des messages IBM MQ au sein d’un cluster IBM MQ.  

Découvrir les agents Lifeline
Conseillers Lifeline

Un conseiller Lifeline est démarré sur un système z/OS et peut être démarré en tant que conseiller principal ou secondaire. Le conseiller principal communique avec tous les agents Lifeline pour déterminer la disponibilité du workload. Il fournit des règles de distribution des messages IBM MQ aux agents pour les clusters IBM MQ et des recommandations de routage aux équilibreurs de charge pour les connexions TCP de ces workloads. Un conseiller secondaire surveille la disponibilité du conseiller principal et prend le relais en cas de défaillance de celui-ci.

Découvrir les conseillers Lifeline
Configurations des workloads

Chaque workload configuré pour Multi-site Workload Lifeline est classé comme workload actif/de réserve ou actif/requête.

Workload actif/de secours

 

Un workload actif/de secours est actif sur un site. Lifeline oriente les équilibreurs de charge et les gestionnaires de file d’attente IBM MQ pour le routage des connexions et des messages entrants vers le site actif. Lorsque des mises à jour de base de données sont effectuées, le logiciel de réplication de base de données transmet ces modifications de manière asynchrone de l’instance active du workload à son instance de secours. Sur le site de secours, l’instance de secours du workload est active et prête à recevoir les tâches. Les données actualisées du site actif sont appliquées au sous-système de base de données fonctionnant sur le site de secours en temps quasi réel.

Workload actif/requête

Un workload actif/requête peut être actif sur l’un des sites ou sur les deux. Lifeline donne des recommandations de routage aux équilibreurs de charge afin d’équilibrer intelligemment les connexions entre les deux sites. Les workloads qui utilisent des messages IBM MQ ne peuvent pas être classées comme workloads actifs/requêtes. Lorsque des mises à jour de la base de données sont effectuées par le workload actif/de secours associé, la latence de réplication de la base de données est surveillée par Lifeline pour garantir que les connexions ne sont pas acheminées vers un site dont la base de données répliquée sur ce site contient des données trop obsolètes par rapport à la base de données sur le site actif.

Découvrir des exemples de configurations Multi-site Workload Lifeline
Informations techniques

Avant d’utiliser Multi-site Workload Lifeline, vous devez identifier les workloads pour lesquels vous souhaitez fournir une disponibilité continue et évaluer la manière dont les applications de ces workloads sont accessibles.

Exigences
  • Tous les systèmes z/OS doivent fonctionner sur z/OS 2.5 ou version ultérieure.
  • Tous les invités Linux on z Systems doivent utiliser SUSE Linux Enterprise Server (SLES) 12 SP4 ou version ultérieure, ou Red Hat Enterprise Linux Server 7.9 ou version ultérieure.
  • Les systèmes z/VM hébergeant les invités Linux on z Systems doivent fonctionner sur z/VM 6.4 ou version ultérieure.
Voir les autres exigences
Ressources Conversion vers un cluster IBM MQ

Découvrez comment convertir un environnement MQ existant avec des canaux partagés en cluster et comment configurer Lifeline pour prendre en charge un workflow qui utilise un cluster MQ.

Intégration d’IBM Multi-site Workload Lifeline à F5 BIG-IP

Lisez les cas d’utilisation qui décrivent l’intégration de Lifeline à BIG-IP Local Traffic Manager de F5.

Produits associés IBM z/OS Communications Server

Plateforme sécurisée pour le développement et le partage des workloads du mainframe.

IBM GDPS

Automatisez les tâches du mainframe et la reprise après incident pour atteindre vos objectifs de résilience.

IBM z/OS Parallel Sysplex

Améliorez les communications des serveurs grâce à une technologie de clustering qui permet de connecter un ensemble de 32 systèmes IBM z/OS pour qu’ils se comportent comme une seule plateforme informatique logique.

IBM Data Replication

Soutenez les initiatives d’intégration et de consolidation des données, d’entreposage et d’analyse à grande échelle grâce à la capture des données modifiées basée sur les journaux et à l’intégrité transactionnelle.

Plus de résilience sur IBM Z

FAQ

Comment IBM Multi-site Workload Lifeline permet une disponibilité continue ?

Lifeline surveille les applications de workload et les systèmes dans lesquels ces applications résident, dans les deux sysplex ou sites sur lesquels ces systèmes sont exécutés. Lifeline contrôle le routage des connexions et des messages MQ destinés à ces applications de workload, en veillant à ce que les connexions et les messages IBM MQ soient transmis aux applications de workload optimales dans le ou les sites actifs. Si Lifeline détecte une défaillance du workload sur le site actif, la solution effectue automatiquement le basculement en quelques secondes vers les applications du workload du site secondaire. Lifeline peut également générer des messages d’alerte que les produits d’automatisation peuvent capturer pour effectuer leur propre basculement de workload.

Mon entreprise a-t-elle besoin d’une disponibilité continue des workloads ?

Si votre entreprise est concernée par l’une des situations suivantes, une disponibilité continue de vos workloads est nécessaire.

  • Votre entreprise doit fonctionner 24 h/24 et 7 j/7 en raison des réglementations du secteur.
  • D’autres entreprises dépendent de la disponibilité continue de votre entreprise, par exemple si votre entreprise est active dans les secteurs de la finance et de l’assurance.
  • Votre entreprise n’a mis en place aucune procédure de reprise, par exemple avec des environnements non sysplex, et aucune fonctionnalité de réplication sur disque.
En quoi la disponibilité continue est-elle différente de la reprise après incident ?

Les solutions de reprise après sinistre existantes utilisent la réplication sur disque pour effectuer des copies miroir vers un site distant de tous les disques utilisés par les systèmes du site local. Ces copies de disques ne peuvent pas être utilisées au cours de la réplication des disques. En cas de panne sur le site local, les systèmes et les applications de workload doivent être relancés sur le site distant avant que l’accès aux workloads ne soit rétabli. En règle générale, cette opération peut prendre une heure, voire plus.
Avec les solutions de disponibilité continue basées sur Lifeline, la réplication logicielle des données, telle que InfoSphere Data Replication for Db2, est utilisée pour assurer la synchronisation des données entre les sites locaux et distants. La principale différence réside dans le fait que les systèmes des deux sites sont actifs et que Lifeline intervient pour surveiller les workloads sur les deux sites. En cas de défaillance du site local, Lifeline détecte la défaillance du workload et achemine toutes les nouvelles connexions au workload vers le site alternatif. L’accès aux workloads est ainsi rétabli en quelques secondes, au lieu d’une heure ou plus avec les solutions de reprise après sinistre.

En quoi Lifeline fait partie intégrante de la solution GDPS Continuous Availability ?

Lifeline, grâce à sa surveillance et à son routage des workloads, joue un rôle essentiel dans la solution de disponibilité continue GDPS et offre les avantages suivants :

  • Performances améliorées : les nouvelles connexions de workloads sont acheminées vers les applications, les serveurs et les systèmes les plus à même de les traiter, ce qui permet de réduire le temps de réponse des transactions. Les ressources système sont utilisées plus efficacement.
  • Amélioration de la disponibilité : les nouvelles connexions de workloads peuvent être acheminées vers les applications et les systèmes disponibles lorsque certains sont en panne. Les interruptions pour les mises à jour de maintenance ou d’autres événements planifiés peuvent être minimisées.
  • Réduction du délai de reprise : réduisez l’objectif de temps de reprise de plusieurs heures à quelques minutes. Avec la réplication de disque, les solutions traditionnelles de reprise après sinistre récupèrent sur le site de secours en redémarrant les systèmes ou les applications. Cela prend normalement des heures et les services informatiques sont indisponibles pendant cette période. Avec Lifeline, qui fonctionne dans le cadre de la solution de disponibilité continue de GDPS, le workload peut être basculé sur le site de secours en quelques minutes.
En savoir plus
Est-ce que Lifeline n’est disponible que dans le cadre de la solution GDPS Continuous Availability ?

Non. Bien que la solution Lifeline soit généralement utilisée comme partie intégrante de la solution GDPS Continuous Availability, elle peut également être déployée en dehors de cette solution.
Si votre entreprise dispose de ses propres capacités d’automatisation, vous pouvez utiliser Lifeline, ainsi qu’un logiciel de réplication des données, pour assurer la synchronisation des données sur les deux sites.
Dans d’autres cas, si votre entreprise dispose d’applications de workload qui ne sont pas compatibles avec sysplex, vous ne pouvez pas utiliser la solution GDPS Continuous Availability. En utilisant Lifeline, ainsi qu’un produit de réplication des données pour assurer la synchronisation des données sur les deux sites, vous obtiendrez une récupération de type "sysplex" pour ces types de workloads.

En savoir plus
Comment Lifeline réduit-elle la fenêtre de maintenance pour les pannes planifiées ?

Lifeline permet d’effectuer un basculement en douceur des applications et de leurs sources de données, appelées workloads par Lifeline, lors d’interruptions planifiées. En utilisant de simples commandes Lifeline, la migration des workloads d’un site à l’autre peut être facilement effectuée, minimisant ainsi les temps d’arrêt pour les événements planifiés tels que les activités de maintenance programmées.

En savoir plus
Comment Lifeline offre-t-elle une disponibilité quasi continue pour les workloads critiques lors d’interruptions imprévues ?

Lifeline augmente la disponibilité car les nouvelles connexions et les nouveaux messages peuvent être acheminés en dehors des applications et des systèmes workloads défaillants. Lifeline réduit les temps de réponse en acheminant les connexions et les messages vers des applications et des systèmes workload ayant une capacité de travail supplémentaire et réduit le temps de reprise de plusieurs heures à quelques minutes.

Les workloads fonctionnant sur un site doivent-ils tous être initialement configurés pour Lifeline ?

Non. L’un des nombreux avantages de Lifeline est qu’il ne s’agit pas d’une solution « tout ou rien », comme le sont généralement les solutions de reprise après sinistre. Seuls les workloads les plus critiques sont configurés sur Lifeline pour assurer une disponibilité continue, tandis que tous les autres workloads, y compris les lots, sont récupérés à l’aide des procédures de reprise après sinistre existantes. De plus, il est possible d’ajouter des workloads supplémentaires à Lifeline à tout moment.

Quelles sont les caractéristiques d’un workload au regard de Lifeline ?

Les caractéristiques d’un workload dépendent de son type. Dans le cas des workloads basés sur TCP, il s’agit des adresses IP et des numéros de port des applications TCP. Pour les workloads basés sur SNA, il s’agit des noms des applications SNA. Pour les workloads basés sur IBM, il s’agit des files d’attente du cluster MQ et des gestionnaires de files d’attente MQ où sont envoyés les messages IBM MQ pour les workloads. Pour les workloads basés sur Db2 DRDA, il s’agit des adresses IP et des numéros de port des alias Db2 et des sous-systèmes Db2. Pour les workloads Linux on Z, il s’agit des invités Linux on Z fonctionnant sur zVM.

Comment la solution Lifeline contrôle-t-elle le routage des connexions vers les applications de workload ?

Lifeline s’appuie sur un équilibreur de charge qui prend en charge le protocole Server/Application State Protocol (SASP), décrit dans le document RFC 4678. Ce protocole permet à Lifeline de transmettre périodiquement des recommandations de routage à un équilibreur de charge compatible SASP, en lui indiquant comment acheminer les connexions de workloads dans un ensemble d’applications de workloads qui peuvent s’étendre sur les deux sites. Le F5 Big-IP Switch Local Traffic Manager est l’équilibreur de charge recommandé pour Lifeline.

Comment Lifeline contrôle-t-elle le routage des messages MQ pour les workloads ?

Lifeline communique avec les gestionnaires de files d’attente MQ en charge des files d’attente utilisées par les workloads et indique au cluster IBM MQ les gestionnaires de file d’attente MQ qui sont aptes à recevoir les messages IBM MQ. En cas de défaillance d’un site, Lifeline veille également à ce que les messages MQ bloqués soient transférés vers les gestionnaires IBM MQ du site secondaire lors d’un basculement de workload.

Étapes suivantes

Découvrez comment Multi-site Workload Lifeline permet de réduire le temps de récupération des workloads critiques en cas de panne. Programmez un entretien gratuit de 30 minutes avec un représentant IBM Z.  

Autres moyens d’information Documentation Support IBM Redbooks Support et services Financement global Tarification flexible Éducation et formation Communauté Communauté de développeurs Partenaires commerciaux Ressources