Accueil Case Studies National Center for High-performance Computing (NCHC) Accélérer la recherche et l’innovation
Comment le NCHC utilise l’AIOps pour améliorer ses services de réseau public et prévenir les pannes
Dans la salle de conférence, l’ingénieur en chef présente à un conseil de scientifiques une nouvelle approche révolutionnaire pour développer l’intelligence artificielle et les réseaux neuronaux. Un téléviseur mural montre les réussites de l’entreprise.

Dans les situations de crise, la recherche doit aller vite. Pendant la pandémie de COVID-19, la vie de millions de personnes était en jeu.

A Taïwan, où les organisations étatiques sont parvenues à limiter considérablement la propagation de l’épidémie et les cas de décès, le National Center for High Performance Computing (NCHC) a permis – en fournissant un accès aux superordinateurs et à l’analytique, mais aussi en facilitant le partage de données sur le réseau national – d’accélérer la recherche et l’innovation.

Bien que le NCHC soutienne la recherche dans toutes les disciplines, l’urgence de la pandémie l’a incité à lancer des programmes successifs « Tech v Virus », qui appellent les universités, les organisations de recherche, les entreprises et les startups à trouver de nouvelles façons de lutter contre la propagation du SARS-CoV-2. Une avancée majeure à ce jour est un stéthoscope qui, en permettant de visualiser la respiration d’un patient, aide les médecins et les infirmiers à réduire les contacts trop rapprochés avec les patients potentiellement infectés, ce qui limite le risque de transmission. Une autre est une carte de l’évolution du gène de la COVID-19, qui permet de prévoir les voies de propagation.

Pour soutenir des efforts comme ceux-ci et des centaines d’autres dans tous les domaines, le NCHC veut s’assurer que la recherche avance aussi vite que possible. C’est pourquoi il continue de développer Taiwania, une série de superordinateurs qui comprend l’un des 50 ordinateurs les plus puissants au monde. C’est pourquoi il fournit des services d’IA, notamment des outils basés sur IBM Cloud Pak for Data. Et enfin, c’est pourquoi le NCHC a récemment collaboré avec IBM Garage pour implanter la solution IBM Cloud Pak for Watson AIOps, le but étant d’appliquer l’automatisation basée sur l’IA pour maximiser la résilience et les performances.

Temps moyen de détection réduit

 

Réduction de 55 % du temps moyen de détection des problèmes qui ont un impact sur les services

Caractère prévisionnel

 

Identifie les pannes potentielles 25 heures plus tôt qu’auparavant

En injectant des données structurées et non structurées au composant AI Manager de la solution, le NCHC et l’équipe d’IBM Garage ont pu entraîner les modèles d’IA à gérer de manière automatique et proactive les problèmes et les incidents.
Réduire la complexité des opérations informatiques

Taïwan dispose de plusieurs grands réseaux informatiques publics qui sillonnent le pays et qui permettent aux chercheurs de collaborer et de partager des informations. Certains de ces réseaux sont dédiés au monde universitaire, d’autres aux organisations gouvernementales et d’autres encore à certaines industries. Ces derniers temps, et notamment en réponse à la pandémie de COVID-19, les initiatives de recherche ont nécessité des efforts interdisciplinaires et une collaboration inter-réseaux. Le partage rapide d’informations entre différents réseaux publics est fondamental.

Le NCHC a donc lancé une nouvelle initiative : construire une infrastructure réseau centralisée. Mais l’interconnexion des réseaux présentait de nombreux défis. Les sources et les formats des journaux de données, tout comme les outils de surveillance, étaient non compatibles d’un réseau à l’autre. La complexité gênait l’évaluation et la priorisation des alertes et empêchait le NCHC de détecter les problèmes importants et d’éviter les pannes. Et en cas de panne, tout partage de données et toute collaboration entre les réseaux devenait impossible.

Pour atteindre l’objectif de l’infrastructure réseau centralisée, à savoir accélérer la collaboration entre chercheurs sur le territoire national, le NCHC avait besoin d’un moyen de réduire la complexité de la gestion des opérations informatiques. Pour cela, il a choisi d’adopter l’AIOps.

Maintenance prédictive avec l’AIOps

Alors qu’il recherchait une solution, le NCHC a travaillé avec IBM Garage pour exécuter une preuve de concept (POC) basée sur IBM Cloud Pak for Watson AIOps.

L’objectif de la preuve de concept était d’évaluer l’impact réel de la solution recherchée. Le NCHC a fourni des données d’exploitation et des données de journal réseau issues de scénarios réels, par exemple lorsque certains équipements tombent en panne et provoquent des interruptions de service.

Les équipes du NCHC et d’IBM ont ensuite utilisé IBM Cloud Pak for Watson AIOps comme intégrateur central de la gamme d’outils informatiques opérationnels de l’infrastructure réseau, produisant ainsi une vue globale de l’infrastructure. Et en injectant des données structurées et non structurées au composant AI Manager de la solution, le NCHC et l’équipe d’IBM Garage ont pu entraîner les modèles d’IA à gérer de manière automatique et proactive les problèmes et les incidents.

Les résultats ont été remarquables. Les équipes ont réduit de 55 % le temps moyen de détection des problèmes susceptibles d’affecter le service.

La preuve de concept ayant été une réussite, le NCHC et l’équipe d’IBM Customer Success Manager ont déployé IBM Cloud Pak for Watson AIOps dans l’environnement de production de l’infrastructure. Le NCHC utilise désormais les composants suivants d’IBM Cloud Pak for Watson AIOps :

  • AI Manager : pour ingérer les données structurées et non structurées et entraîner les modèles d’IA à la gestion proactive des problèmes et des incidents. Toutes les alertes générées par AI Manager sont publiées sous forme de story dans une interface ChatOps que le personnel du NCHC utilise comme source unique d’information pour surveiller l’infrastructure.
  • Event Manager : pour importer tous les journaux des appareils du réseau à l’aide d’un programme de traitement par lots prédéfini et pour réduire le bruit de fond du réseau avec le regroupement des événements (ce qui doit également réduire de manière considérable les coûts opérationnels).
  • Metric Manager : pour ingérer toutes les données des indicateurs des appareils du réseau (processeur, mémoire et utilisation du disque) et fournir une vue globale du statut des appareils.

 

 

Favoriser la découverte et l’innovation continues

La réduction du temps moyen de détection permet au NCHC de détecter les problèmes potentiels 25 heures plus tôt qu’auparavant, ce qui l’aide à anticiper et à résoudre les pannes avant qu’elles ne se produisent.

Jusqu’à présent, ces résultats impressionnants se sont produits en réponse à des problèmes courants et connus. Le NCHC sait que des problèmes inédits et non anticipés peuvent et vont se produire. Ils mettront la solution à l’épreuve, mais l’organisation attend des résultats similaires. Avec l’adoption de l’AIOps, le NCHC espère maintenir les canaux d’information ouverts, grâce à quoi les projets de recherche sur le territoire de Taïwan devraient disposer des données essentielles dont ils ont besoin pour l’innovation et la découverte.

Logo NCHC
A propos du National Center for High Performance Computing (NCHC)

Dans le but de promouvoir les découvertes scientifiques et l’innovation technologique, le NCHC de Taïwan External link(lien externe à ibm.com) fournit aux agences gouvernementales, aux établissements d’enseignement supérieur et aux différentes industries du pays des services de superinformatique, des réseaux de haute qualité, un stockage à haut rendement, des analyses de big data et des simulations d’ingénierie scientifique. Le siège du NCHC est situé dans la ville de Hsinchu.

Passez à l’étape suivante

Pour en savoir plus sur les solutions IBM présentées dans cette étude de cas, veuillez contacter votre interlocuteur IBM habituel ou votre partenaire commercial IBM.

Voir plus d'études de cas Contacter IBM TIME dotCOM

Construire le moteur d’une économie en plein essor

 

Lire l’étude de cas
T-Mobile

Automatisation basée sur l'IA dans le plus grand réseau 5G des États-Unis

Lire l’étude de cas
Electrolux

Un innovateur légendaire met l’AIOps au service de son entreprise mondiale

Lire l’étude de cas
Mentions légales

© Copyright IBM Corporation 2022. IBM Corporation, New Orchard Road, Armonk, NY 10504

Produit aux Etats-Unis, mars 2022.

IBM, le logo IBM, ibm.com, IBM Cloud Pak et IBM Garage sont des marques commerciales d’International Business Machines Corp., déposées dans de nombreux pays. Les autres noms de produits et de services peuvent être des marques d’IBM ou d’autres sociétés. Une liste actualisée des marques de commerce IBM est disponible sur le Web à l’adresse ibm.com/legal/copyright.

Les informations contenues dans le présent document étaient à jour à la date de sa publication initiale. Elles peuvent être modifiées sans préavis par IBM. Les offres mentionnées dans le présent document ne sont pas toutes disponibles dans tous les pays où la société IBM est présente.

Les données de performance et les exemples de clients cités sont présentés à titre informatif uniquement. Les résultats des performances peuvent varier en fonction des configurations et des conditions de fonctionnement. LES INFORMATIONS CONTENUES DANS LE PRÉSENT DOCUMENT SONT FOURNIES « EN L’ÉTAT », SANS AUCUNE GARANTIE EXPLICITE OU IMPLICITE, NOTAMMENT SANS AUCUNE GARANTIE DE QUALITÉ MARCHANDE, D’ADÉQUATION À UN USAGE PARTICULIER ET AUCUNE GARANTIE OU CONDITION D’ABSENCE DE CONTREFAÇON. Les produits IBM sont garantis conformément aux dispositions des contrats qui régissent leur utilisation.