Inicio Casos de éxito Centro Nacional de Computación de Alto Rendimiento (NCHC) Acelerar la investigación y la innovación
Cómo NCHC utiliza AIOps para mejorar los servicios de red pública y prevenir proactivamente interrupciones
En la sala de conferencias, el jefe de ingenieros presenta a una junta directiva de científicos un nuevo enfoque revolucionario para el desarrollo de la inteligencia artificial y las redes neuronales. Wall TV muestra sus logros.

La velocidad de la investigación importa. Durante la pandemia de COVID-19, ha sido la diferencia entre la vida y la muerte para millones.

En Taiwán, donde la respuesta a la pandemia ha sido excepcionalmente eficaz para limitar los brotes y las muertes, el Centro Nacional de Computación de Alto Rendimiento (NCHC) ayuda a acelerar la investigación y la innovación en todo el país proporcionando acceso a superordenadores y análisis y facilitando redes nacionales para compartir datos y colaborar.

Aunque NCHC apoya la investigación en todas las disciplinas, la urgencia de la pandemia la inspiró para lanzar programas sucesivos "Tech v Virus", que llaman a universidades, organizaciones de investigación, empresas y startups para encontrar nuevas formas de luchar contra la propagación del coronavirus SARS-CoV-2. Un avance de alto perfil hasta ahora es un estetoscopio que visualiza la respiración de un paciente, lo que ayuda a los médicos y enfermeras a reducir el contacto cercano con pacientes potencialmente infectados, reduciendo así el riesgo de transmisión. Otro es un mapa de la evolución del gen de la COVID-19, que ayuda a predecir las rutas de propagación.

Para apoyar esfuerzos como estos, y cientos de otros en todos los campos, el NCHC quiere asegurarse de que la investigación avance lo más rápido posible. Por eso sigue evolucionando su serie Taiwania de superordenadores, que incluye uno de los 50 ordenadores más potentes del mundo. Por eso proporciona servicios de IA, incluidas herramientas basadas en IBM Cloud Pak for Data. Por eso, NCHC trabajó recientemente con IBM Garage para implementar la solución IBM Cloud Pak for watsonx AIOps, aplicando automatización basada en IA para maximizar la resiliencia y el rendimiento.

MTTD reducido

 

Reducción del tiempo medio de detección (MTTD) en un 55 % para problemas que afectan al servicio

Previsibilidad

 

Identifica posibles interrupciones 25 horas antes que antes

Al introducir datos estructurados y no estructurados en el componente AI Manager de la solución, NCHC y el equipo de IBM Garage pudieron entrenar modelos de IA para gestionar problemas e incidentes de forma automática y proactiva.
Reducir la complejidad de las operaciones de TI

Taiwán tiene varias redes informáticas públicas importantes que atraviesan el país y permiten a los investigadores compartir información y colaborar. Algunas de las redes están especializadas para el mundo académico, otras para el gobierno y otras para la industria. Pero cada vez más, especialmente en respuesta a la pandemia de COVID-19, las iniciativas de investigación han exigido esfuerzos interdisciplinarios y colaboración entre redes. El intercambio rápido de información entre las redes públicas es crucial.

Así que NCHC comenzó una nueva iniciativa: construir un intercambio de red central. Pero reunir las redes presentó una nueva capa de desafíos. Las diferentes redes estaban equipadas con una gama dispar de herramientas de moniotización y fuentes y formatos de registro de datos. La complejidad complicó la gestión, lo que impidió que NCHC filtrara rápidamente las alarmas para detectar problemas importantes y evitar interrupciones. Las interrupciones, a su vez, impedirían el intercambio de datos y la colaboración entre las redes.

Para cumplir con el propósito del intercambio central, acelerar la colaboración de investigación a nivel nacional, NCHC necesitaba una forma de reducir la complejidad de la gestión de operaciones de TI. Volvió a AIOps.

Mantenimiento predictivo con AIOps

Como parte de su búsqueda de una solución, NCHC trabajó con IBM Garage para ejecutar una prueba de concepto (POC) basada en el software de IBM Cloud Pak for watsonx AIOps.

El objetivo del POC era medir el impacto real de la solución potencial. El NCHC proporcionó datos operativos y de registro de redes de situaciones reales, por ejemplo, cuando un equipo de red se avería y provoca cortes.

A continuación, los equipos de NCHC e IBM utilizaron IBM Cloud Pak for watsonx AIOps como integrador central de la diversa gama de herramientas de operaciones de TI del intercambio de redes, lo que produjo una visión holística de toda la infraestructura. Y al introducir datos estructurados y no estructurados en el componente AI Manager de la solución, NCHC y el equipo de IBM Garage pudieron entrenar modelos de IA para gestionar problemas e incidencias de forma automática y proactiva.

Los resultados fueron excelentes. Los equipos lograron un tiempo medio un 55 % más corto para detectar problemas (MTTD) que afectarían al servicio.

Basándose en el éxito de la POC, NCHC y el equipo de IBM Customer Success Manager implementaron IBM Cloud Pak for watsonx AIOps en el entorno de producción del centro de intercambio. NCHC utiliza ahora los siguientes componentes de IBM Cloud Pak for watsonx AIOps:

  • AI Manager: para procesar datos estructurados y no estructurados y entrenar modelos de IA para gestionar de forma proactiva los problemas e incidentes. Todas las alertas generadas por AI Manager se publican como una historia en una interfaz de ChatOps que el personal de NCHC utiliza como única fuente fiable de información para monitorizar el centro de intercambio.
  • Administrador de eventos: para importar todos los registros de dispositivos de red a través de un programa por lotes predefinido y reducir el ruido de la red con la agrupación de eventos, lo que reducirá significativamente los costos operativos.
  • Administrador de indicadores: para procesar todos los datos métricos de dispositivos de red, como CPU, memoria y uso del disco, y proporcionar una vista holística de los estados de los dispositivos.

 

 

Impulsar el descubrimiento y la innovación continuos

La reducción de MTTD significa que NCHC puede detectar posibles cortes de suministro 25 horas antes de lo que podía antes, lo que ayuda a NCHC a ver y resolver los cortes de suministro antes de que se produzcan.

Hasta ahora, estos impresionantes resultados han surgido en respuesta a problemas comunes y conocidos. NCHC sabe que surgirán problemas únicos e inesperados y proporcionará nuevas pruebas para la solución, pero la organización espera resultados similares. En última instancia, NCHC espera que su adopción de AIOps ayude a mantener abiertos los canales de información para que los proyectos de investigación de Taiwán tengan los datos críticos que necesitan para seguir avanzando hacia el descubrimiento y la innovación.

Logotipo de NCHC
Acerca del Centro Nacional de Computación de Alto Rendimiento (NCHC)

Con la misión de promover el descubrimiento científico y la innovación tecnológica, el NCHCEnlace externo de Taiwán (enlace externo a ibm.com) proporciona a las agencias gubernamentales del país, instituciones de educación superior e industrias con servicios de supercomputación, redes de alta calidad, almacenamiento, grandes análisis y simulaciones de ingeniería.

De el siguiente paso

Para obtener más información sobre las soluciones de IBM presentadas en este caso práctico, póngase en contacto con su representante o socio de IBM.

Ver más Casos de éxito Póngase en contacto con IBM TIME dotCOM

Construir el motor de una economía en alza

 

Lea el Caso de éxito
T-Mobile

Automatización basada en IA en la red 5G más grande de EE. UU.

Lea el Caso de éxito
Electrolux

Un innovador legendario lleva AIOps a su empresa internacional

Lea el Caso de éxito
Legal

© Copyright IBM Corporation 2022 IBM Corporation, New Orchard Road, Armonk, NY 10504

Producido en los Estados Unidos de América, marzo de 2018.

IBM, el logotipo de IBM, ibm.com, IBM Cloud Pak e IBM Garage son marcas comerciales de International Business Machines Corp., registradas en muchas jurisdicciones del mundo. Los demás nombres de productos y servicios pueden ser marcas registradas de IBM u otras empresas. Una lista actualizada de las marcas comerciales de IBM está disponible en la web en ibm.com/legal/copyright-trademark.

La información contenida en este documento es la vigente en la fecha de su publicación original y está sujeta a cambios por parte de IBM. No todas las ofertas mencionadas en este documento están disponibles en todos los países en los que IBM está presente.

Los datos de rendimiento y ejemplos de clientes mencionados se presentan únicamente con fines ilustrativos. Los datos reales de rendimiento pueden variar en función de las configuraciones y condiciones de funcionamiento específicas. LA INFORMACIÓN DE ESTE DOCUMENTO SE OFRECE "TAL CUAL ESTÁ" SIN NINGUNA GARANTÍA, NI EXPLÍCITA NI IMPLÍCITA, INCLUIDAS, ENTRE OTRAS, LAS GARANTÍAS DE COMERCIALIZACIÓN, ADECUACIÓN A UN FIN CONCRETO Y CUALQUIER GARANTÍA O CONDICIÓN DE INEXISTENCIA DE INFRACCIÓN. Los productos de IBM están sujetos a garantía según los términos y condiciones de los acuerdos bajo los que se proporcionan.