사례 연구 국립 고성능 컴퓨팅 센터(NCHC) 연구 및 혁신 가속화
NCHC가 AIOps를 사용하여 공용 네트워크 서비스를 개선하고 운영 중단을 사전에 방지하는 방법
수석 엔지니어가 회의실에서 인공 지능과 신경망 개발을 위한 새로운 혁신적 접근법을 과학자 이사회에 발표합니다. 벽면의 TV가 성과를 보여 줍니다.

연구 속도는 중요합니다. 코로나19 팬데믹 기간 동안 수백만 명의 삶과 죽음이 갈렸습니다.

팬데믹에 대응하여 전염병의 발병과 사망을 매우 효과적으로 제한해 낸 대만에서 국립 고성능 컴퓨팅 센터(NCHC)는 슈퍼컴퓨터와 분석에 대한 액세스를 제공하고 데이터 공유 및 협업을 위한 전국적인 네트워크를 촉진하여 전국적으로 연구와 혁신에 속도를 내는 데 도움을 주고 있습니다.

NCHC는 모든 분야의 연구를 지원하고 있지만, 팬데믹에 따른 긴급한 상황의 영향으로 대학, 연구 조직, 기업 및 스타트업이 SARS-CoV-2 코로나바이러스의 확산에 맞서 싸울 새로운 방법을 강구하도록 촉구하는 'Tech v Virus' 프로그램을 연이어 시작하게 되었습니다. 지금까지 나온 결과 중 세간의 이목을 끄는 돌파구는 환자의 호흡을 시각화하는 청진기로, 이는 의사와 간호사가 감염 가능성이 있는 환자와의 긴밀한 접촉을 줄여 전파 위험을 줄이는 데 도움이 됩니다. 또 다른 하나는 COVID-19 유전자 진화 지도로, 확산 경로를 예측하는 데 도움이 됩니다.

이러한 노력 뿐만 아니라 다른 모든 분야에서 펼쳐지는 수많은 노력을 지원하기 위해 NCHC는 연구가 가능한 한 빨리 진행되기를 바랍니다. 이것이 바로 세계에서 가장 강력한 컴퓨터 50대 중 하나를 포함하는 대만 슈퍼컴퓨터 시리즈를 계속해서 발전시키는 이유입니다. 이것이 바로 IBM Cloud Pak for Data 기반 도구와 같은 AI 서비스를 제공하는 이유입니다. 또한 이것이 바로 NCHC가 최근 IBM Garage™와 협력하여 AI 기반 자동화를 적용한 IBM Cloud Pak for Watson AIOps 솔루션을 구현해 복원력과 성능을 극대화하는 이유입니다.

MTTD 감소

 

서비스에 영향을 미치는 문제의 평균 탐지 시간 (MTTD) 을 55% 단축

예측 가능성

 

이전보다 25시간 더 빠르게 잠재적 중단을 식별

NCHC와 IBM Garage 팀은 정형 비정형 데이터를 솔루션의 AI Manager 구성 요소에 입력하여 AI 모델을 학습시켜 문제와 인시던트를 자동으로 또한 사전 예방적으로 관리 할 수 있었습니다.
IT 운영의 복잡성 해소

대만에는 전국에 걸쳐 연구자들이 정보를 공유하고 협력할 수 있는 여러 주요 퍼블릭 컴퓨팅 네트워크가 있습니다. 일부 네트워크는 학계용으로 특화되어 있고 일부는 정부용, 일부는 산업용으로 특화되어 있습니다. 그러나 특히 코로나19 팬데믹에 대응하기 위한 연구 이니셔티브에서 분야 간 노력과 네트워크 간 협업이 점점 더 많이 요구되고 있습니다. 퍼블릭 네트워크 간의 빠른 정보 공유는 매우 중요합니다.

그래서 NCHC는 중앙 네트워크 교환을 구축하는 새로운 이니셔티브를 시작했습니다. 그러나 네트워크를 하나로 통합하는 것은 새로운 과제를 안겨 주었습니다. 서로 다른 네트워크에는 서로 다른 모니터링 도구와 데이터 로그 소스 및 형식의 배열이 갖춰져 있었습니다. 이러한 복잡성으로 인해 관리가 복잡해져 NCHC는 경보를 신속하게 필터링하여 중요한 문제를 감지하고 운영 중단을 방지하는 일을 수행하지 못했습니다. 운영 중단은 결국 네트워크 전반에서 데이터 공유와 협업에 차질을 일으키게 됩니다.

전국적인 연구 협력을 가속화하는 중앙 교환의 목적을 달성하기 위해 NCHC는 IT 운영 관리의 복잡성을 해소할 수 있는 방법이 필요했습니다. 그래서 AIOps로 전환했습니다.

AIOps를 통한 예측적 유지 관리

솔루션 모색의 일환으로 NCHC는 IBM Garage와 협력하여 IBM Cloud Pak for Watson AIOps 소프트웨어를 기반으로 개념 증명(POC)을 실행했습니다.

POC의 목표는 잠재적 솔루션의 실제 영향력을 측정하는 것이었습니다. 일부 네트워킹 장비가 고장나서 운영 중단이 발생하는 것과 같은 실제 시나리오의 운영 데이터와 네트워킹 로그 데이터를 제공했습니다.

그런 다음 NCHC와 IBM 팀은 IBM Cloud Pak for Watson AIOps를 네트워크 거래소의 다양한 IT 운영 도구 배열의 중앙 통합자로 사용하여 모든 인프라를 전체적으로 파악할 수 있었습니다. 또한 NCHC와 IBM Garage 팀은 정형 비정형 데이터를 솔루션의 AI Manager 구성 요소에 입력하여 AI 모델을 학습시켜 문제와 인시던트를 자동으로 또한 사전 예방적으로 관리 할 수 있었습니다.

그 결과는 훌륭했습니다. 팀은 서비스에 영향을 미칠 수 있는 문제를 감지하는 데 걸리는 평균 시간(MTTD)을 55% 단축했습니다.

POC의 성공을 기반으로 NCHC와 IBM Customer Success Manager 팀은 IBM Cloud Pak for Watson AIOps를 교환 센터 프로덕션 환경에 배치했습니다. NCHC는 현재 IBM Cloud Pak for Watson AIOps의 다음 구성 요소를 사용하고 있습니다.

  • AI 관리자: 정형 및 비정형 데이터를 수집하고 AI 모델을 학습시켜 문제와 인시던트를 사전에 관리합니다. AI Manager에서 생성된 모든 경고는 NCHC 직원이 교환 센터 모니터링을 위한 신뢰할 수 있는 단일 소스로 사용하는 ChatOps 인터페이스에 사례로 게시됩니다.
  • 이벤트 관리자: 사전 정의된 배치 프로그램을 통해 모든 네트워크 장치 로그를 가져오고 이벤트 그룹화를 통해 네트워크 노이즈를 줄여 운영 비용을 크게 절감합니다.
  • 메트릭 관리자: CPU, 메모리, 디스크 사용량 등 모든 네트워크 디바이스 메트릭 데이터를 수집하고 디바이스 상태에 대한 전체적인 보기를 제공합니다.

 

 

지속적인 발견과 혁신 추진

MTTD 단축은 NCHC가 이전보다 25시간 더 빨리 잠재적 운영 중단을 감지할 수 있다는 것을 의미하며, 운영 중단이 발생하기 전에 미리 파악하고 해결할 수 있도록 도와줍니다.

지금까지 나온 이러한 인상적인 결과는 일반적으로 알려진 문제에 대한 대응으로 나온 것입니다. NCHC는 예상치 못한 고유한 문제가 발생하여 솔루션에 대한 새로운 테스트가 필요하다는 것을 알고 있지만, 비슷한 결과가 나올 것으로 예상합니다. 궁극적으로 NCHC는 AIOps를 도입함으로써 정보 채널을 개방적으로 유지하여 대만 전역의 연구 프로젝트가 발견과 혁신을 향해 계속 전진하기 위해 필요한 중요한 데이터를 확보할 수 있을 것으로 기대합니다.

NCHC 로고
국립 고성능 컴퓨팅 센터(NCHC, National Center for High-performance Computing) 소개

과학적 발견과 기술 혁신을 촉진한다는 사명을 가진 대만의 NCHCExternal Link(ibm.com 외부 링크)는 국가 정부 기관, 고등 교육 기관 및 산업에 슈퍼컴퓨팅 서비스, 고품질 네트워킹, 고효율 스토리지, 빅 데이터 분석 및 과학 공학 시뮬레이션을 제공하며 신주시에 본사를 두고 있습니다.

다음 단계 안내

이 사례에 소개된 IBM 솔루션에 대해 자세히 알아보려면 IBM 담당자 또는 IBM 비즈니스 파트너에게 문의하세요.

더 많은 사례 연구 보기 IBM에 문의하기 TIME dotCOM

급성장하는 경제의 엔진 구축

 

사례 연구 읽기
T-Mobile

미국 최대 5G 네트워크의 AI 기반 자동화

사례 연구 읽기
Electrolux

세계적인 혁신 기업, AIOps를 도입하다

사례 연구 읽기
법률

© Copyright IBM Corporation 2022. IBM Corporation New Orchard Road, Armonk, NY 10504

2022년 3월 미국에서 제작.

IBM, IBM 로고, ibm.com IBM Cloud Pak 및 IBM Garage는 전 세계 여러 국가에 등록된 International Business Machines Corp.의 상표입니다. 기타 제품 및 서비스 이름은 IBM 또는 다른 회사의 상표일 수 있습니다. IBM 상표의 최신 목록은 ibm.com/legal/copyright-trademark에서 확인할 수 있습니다.

이 문서는 최초 발행일 기준 최신 문서로, IBM은 언제든지 해당 내용을 변경할 수 있습니다. IBM이 현재 영업 중인 모든 국가에서 모든 제품이 제공되는 것은 아닙니다.

명시된 성능 데이터 및 고객 사례는 오직 정보 목적으로 제공됩니다. 실제 성능 결과는 특정 구성 및 작동 조건에 따라 다를 수 있습니다. 본 문서의 정보는 상품성, 특정 목적에의 적합성, 비침해성 보증 또는 조건을 포함하여 명시적 또는 묵시적 보증 없이 '있는 그대로' 제공됩니다. 제품 제공 시의 계약 조건에 따라 해당 IBM 제품을 보증합니다.