IBM クラウド・ビジョン

ハイブリッドクラウド環境のIT運用データをAIが分析し、障害検知/対応を支援する「IBM Cloud Pak for Watson AIOps」

記事をシェアする:

今日の企業システム環境は、オンプレミスのシステムとベンダー各社のクラウド・サービスを組み合わせたハイブリッドクラウド化が進み、「システム環境全体の把握や可視化が極めて難しい」「運用管理の複雑性とコストが増大している」「障害対応と解決に時間がかかる」といった課題が生じています。これらの課題は、従来のように人手に頼った運用で解決できるものではありません。ハイブリッドクラウドが企業システム環境の標準となるこれからの時代は、システム運用管理の仕組みも、それに最適なものに変えていく必要があります。IBMは、システム運用管理の領域にAIを積極的に取り込み、強力な分析/推論機能によるシステム環境の可視化や障害の予兆検知、オペレーションの自動化などのAIOps(AIを活用したシステム運用管理)を推進しています。本記事では、IBMのAIOpsの核となるソリューション「IBM Cloud Pak for Watson AIOps」の特徴と主な機能をご紹介します。

1.「情報洪水」「ツールのサイロ化」がハイブリッドクラウド運用管理の課題
2.さまざまなIT運用データを利用して障害検知/対応を高度化する「IBM Cloud Pak for Watson AIOps」
3.データを自動的に整理/分析し、問題発生時は過去の類似事象に基づく“ネクスト・ベスト・アクション”を提示

岩品 友徳

岩品 友徳
日本アイ・ビー・エム
テクノロジー事業本部
データ・AI・オートメーション事業部
クラウド・テクニカル・スペシャリスト

大手金融機関様へのミッションクリティカル・システムのデリバリーなどを経て、2012年よりWebSphere製品のテクニカル・セールスとして活動。OpenShiftやKubernetes、基盤自動化の取り組みを通して、お客様システムのモダナイゼーションをご支援中。

「情報洪水」「ツールのサイロ化」がハイブリッドクラウド運用管理の課題

今日、多くのお客様がオンプレミスとベンダー各社のクラウド・サービスを組み合わせたハイブリッドクラウド環境を利用しています。そうしたシステム環境の運用管理では、クラウド・サービスの管理ツールやクラウドインフラの管理ツール、仮想基盤の管理ツール、ログ管理ツール、セキュリティー・ツールなど、さまざまなツールを利用されることでしょう。何かトラブルが発生した際には、それらのツールを組み合わせて利用しながら適切に問題判別を行っていかなければなりません。

今日、多くの企業では障害対応に6つ以上のツールを使っているそうです。ハイブリッドクラウド環境で稼働するアプリケーションの挙動を把握するためには従来型のツールも利用する必要があるため、実際にはもっと多くのツールを使っているかもしれません。その結果、「さまざまなツールがアラートやイベントを通知してくるため、大量のイベント/通知に溺れてしまう」といった悩みがよく聞かれます。「さまざまなツールを導入してIT運用データを取得できるようにしたものの、それぞれのツールがサイロ化しており、迅速な問題解決につながっていない」という組織も多いようです。

複雑化するIT環境

さまざまなIT運用データを利用して障害検知/対応を高度化する「IBM Cloud Pak for Watson AIOps」

IBM Cloud Pak for Watson AIOpsは、ハイブリッドクラウド環境の運用管理で使われる多種多様なツールが生成するIT運用データに対してAI/機械学習を適用することでデータ活用を促進し、運用ツールのサイロ化を克服するソリューションです。

従来型のツールでは、それぞれに閉じた範囲でしかAI/機械学習を適用できません。それに対して、Cloud Pak for Watson AIOpsはさまざまなツールのログや障害対応情報などの非構造化データ、モニタリングやイベント通知などの構造化データ、トポロジー情報などシステム環境全体に関するデータに対してAI/機械学習を適用し、横串で問題状況を明らかにします。

IT運用データのサイロ化を解消

Cloud Pak for Watson AIOpsが連携可能なデータは多岐にわたります。ログ管理ツールとしてはlogDNAやHumio、Elasticなどに対応。モニタリング・ツールはAppDynamicsやDynatraceなどのアプリケーション・パフォーマンス・モニタリング(APM)製品をサポートしているほか、複雑なクラウドネイティブ環境の可視化を実現する「IBM Observability by Instana APM」との連携も予定されています。

【関連記事】
『複雑化するクラウドネイティブ環境の“可観測性(Observability)”をInstanaで確保する』

また、イベント・アラートについてはAppDynamicsやDynatrace、Datadog、Prometheusなど、さまざまな製品との連携が可能です。トポロジー情報についてはAmazon Web Services、Microsoft Azure、Google Cloud Platformといったクラウド・サービスに加えて、VMwareやRed Hat OpenStackなどの仮想化/コンテナ環境との連携にも対応。もちろん、IBMのシステム管理ツールであるIBM Netcool Network Management やIBM Agile Lifecycle Manager、IBM Cloud Pak for Multicloud Managementとの連携もサポートしています。

組織の自動化推進を支援

データを自動的に整理/分析し、問題発生時は過去の類似事象に基づく“ネクスト・ベスト・アクション”を提示

Cloud Pak for Watson AIOpsは、これらのツールが保持する各種のIT運用データを集めて解析し、異常や課題を検知するとインシデントとして通知します。自然言語で出力されたログ情報も解析し、通常パターンとは異なるログ出力を検知した場合は異常を通知します。

インシデントを通知する際には、各イベント情報に含まれるノイズ・アラートを減らすために、イベントの関連性分析や季節性分析、スコープ分析などを行い、関連するイベントをグルーピングして絞り込みます。また、与えられたトポロジー情報を基に、問題のコンテキストや影響範囲を明らかにします。

これによってインシデントの内容を明確化したら、過去のチケット対応情報などに基づき、問題に対する“ネクスト・ベスト・アクション(次善策)”を示します。その際、該当するものがあれば、自動化されたランブック(作業対応内容)も合わせて提示します。

さらに、問題を提示する際には、チーム内で問題の内容や影響範囲、対応状況や対応過程をスムーズに共有できるよう、SlackやMicrosoft Teamsなどのチャット・ツールを利用します。これにより、新たに参加したメンバーもチャット履歴を見て過去の対応状況を把握できるようになります。

なお、ChatOpsで展開されてきた課題には、発生したインシデントや、その問題が発生したサービスのコンテキスト、影響範囲がトポロジー情報とともに連携されています。

IBM Cloud Pak for Watson AIOpsの特徴

 

【IBM Cloud Pak for Watson AIOpsによる障害対応の例】

この画面は、ある企業のECサイト運用担当チームが業務で利用しているSlackチャンネルです。ある日、システムに問題が生じたことを知らせる通知がCloud Pak for Watson AIOpsからSlackチャンネルに届きました。この通知には、「(1)対処すべき問題が起きていること」「(2)問題個所を示すポインターと影響を受ける可能性がある他のサービスの一覧」「(3)総合的な証拠と状況を診断して解決するためのアドバイス」が含まれています。

Cloud Pak for Watson AIOpsは、さまざまなツールが生成/取得したデータを取り込んで総合的に分析し、問題の全体像と詳細を明らかにします。これにより、運用担当者は複数のツールを使い分けることなく、単一の画面で迅速に問題を把握することが可能となります。

また、Cloud Pak for Watson AIOpsは、過去に似たような状況を引き起こしたインシデントの一覧を表示します。

さらに、Cloud Pak for Watson AIOpsはIBMの自然言語処理を活用してチケット内の文章を自動的に理解し、解決のためのアクションを抽出します。これにより、運用担当者はSlack上でスピーディーに問題に対処していくことができます。

 

Cloud Pak for Watson AIOpsは、さまざまなツールから収集したデータを整理して提示するので、担当者は複数のツールにログインし直したりすることなく、問題の状況を迅速に把握できます。画面上で詳細をドリルダウンすれば連携対象のツールから集めた情報を確認できますし、提示される次善策については、その根拠まで示されるので自信を持って判断できます。2020年10月にはServiceNowとの連携が実現し、ChatOpsで通知された分析/統合済みの「Story」単位で1つのチケットとして自動起票することが可能となりました。

なお、Cloud Pak for Watson AIOpsの詳細については次の記事でもご紹介しておりますので、ぜひご覧ください(下記記事ではIBM Watson AIOpsの旧製品名でご紹介しています)。

【関連記事】
IBMクラウド・ビジョン記事『AIOpsで複雑化するシステム運用管理の課題を解決! ハイブリッド・マルチクラウド時代は運用管理もAIが支援

また、Cloud Pak for Watson AIOpsを用いた障害対応の流れは次のデモ動画でご確認いただけるほか、ご希望のお客様にはオンラインでより詳しいデモをご覧いただくことも可能です。弊社担当営業までお申し付けください。

【関連動画】
IBM Watson AIOps Demo (日本語字幕入り, 3分58秒)

関連リンク


More IBM クラウド・ビジョン stories

COBOLプログラマー不足に取り組むIBMのコード・ライティングAI

Data Science and AI, IBM Cloud Blog, IBM Data and AI...

IBMの新しいモダナイゼーション・ソリューション、 watsonx Code Assistantにより、開発者は COBOL アプリケーションを IBM Z およびハイブリッド・クラウド向けに最適化された高品質の Jav ...続きを読む


システムがクラッシュする前にITの不具合を見つけ修正する

Data Science and AI, IBM Data and AI, IBM Watson Blog...

IBMはAIOps Insightsプラットフォームにwatsonxの生成AIを導入し、IT障害の迅速かつ正確な修復を実現します。 IT障害はとても高くつくことがあります。短時間の停止でもビジネスの損失は数百万ドルに上る ...続きを読む


共同PoCで実証する運用高度化ソリューション IBM Turbonomic ARMの実力  ~IBMビジネスパートナーエグゼクティブフォーラム講演レポート~

IBM Cloud Blog, IBM Partner Ecosystem, クラウド管理...

昨今の急速なクラウド化に伴い、企業のシステムが大きな変革を迫られている今、その運用の効率化や人材の確保が急務となっています。AIを活用した運用高度化ソリューションで見出す解決方法について、2022年11月25日IBMビジ ...続きを読む