S
Smarter Business

3分で読める「ここまで来たAIOps!」3.AIOpsと自動化技術による運用の効率化・高度化(後編)

post_thumb

谷松 清孝
日本アイ・ビー・エム
IBMコンサルティング事業本部
ハイブリッド・クラウド・サービス
アソシエイト・パートナー

 

三島 善行
日本アイ・ビー・エム
IBMコンサルティング事業本部
ハイブリッド・クラウド・マネージメント
シニア・プロジェクト・マネージャー

 

小林 武彦
日本アイ・ビー・エム
IBMコンサルティング事業本部
AIOps Technology IT Architect

3. AIOpsと自動化技術による運用の効率化・高度化(後編)

前編では、イベント検知の高度化を説明させていただきました。後編は検知したイベントの対処自動化や管理・分析に関して説明します。

イベント対処自動化~対応の高速化~

発生したイベントに対する対応は、オペレーターが手動で実施しているケースもまだまだ多いのではないでしょうか。イベントの検知を高度化しても、イベントへの対応が手動では対応に時間がかかり、サービス復旧までの時間が短くならないケースもあります。また、障害の発生前に障害の予兆が検知できても対応に時間がかかることで、結果的に障害に繋がってしまい、サービス影響が発生してしまうケースもあります。そのため、イベントに対する対応も可能な限り自動化することが、ユーザー影響を最小化するために必要です。

そのためにはAnsibleのようなインフラ構築自動化ツールやRPAといった自動化ソリューションとの組み合わせが必要となります。Ansibleによって、IaC(Infrastructure as a Code)を実現し、自動的な基盤構成の拡張・縮退・再構成を可能とし、基盤関連のイベントへの対応を高速化します。またAnsibleは、基盤関連の対応のみならず、アプリケーション関連のイベントについても、PlaybookからアプリケーションのAPIを利用して自動対応することもできます。

一方、すべてをAnsibleで対応することは難しいケースもあります。APIが公開されておらず画面操作が必須となるようなケースでは、RPAを活用して自動化を推進します。AnsibleやRPAを組み合わせて自動化することで、自動対応の幅を広げることができ、発生したイベントへの対応を高速化します。

イベント管理・分析~対応を整理し、より高度な運用へ~

イベント対応の自動化を進めていくためには、検知されたイベントに対してどういった対処を実施しているのかを管理・分析する必要があり、イベントの管理が重要です。イベントの管理を行うことで、AIによる類似イベント分析を可能とし、対応の自動化を検討することが可能になります。類似イベント分析は、イベントの対応時にも活用することができ、手動対応時の迅速化の効果も期待できます。

また、同じイベントに対して都度「問題なし」という結論を得ているイベントもあるかと思います。実際には影響のないイベントでFalse positive(擬陽性)と呼ばれますが、こういったイベントが多いと、オペレーターへの負担が増加してしまいます。そのため、False positiveなイベントは検知しないように、あるいはアラート連絡しないように変更する、といった対応が必要です。さらに、同時に発生するイベントを、根本原因が同じイベントについては1つのイベントに集約(イベント・グルーピング)することで、確認・対処を必要とするイベントを削減し、オペレーターの負荷を低減させることができます。AIでイベント・グルーピングをサポートすることで、より高度化することができます。イベントを適切に管理し、AIを用いてイベント内容を分析することで、改善活動を支えます。

ITシステム運用をSaaSで~AIを活用したITシステム運用サービス~

ITシステム運用に関わるこれらのイベントの検知、検知内容に応じた自動対応、検知したイベントの管理・分析、をすべて自前で用意するのはコストも時間もかかります。また、昨今の製品やOSSはバージョンアップも早く、環境を構築してもその環境自体の維持管理が必要となります。そこで、これらの機能をマネージド・サービスで提供するのが「AIを活用したITシステム運用サービス(以降本サービス)」です。本サービスでは、これらのコンポーネントをすべてクラウド上で維持・管理し、お客様にご提供します。お客様の監視対象システムで検知した異常を本サービスで受信し、管理、対応を行います。また、監視対象システムのメトリクスやログを本サービスセンターで分析し、予兆検知を行うことも可能です。

システム運用にSaaSサービスを利用することで、維持管理コストを押さえつつ、AIで高度化された運用を実現することを可能とします。

次回の記事

次回はAIOpsの始め方として本サービスの内容をご説明します。