災害復旧(DR)は、破壊的な事象によって生じるデータ損失や業務の中断を予防または最小限に抑えるベスト・プラクティスとIT技術で構成されるフレームワークです。
これには、設備の故障や地域のPower®供給停止から、犯罪や軍事攻撃、サイバー攻撃、自然災害まで、あらゆるものが含まれます。
多くの企業、特に中小の組織は、信頼性が高く実用的な災害復旧計画 (DRP)の策定を怠っています。そのような計画がなければ、重大な破壊的な出来事の影響から身を守ることはできません。
計画外のダウンタイムのコストを考慮すると、データ損失保護が不可欠になります。SplunkとOxford Economicsの研究によると、組織では、ダウンタイムの平均コストは1分あたり9,000米ドル(または1時間あたり540,000米ドル)に上る場合があります。機密データを扱う高額な金融機関や医療機関にとって、ダウンタイムは1時間あたり500万米ドルを超えるコストにつながる可能性があります。1 災害復旧計画は、これらのリスクを大幅に軽減できます。
災害復旧には、戦略化、計画、適切なテクノロジーのデプロイ、継続的なテストの実施が含まれます。データのバックアップはクリティカルなコンポーネントですが、バックアップと復元のプロセスだけでは、包括的な災害復旧計画は構成されません。
災害復旧には、堅牢なフェイルオーバーとフェイルバック手順を維持するために、適切なストレージとコンピューティングを確保することも含まれます。フェイルオーバーとは、ワークロードをバックアップシステムにオフロードするプロセスであり、生産プロセスやエンドユーザー・エクスペリエンスを可能な限り中断させないようにします。フェイルバックでは、元のプライマリー・システムに切り替えます。
IBMニュースレター
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
事業継続性災害復旧(BCDR)は、組織が災害が発生した際に通常のオペレーションを再開するためのプロセスです。事業継続性と災害復旧は多くの類似点がありますが、異なる2つのアプローチです。
BCDRはビジネスにおける緊急管理と呼ばれることもありますが、連邦緊急事態管理庁(FEMA)などの官公庁・自治体プログラムとは大きく異なります。これらのプログラムは、民間緊急事態に焦点を当てており、組織的なITやオペレーションではなく、公共の安全とコミュニティー全体の災害支援を提供します。
事業継続計画(BCP)は、企業のすべての領域が重要なオペレーションを維持し、危機や緊急事態が発生した場合に迅速に再開できるようにするシステムとプロセスで構成されています。
災害復旧計画は、ITインフラストラクチャーとシステムの復旧に焦点を当てた事業継続性計画のサブセットです。これは、予期せぬ事象からの復旧ステップをマッピングする災害復旧計画(DRP)を含みます。企業は、さまざまな災害状況(自然災害、ランサムウェア、マルウェア攻撃など)を管理するためにDRPに依存しています。
次の7つのステップは、効果的な災害復旧計画に役立ちます。
包括的な災害復旧計画の作成は、ビジネスへの影響分析(BIA)から始まります。この分析を実行する際には、一連の詳細な災害シナリオを作成します。これらのシナリオを使用して、特定のビジネス・プロセスが中断された場合に発生する損失の規模と範囲を予測できます。たとえば、火災によりカスタマー・サービス・コール・センターが破壊された場合はどうなるでしょうか?それとも本社を襲う地震となりましたか?
この分析により、クリティカルなビジネス機能を特定し、それぞれがどの程度のダウンタイムを許容できるかを判断できます。この情報を準備しておくことで、さまざまなシナリオにおいて最もクリティカルなオペレーションを維持するための計画を立てることができます。
IT災害復旧計画は、事業継続計画に基づき、事業継続計画をサポートする必要があります。たとえば、事業継続計画では、コールセンターの火災を受けてカスタマー・サービス担当者を在宅勤務するように求めている場合はどうなるでしょうか?その計画をサポートするには、どのような種類のハードウェア、ソフトウェア、ITリソースを利用可能にする必要があるか?
ビジネスが直面するリスクの可能性と潜在的な影響を評価することは、災害復旧ストラテジーの重要なコンポーネントです。サイバー攻撃やランサムウェアが蔓延する中、すべての企業が今日直面している一般的なサイバーセキュリティー・リスクを理解することが需要です。さらに、業種・業務および地理的な場所に特有のリスクを理解することも重要です。
自然災害、設備の故障、内部脅威、妨害行為、従業員のミスなど、さまざまなシナリオに対して、リスクを評価し、ビジネスへの全体的な影響を考慮することが重要です。
次の質問を自問してみてください。
すべてのワークロードがビジネスのオペレーション維持能力にとって等しくクリティカルなわけではなく、ダウンタイムは他のアプリケーションよりもはるかに許容されます。
ITシステムとアプリケーションを停止できる期間とデータ損失の結果の重大度に基づいて、ITシステムとアプリケーションを3つの層に分けます。
災害復旧計画の次のステップは、ハードウェアとソフトウェア資産の包括的なインベントリーを作成することです。この段階では、クリティカルなアプリケーションの相互依存関係を理解することが不可欠です。1つのソフトウェアアプリケーションがダウンした場合、他のどのソフトウェアアプリケーションが影響を受けるのでしょうか。
アプリケーションの相互依存性を管理する最善の方法は、システム構築時にデータ・レジリエンスと災害復旧モデルを設計することです。今日のマイクロサービスベースのアーキテクチャーでは、他のシステムやプロセスがダウンしているときに開始できないプロセスを発見したり、その逆は非常に一般的です。
この状況から回復するのは困難です。また、実際の災害が発生する前に、システムやプロセスの代替計画を策定する時間があるときに、そのような問題を明らかにすることも重要です。
リスクとビジネスへの影響分析を考慮することで、複数の目標を設定できる必要があります。これらの目標には、システムをオンラインに戻すのにかかる時間、損失を許容できるデータの量、データの破損や逸脱を許容できる量などが含まれます。
企業が確立するすべての災害復旧ソフトウェアとソリューションは、遵守が義務付けられているデータ保護とセキュリティーの要件を満たす必要があります。つまり、すべてのデータのバックアップおよびフェイルオーバー・システムは、データの機密性と整合性を確保するためのプライマリ・システムと同じ基準を満たすように設計する必要があるということです。
同時に、いくつかの規制基準では、すべての企業が災害復旧と事業継続性計画を維持しなければならないと規定しています。例えば、 サーベンス・オクスリー法(SOX)では、米国のすべての上場企業に対し、最低5年間はすべてのビジネス記録のコピーを維持することが義務付けられています。
規制を遵守しない場合(適切なデータのバックアップの構築とテストの怠数を含む)は、企業への多額の罰金、さらにはリーダーへの懲役につながる可能性があります。
簡単に言えば、災害復旧計画がテストされていない場合、その計画は信頼できません。該当する責任を持つすべての従業員は、災害復旧テスト演習に参加する必要があります。これには、指定された期間、フェイルオーバーサイトからのオペレーションを維持することも含まれる場合があります。
総合的な災害復旧テストの実施が予算や機能を超えている場合は、テスト手順の「机上演習」をスケジュールすることもできます。ただし、この種のテストでは、完全なテストよりも、DR手順の異常や弱点、特にこれまで発見されていなかったアプリケーションの相互依存関係の存在が明らかになる可能性は低くなります。
ハードウェア資産とソフトウェア資産は時間の経過とともに変化するため、災害復旧計画もそれに応じて更新する必要があります。したがって、計画を継続的に見直し、修正することが重要です。
災害復旧計画の例を見るにはこちらをご覧ください。
災害復旧には以下のような欠かせないメリットがあります。
災害復旧には、次の種類のテクノロジーとソリューションが含まれます。
独自の災害復旧データセンターを構築するには、複数の競合する目標の間でバランスを取る必要があります。
いずれの場合も、データのコピーは、本社やオフィスの場所から地理的に十分離れた場所に保管する必要があります。そうすることで、メイン・サイトに影響を与える同じ地震現象、環境の脅威、またはその他の危険によってデータが永久に破壊されることがなくなります。
同時に、オフサイトに保管されたバックアップは、プライマリサイトのオンプレミスにあるバックアップと比較して、復元に時間がかかります。さらに、ネットワークのレイテンシーは、長距離ではさらに大きくなる可能性があります。
バックアップと復元は、強固な災害復旧計画を構築するための基盤として機能します。
データベースのスナップショットバックアップは、特定の時点でのアプリケーションまたはディスクの現在の状態をキャプチャします。最後のスナップショット以降に変更されたデータのみを書き込むことで、この方法はストレージ・スペースを節約しつつデータを保護するのに役立ちます。
スナップショットは、災害復旧のために他の場所に複製したり、クラウドに保管したりできます。
クラウドDRは、クラウドベースのインフラストラクチャーとサービスを使用してデータとアプリケーションをバックアップおよび復元するため、物理的な2次データセンターを維持する必要がありません。
パブリッククラウドまたは専用サービスプロバイダーの設定を使用する物理または仮想マシン(VM)を含む、アプリケーション・データとサーバー・インフラ全体を保護することができます。特定の要件に基づいてバックアップスケジュールを構成できます。
クラウドバックアップソリューションはVMwareやCloud Native Backupなどの仮想化プラットフォームとも統合可能です。これらのアプローチは、ストレージ需要の変化に応じて柔軟な拡張性とコストの最適化を提供し、クラウド移行中の組織をサポートします。
DRaaS (災害復旧 as a Service)は、オンデマンドかつ従量課金制でデータ保護と災害復旧機能を提供するサードパーティのクラウドベースのソリューションです。
DRaaSは、現在利用可能な最も人気があり、急速に成長しているマネージドITサービス製品の1つです。2023年の業種・業務調査では、DRaaS市場が年平均成長率で2028年までに107億米ドルから265億米ドルに成長すると予測されています。2
DRaaS では、サービスプロバイダーが、ダウンタイムの制限とアプリケーションの回復期待を概説したサービスレベルアグリーメント (SLA)にRTOとRPOを文書化します
DRaaSサービスには通常、クラウドベースのアプリケーションの復旧オペレーションも含まれています。このアプローチは、自社のデータセンターで冗長な専用ハードウェアのリソースを維持する場合に比べて、大幅なコスト削減につながります。フェイルオーバー機能の維持に加えて、災害復旧の状況で消費されたリソースの使用ごとのコストを支払う契約もあります。このようにして、通常、ベンダーがフェイルオーバー環境の構成と保守に対するすべての責任を負います。
すでにオンプレミスの災害復旧(DR)ソリューションを構築している場合、そのソリューションを維持する場合と、月次のDRaaSサブスクリプションに移行する場合のコストとメリットを評価するのは困難な場合があります。
ほとんどのオンプレミスDRソリューションでは、ハードウェア、電力、保守と管理の人件費、ソフトウェア、ネットワーク接続のコストが発生します。DR環境の初期設定にかかる初期費用に加えて、定期的なソフトウェアのアップグレードの予算を立てる必要があります。
DRソリューションは主なオペレーション環境と互換性を維持する必要があるため、DRソリューションが同じソフトウェア・バージョンであることを確認する必要があります。ライセンス契約の内容によっては、ソフトウェアのコストが事実上2倍になる場合があります。
サードパーティーのDRaaSソリューションを検討している場合は、ベンダーがクロスリージョンおよびマルチサイト・バックアップに対応できることを確認してください。重大な気象現象(ハリケーンなど)が主なオフィスの場所に影響を与える可能性がある場合、フェイルオーバー・サイトは嵐の影響を受けないほど十分に離れた場所にあるでしょうか?
地域内のベンダーの顧客の多くが同時に影響を受けた場合、ベンダーは顧客全体のニーズを満たすのに十分な能力を持っているでしょうか?DRaaSベンダーは、危機時にRTOとRPOを満たすことを信頼しているため、信頼性に定評のあるサービス・プロバイダーを探しましょう。
両方のソリューションのより詳細な比較については、「サービスとしての災害復旧 (DRaaS) と災害復旧 (DR): どちらが必要ですか?」をご覧ください。
AI統合は、脅威の検知を強化し、インシデント対応を自動化し、ハイブリッド環境やマルチクラウド環境での管理を合理化する主要な機能によって、災害復旧に変革をもたらしつつあります。
IBM2025 データ侵害のコストに関する調査では、世界平均のコストは488万米ドルから444万米ドルに減少し、9%の減少となりました。レポートによると、組織は平均241日以内に侵害を特定して封じ込めることができました。これは9年ぶりの最低期間です。
災害復旧におけるAIには、次のような主要なメリットがあります。
バックアップ、AIを利用した脅威検知、迅速なリカバリーにより、データがどこに保存されていても、進化する脅威から保護します。
オンプレミスおよびクラウドのワークロードに対応するため、企業のバックアップおよび復旧プロセスを加速し、データの回収やITサービスの迅速な復旧を支援します。
クラウド災害復旧プランでデータを保護し、ダウンタイムのリスクを軽減しましょう。
1.ダウンタイムの隠れたコスト - Global 2000 エグゼクティブによる分析、Splunk、2024年6月
2. 災害復旧サービス(DRaaS)市場規模、MarketsandMarkets、2023年