主页

topics

灾难恢复计划

什么是灾难恢复计划 (DRP)?
深入了解 IBM 的灾难恢复解决方案 订阅云主题更新
电脑显示器、服务器、云朵、点的组合拼贴插图

 

 

什么是 DRP?

灾难恢复计划 (DRP) 是一份详细的文件,概述了组织如何有效应对意外事件并恢复业务运营。

DRP 帮助企业做好应对各种灾难的准备,包括停电、勒索软件恶意软件攻击、自然灾害等等。

强大的 DRP 能够迅速有效地在灾难后恢复连接并修复数据丢失。全球公司 2023 年预计将花费 2190 亿美元用于网络安全,比去年增加了 12%,以上信息源自 International Data Corporation 的一份报告。

什么是 业务连续性计划?

与  DRP 一样,业务连续性计划 (BCP) 也是 灾难恢复 过程 的一部分,可帮助企业在灾难发生后恢复 正常运营 。BCP 通常比  DRP 更广泛地审视威胁和解决方案,重点关注公司在事件发生后恢复基本 业务功能 所需的内容。

什么是事件响应计划?

事件响应计划 (IRP) 是一种专门针对 网络安全 和 信息系统威胁的  DRP 。IRP 明确概述了组织从发现威胁到 缓解 和解决威胁的整个过程中的 应急响应 。IRP 旨在解决 网络攻击造成的具体损害,并专注于应对对技术 、IT 基础设施、 业务运营 和声誉威胁的 防范 。

实现混合云的全部价值

连接并集成系统,以使您的基础架构为 AI 做好准备。

相关内容 注册获取应用程序现代化指南
为什么拥有灾难恢复计划很重要?

DRP 在制定整体安全计划方面发挥着至关重要的作用,有助于确保 利益相关者、客户和投资者相信企业以负责任的方式运营。不采取必要措施确保 做好准备 的企业面临各种风险,包括代价高昂的 数据丢失、 运营停机、经济处罚和声誉受损。 

以下是企业在投资强大的 DRP 后可享受的一些好处:

缩短停机时间

当今许多顶级企业的 正常运营在很大程度上都依赖于技术。如果意外事件导致业务中断,可能会造成数百万的损失。 网络攻击 的高调性和经常被分析的 停机时间  也会导致客户和投资者失去信心。经过严格测试的强大  DRP  可帮助公司在发生意外事件后迅速恢复正常运行。

降低恢复成本

事故后的恢复工作可能代价高昂。根据 IBM 最近的《数据泄露成本报告》,2023 年数据泄露的平均成本为 445 万美元,比过去三年增长了 15%。企业可通过实施强大的 DRP 大幅降低业务恢复成本和意外事故造成的其他后果。同一报告发现,与未使用安全 AI 和自动化技术的组织相比,广泛使用相关技术的组织平均可节省 176 万美元。

降低网络保险费用

由于 网络攻击的规模和频率,许多企业依靠网络保险来保护自己免遭危险的安全漏洞。许多保险公司不会为没有建立强有力的  DRP  的企业投保。DRP  有助于降低企业在保险公司的整体风险状况,并有助于降低保费。

监管严格的行业罚款较少

在医疗保健和个人金融等受到严格监管的行业中运营的企业,会因数据泄露而面临巨额罚款和处罚。缩短响应和恢复周期对这些行业中至关重要,因为经济处罚金额通常与违规的持续时间和严重程度有关。拥有稳健 DRP 的企业能够更迅速、更全面地从计划外事件中恢复,从而减少因此面临的罚款。

灾难恢复计划如何运作?

最有效的 DRP 是与强大的 BCP 和 IRP 同时制定的,它们可在事件发生时提供重要支持。我们来看一些关键术语,这些术语对于理解  DRP  的工作原理以及构建自己的 DRP 时要考虑的事项至关重要:

故障转移或故障恢复

当主系统因 断电、 网络攻击 或其他威胁而发生故障时,IT 操作会被转移到辅助系统上,故障转移是一种广泛使用的流程。故障恢复是在系统恢复后切换回原始系统的过程。例如,企业可能会从其 数据中心 故障转移到备用站点,在那里冗余系统会立即生效。如果运行得当,故障转移或故障恢复可以创造一种无缝体验,用户或客户甚至不会意识到他们正在被转移到辅助系统。

恢复时间目标  (RTO)

RTO  是指意外事件发生后恢复 业务运营所需的时间。建立合理的  RTO  是企业在创建  DRP  时首先要做的事情之一。

恢复点目标 (RPO)

企业的 RPO  是指企业在灾难中能够承受的、仍能恢复的数据丢失量。一些企业不断将数据复制到远程 数据中心 ,以确保在发生大规模漏洞时数据的连续性。其他人将可容忍的  RPO  设置为几分钟或几小时,这样他们就知道可以恢复这段时间内的任何损失。

灾难恢复即服务 (DRaaS)

由于人们对数据安全重要性的认识不断提高,DRaaS 近来越来越受欢迎。采用 DRaaS 方法创建 DRP 的公司将灾难恢复外包给第三方。第三方将托管和管理恢复所需的基础设施,然后制定和管理响应计划,并确保迅速恢复关键业务运营。 根据 Global Market Insights 的最新报告 (链接位于 ibm.com 以外), DRaaS  的市场规模在 2022 年为 115 亿美元,并预计在 2023 年增长 22%。

基础设施技术灾难恢复计划的类型

随着网络犯罪的盛行及其日益复杂化,大多数组织都将 DRP 的工作重点放在其 IT 基础设施上,包括关键数据备份程序(现场和异地备份)和数据保护措施。以下是一些针对特定威胁或业务需求而定制的 IT 灾难恢复计划的示例:

数据中心恢复计划

数据中心 DRP 侧重于数据中心设施的整体安全性及其在意外事件发生后恢复运行的能力。数据存储面临的一些常见威胁包括人员过度负荷导致的人为错误、网络攻击、停电以及难以遵守合规要求。数据中心 DRP 会创建运营风险评估,分析物理环境、连接性、电源和安全性等关键组件。由于数据中心面临着各种潜在威胁,其 IT DRP 涵盖的范围往往比其他设施更广泛。

网络恢复计划

网络 DRP 依靠一组明确的步骤来帮助组织从网络服务中断中恢复,包括互联网访问、蜂窝数据、局域网和广域网。考虑到网络服务对业务运营的重要性,有效的网络 DRP 必须明确概述在网络发生入侵后快速有效地恢复服务所需的步骤、角色和责任。

虚拟化恢复计划

虚拟化的  DRP  可以显著提高恢复工作的效率和速度。虚拟化的  DRP  依赖于  Virtual Machines  (VM) 实例,可在几分钟内准备就绪投入运行。虚拟机是对物理计算机的表示或仿真,通过高可用性 (HA) 提供 关键应用程序 恢复的能力,或使系统持续运行而不发生故障的能力。

基于云的恢复计划

鉴于云计算在许多企业工作量中的普及,针对云服务恢复而量身定制的 DRP 正变得越来越普遍。云 DRP 概述了一系列步骤,确保云数据得到备份,并且能够顺利恢复依赖云的应用程序和系统。

制定 灾难恢复计划的五个步骤

DRP 的制定始于对业务流程的分析、风险评估和几个明确的恢复目标的设定。虽然没有可靠的通用模板,但无论公司规模或所属行业如何,都可以采取一些步骤来确保拥有应对各种突发事件的流程。

第 1 步:开展业务影响分析

业务影响分析 (BIA) 是对公司可能面临的每种威胁及其可能造成的后果进行的仔细评估。强大的 BIA 会检查潜在威胁如何影响日常运营、沟通渠道和工人安全等方面。BIA 可能考虑的一些例子包括收入损失、 停机成本、声誉修复成本(公共关系)、客户和投资者损失(短期和长期)以及因违规而产生的任何处罚。

第 2 步:分析风险

不同行业和类型的企业面临不同的威胁,因此风险分析对于确定如何应对每一种威胁至关重要。您可以通过考虑其发生的可能性和潜在影响来分别评估每种风险。有两种常用的风险确定方法:定性风险分析和定量风险分析。定性分析基于感知的风险,而定量分析则通过可验证的数据进行。

第 3 步:创建资产清单

要从网络事件中恢复,全面了解企业拥有的资产至关重要。定期盘点有助于识别对业务运营至关重要的硬件、软件、IT 基础设施、数据和其他资产。您可以使用诸如“关键”、“重要”和“不重要”之类的标签作为起点,将资产分为三大类别,然后再根据需要为其分配更具体的标签:

  • 关键:仅当企业在日常业务运营中必需这些资产时,才将其标记为关键。
  • 重要:将此标签应用于每天至少使用一次的资产,若这些资产中断,会对业务运营产生影响(但不会完全导致停摆)。
  • 不重要:此类资产在企业内使用频率不高,对正常业务运营并非不可或缺。
步骤 4:确立角色和职责

DRP 中的角色和职责无缝最为关键。如果没有明确的角色和职责划分,当意外事件发生时,没人知道该怎么办。虽然具体角色和职责因业务类型而有所差异,但大多数 DRP 中通常包含以下典型角色和职责:

  • 事件报告:应为每个部门指定一名或多名负责人,专门负责发生中断事件时与管理团队、利益相关者和所有相关机构进行沟通。
  • DRP 管理:应指定一名 DRP 主管,负责监督团队成员是否执行分配的任务,并确保 DRP 的顺利运行。
  • 资产保护: 当灾难发生时,您应该让专人负责保护最 关键资产的安全,并向管理层和利益相关者汇报资产状况。 
  • 第三方沟通: 您应该指定一个人负责与您作为 DRP 的一部分雇用的任何第三方供应商进行协调。此人应不断向任何相关利益相关者通报 DRP 的最新进展情况。 
第 5 步:测试和优化

为确保您的 DRP 在实际事件发生期间无缝展开,您需要定期进行练习,并根据您的业务所发生的任何有意义的变化进行更新。例如,如果贵公司在  DRP 制定后获得了一项新资产,您就需要将其纳入您的计划,以确保其在未来受到保护。

测试和改进可以简化为以下三个步骤:

  1. 搭建精准的模拟环境:尝试搭建与公司可能面临的实际情况尽可能接近的环境,同时确保不会对任何人造成实际的安全风险。
  2. 发现问题: 利用测试过程找出计划中的错误和不一致之处,然后在下一次迭代  DRP 时加以解决。 
  3. 测试备份和恢复能力:了解如何应对突发事件至关重要,但同样重要的是,要对在事件结束后恢复关键系统而制定的程序进行测试。测试如何让网络继续正常运行、恢复任何丢失的数据并恢复正常业务运营。
相关解决方案
云灾难恢复

使用云灾难恢复计划保护您的数据。

查找云灾难恢复解决方案

IBM Cloud Backup

采用高度耐用、可扩展和安全的存储目的地来备份数据。

深入了解 IBM Cloud Backup 解决方案

IBM Cloud for VMware Solutions

借助 IBM Cloud for VMware Solutions 扩展容量并将数据中心基础设施整合到自动化、集中管理的软件定义数据中心中。

了解 IBM Cloud for VMware Solutions

IBM Storage Defender

利用 IBM Research 开发的 AI 驱动的威胁检测方法,加快业务恢复,以应对网络攻击事件。

深入了解 IBM Storage Defender

灾难恢复计划资源 灾难恢复即服务 (DRaaS) 与灾难恢复 (DR)

在决定是投资和管理本地部署 DR 解决方案还是使用 DRaaS 提供商时,许多因素都会发挥作用。

什么是备份和还原?

备份和恢复是指将数据和应用程序定期复制到一个独立的辅助设备上的技术和实践,并通过这些副本恢复数据和应用程序。

灾难恢复和备份之间存在关键的相似性和差异。这两种解决方案都可以助力您解决企业面临的关键问题。

实现早期威胁检测和快速数据恢复,帮助组织在几分钟(而非几天)重启业务运营。

采取后续步骤

IBM Cloud for VMware Solutions 在云环境中支持各种 VMware 产品和服务。将所有 VMware 工作量从本地部署基础架构迁移到 IBM Cloud,或混合搭配,创建可以集中管理的混合云环境。

深入了解 Cloud for VMware Solutions