1 范围
本标准规定了信息系统灾难恢复应遵循的基本要求。
本标准适用于信息系统灾难恢复的规划、审批、实施和管理。
2 规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 5271.8-2001 信息技术 词汇 第8部分:安全GB/T 20984 信息安全技术 信息安全风险评估规范
3 术语和定义
GB/T 5271.8-2001确立的以及下列术语和定义适用于本标准。
3.13.1
灾难备份中心 backup center for disaster recovery
备用站点 alternate site
用于灾难发生后接替主系统进行数据处理和支持关键业务功能(3.6)运作的场所,可提供灾难备份
系统(3.3)、备用的基础设施和专业技术支持及运行维护管理能力,此场所内或周边可提供备用的生活设施。
3.23.2
灾难备份 backup for disaster recovery
为了灾难恢复(3.9)而对数据、数据处理系统、网络系统、基础设施、专业技术支持能力和运行管理能力进行备份的过程。
3.33.3
灾难备份系统 backup system for disaster recovery
用于灾难恢复(3.9)目的,由数据备份系统、备用数据处理系统和备用的网络系统组成的信息系统。
3.43.4
业务连续管理 business continuity management
BCM
为保护组织的利益、声誉、品牌和价值创造活动,找出对组织有潜在影响的威胁,提供建设组织有
效反应恢复能力的框架的整体管理过程。包括组织在面临灾难时对恢复或连续性的管理,以及为保证业务连续计划或灾难恢复预案的有效性的培训、演练和检查的全部过程。
3.53.5
业务影响分析 business impact analysis
BIA
分析业务功能及其相关信息系统资源、评估特定灾难对各种业务功能的影响的过程。
3.63.6
关键业务功能 critical business functions
如果中断一定时间,将显著影响组织运作的服务或职能。
3.73.7
数据备份策略 data backup strategy
为了达到数据恢复和重建目标所确定的备份步骤和行为。通过确定备份时间、技术、介质和场外存
放方式,以保证达到恢复时间目标(3.17)和恢复点目标(3.18)。
3.83.8
灾难 disaster
由于人为或自然的原因,造成信息系统严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定的时间的突发性事件。通常导致信息系统需要切换到灾难备份中心(3.12)运行。3.9
灾难恢复 disaster recovery
为了将信息系统从灾难(3.8)造成的故障或瘫痪状态恢复到可正常运行状态、并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态,而设计的活动和流程。
3.10
灾难恢复预案 disaster recovery plan
定义信息系统灾难恢复过程中所需的任务、行动、数据和资源的文件。用于指导相关人员在预定的灾难恢复目标内恢复信息系统支持的关键业务功能。
3.11
灾难恢复规划 disaster recovery planning
DRP
为了减少灾难带来的损失和保证信息系统所支持的关键业务功能(3.6)在灾难发生后能及时恢复和继续运作所做的事前计划和安排。
3.12
灾难恢复能力 disaster recovery capability
在灾难发生后利用灾难恢复资源和灾难恢复预案及时恢复和继续运作的能力。
3.13
演练 exercise
为训练人员和提高灾难恢复能力而根据灾难恢复预案(3.10)进行活动的过程。包括桌面演练、模拟演练、重点演练和完整演练等。
3.14
场外存放 offsite storage
将存储介质存放到离主中心(3.14)有一定安全距离的物理地点的过程。
3.15
主中心 primary center
主站点 primary site
生产中心 productioncenter主系统所在的数据中心。
3.16
主系统 primary system
生产系统 production system
正常情况下支持组织日常运作的信息系统。包括主数据、主数据处理系统和主网络。
3.17
区域性灾难 regional disaster
造成所在地区或有紧密联系的邻近地区的交通、通信、能源及其它关键基础设施受到严重破坏,或大规模人口疏散的事件。
3.18
恢复时间目标 recovery time objective
RTO
灾难发生后,信息系统或业务功能从停顿到必须恢复的时间要求。
3.19
恢复点目标 recovery point objective
RPO
灾难发生后,系统和数据必须恢复到的时间点要求。
3.20
重续 resumption
灾难备份中心(3.1)替代主中心(3.14),支持关键业务功能(3.6)重新运作的过程。3.21
回退 return
复原 restoration
支持业务运作的信息系统从灾难备份中心(3.1)重新回到主中心(3.14)运行的过程。
4 灾难恢复概述
4.1 灾难恢复的工作范围
信息系统的灾难恢复工作,包括灾难恢复规划和灾难备份中心的日常运行、关键业务功能在灾难备份中心的恢复和重续运行,以及主系统的灾后重建和回退工作,还涉及突发事件发生后的应急响应。
其中,灾难恢复规划是一个周而复始、持续改进的过程,包含以下几个阶段:
——灾难恢复需求的确定;
——灾难恢复策略的制定;
——灾难恢复策略的实现;
——灾难恢复预案的制定、落实和管理。
4.2 灾难恢复的组织机构
4.2.1 组织机构的设立
信息系统的使用或管理组织(以下简称“组织”)应结合其日常组织机构建立灾难恢复的组织机构,并明确其职责。其中一些人可负责两种或多种职责,一些职位可由多人担任(灾难恢复预案中应明确他们的替代顺序)。
灾难恢复的组织机构由管理、业务、技术和行政后勤等人员组成,一般可设为灾难恢复领导小组、灾难恢复规划实施组和灾难恢复日常运行组。
组织可聘请具有相应资质的外部专家协助灾难恢复实施工作,也可委托具有相应资质的外部机构承担实施组以及日常运行组的部分或全部工作。
4.2.2 组织机构的职责
4.2.2.1 灾难恢复领导小组
灾难恢复领导小组是信息系统灾难恢复工作的组织领导机构,组长应由组织最高管理层成员担任。领导小组的职责是领导和决策信息系统灾难恢复的重大事宜,主要如下:
——审核并批准经费预算;
——审核并批准灾难恢复策略;
——审核并批准灾难恢复预案;
——批准灾难恢复预案的执行。
4.2.2.2 灾难恢复规划实施组
灾难恢复规划实施组的主要职责是负责:
——灾难恢复的需求分析;
——提出灾难恢复策略和等级;
——灾难恢复策略的实现;
——制定灾难恢复预案;
——组织灾难恢复预案的测试和演练。
4.2.2.3 灾难恢复日常运行组
灾难恢复日常运行组的主要职责是负责:
——协助灾难恢复系统实施;
——灾难备份中心日常管理;
——灾难备份系统的运行和维护;
——灾难恢复的专业技术支持;
——参与和协助灾难恢复预案的教育、培训和演练;
——维护和管理灾难恢复预案;
——突发事件发生时的损失控制和损害评估;
——灾难发生后信息系统和业务功能的恢复;
——灾难发生后的外部协作。
4.3 灾难恢复规划的管理
组织应评估灾难恢复规划过程的风险、筹备所需资源、确定详细任务及时间表、监督和管理规划活动、跟踪和报告任务进展以及进行问题管理和变更管理。
4.4 灾难恢复的外部协作
组织应与相关管理部门、设备及服务提供商、电信、电力和新闻媒体等保持联络和协作,以确保在灾难发生时能及时通报准确情况和获得适当支持。
4.5 灾难恢复的审计和备案
灾难恢复的等级评定、灾难恢复预案的制定,应按有关规定进行审计和备案。
5 灾难恢复需求的确定
5.1 风险分析
标识信息系统的资产价值,识别信息系统面临的自然的和人为的威胁,识别信息系统的脆弱性,分析各种威胁发生的可能性并定量或定性描述可能造成的损失,识别现有的风险防范和控制措施。通过技术和管理手段,防范或控制信息系统的风险。依据防范或控制风险的可行性和残余风险的可接受程度,确定对风险的防范和控制措施。信息系统风险评估方法可参考GB/T XXX《信息安全风险评估指南》。
5.2 业务影响分析
5.2.1 分析业务功能和相关资源配置
对组织的各项业务功能及各项业务功能之间的相关性进行分析,确定支持各种业务功能的相应信息系统资源及其它资源,明确相关信息的保密性、完整性和可用性要求。
5.2.2 评估中断影响
应采用如下的定量和/或定性的方法,对各种业务功能的中断造成的影响进行评估:
——定量分析:以量化方法,评估业务功能的中断可能给组织带来的直接经济损失和间接经济损失;
——定性分析:运用归纳与演绎、分析与综合以及抽象与概括等方法,评估业务功能的中断可能给组织带来的非经济损失,包括组织的声誉、顾客的忠诚度、员工例如的信心、社会和政治影
响等。
5.3 确定灾难恢复目标
根据风险分析和业务影响分析的结果,确定灾难恢复目标,包括:
——关键业务功能及恢复的优先顺序;
——灾难恢复时间范围,即 RTO 和 RPO 的范围。
6 灾难恢复策略的制定
6.1 灾难恢复策略制定的要素
6.1.1 灾难恢复资源要素
支持灾难恢复各个等级所需的资源(以下简称“灾难恢复资源”)可分为如下7个要素:
——数据备份系统:一般由数据备份的硬件、软件和数据备份介质(以下简称“介质”)组成, 如果是依靠电子传输的数据备份系统,还包括数据备份线路和相应的通信设备;
——备用数据处理系统:指备用的计算机、外围设备和软件;
——备用网络系统:最终用户用来访问备用数据处理系统的网络,包含备用网络通信设备和备用数据通信线路;
——备用基础设施:灾难恢复所需的、支持灾难备份系统运行的建筑、设备和组织,包括介质的场外存放场所、备用的机房及灾难恢复工作辅助设施,以及容许灾难恢复人员连续停留的生活设施;
——专业技术支持能力:对灾难恢复系统的运转提供支撑和综合保障的能力,以实现灾难恢复系统的预期目标。包括硬件、系统软件和应用软件的问题分析和处理能力、网络系统安全运行管理能力、沟通协调能力等;
——运行维护管理能力:包括运行环境管理、系统管理、安全管理和变更管理等;
——灾难恢复预案。
6.1.2 成本效益分析原则
根据灾难恢复目标,按照灾难恢复资源的成本与风险可能造成的损失之间取得平衡的原则(以下简称“成本风险平衡原则”)确定每项关键业务功能的灾难恢复策略,不同的业务功能可采用不同的灾难恢复策略。
6.1.3 灾难恢复策略的组成
灾难恢复策略主要包括:
——灾难恢复资源的获取方式;
——灾难恢复能力等级(见附录 A),或灾难恢复资源各要素的具体要求。
6.2 灾难恢复资源的获取方式
6.2.1 数据备份系统
数据备份系统可由组织自行建设,也可通过租用其它机构的系统而获取。
6.2.2 备用数据处理系统
可选用以下三种方式之一来获取备用数据处理系统:
——事先与厂商签订紧急供货协议;
——事先购买所需的数据处理设备并存放在灾难备份中心或安全的设备仓库;
——利用商业化灾难备份中心或签有互惠协议的机构已有的兼容设备。
6.2.3 备用网络系统
备用网络通信设备可通过6.2.2所述的方式获取;备用数据通信线路可使用自有数据通信线路或租用公用数据通信线路。
6.2.4 备用基础设施
可选用以下三种方式获取备用基础设施:
——由组织所有或运行;
——多方共建或通过互惠协议获取;
——租用商业化灾难备份中心的基础设施。
6.2.5 专业技术支持能力
可选用以下几种方式获取专业技术支持能力:
——灾难备份中心设置专职技术支持人员;
——与厂商签订技术支持或服务合同;
——由主中心技术支持人员兼任;但对于 RTO 较短的关键业务功能,应考虑到灾难发生时交通和通信的不正常,造成技术支持人员无法提供有效支持的情况。
6.2.6 运行维护管理能力
可选用以下对灾难备份中心的运行维护管理模式:
——自行运行和维护;
——委托其它机构运行和维护。
6.2.7 灾难恢复预案
可选用以下方式,完成灾难恢复预案的制定、落实和管理:
——由组织独立完成;
——聘请具有相应资质的外部专家指导完成;
——委托具有相应资质的外部机构完成。
6.3 灾难恢复资源的要求
6.3.1 数据备份系统
组织应根据灾难恢复目标,按照成本风险平衡原则,确定:
——数据备份的范围;
——数据备份的时间间隔;
——数据备份的技术及介质;
——数据备份线路的速率及相关通信设备的规格和要求。
6.3.2 备用数据处理系统
组织应根据关键业务功能的灾难恢复对备用数据处理系统的要求和未来发展的需要,按照成本风险平衡原则,确定备用数据处理系统的:
——数据处理能力;
——与主系统的兼容性要求;
——平时处于就绪还是运行状态。
6.3.3 备用网络系统
组织应根据关键业务功能的灾难恢复对网络容量及切换时间的要求和未来发展的需要,按照成本风险平衡原则,选择备用数据通信的技术和线路带宽,确定网络通信设备的功能和容量,保证灾难恢复时,最终用户能以一定速率连接到备用数据处理系统。
6.3.4 备用基础设施
组织应根据灾难恢复目标,按照成本风险平衡原则,确定对备用基础设施的要求,包括:
——与主中心的距离要求;
——场地和环境(如面积、温度、湿度、防火、电力和工作时间等)要求;
——运行维护和管理要求。
6.3.5 专业技术支持能力
组织应根据灾难恢复目标,按照成本风险平衡原则,确定灾难备份中心在软件、硬件和网络等方面的技术支持要求,包括技术支持的组织架构、各类技术支持人员的数量和素质等要求。
6.3.6 运行维护管理能力
组织应根据灾难恢复目标,按照成本风险平衡原则,确定灾难备份中心运行维护管理要求,包括运行维护管理组织架构、人员的数量和素质、运行维护管理制度等要求。
6.3.7 灾难恢复预案
组织应根据需求分析的结果,按照成本风险平衡原则,明确灾难恢复预案的:
——整体要求;
——制定过程的要求;
——教育、培训和演练要求;
——管理要求。
7 灾难恢复策略的实现
7.1 灾难备份系统技术方案的实现
7.1.1 技术方案的设计
根据灾难恢复策略制定相应的灾难备份系统技术方案,包含数据备份系统、备用数据处理系统和备用的网络系统。技术方案中所设计的系统,应:
——获得同主系统相当的安全保护;
——具有可扩展性;
——考虑其对主系统可用性和性能的影响。
7.1.2 技术方案的验证、确认和系统开发
为确保技术方案满足灾难恢复策略的要求,应由组织的相关部门对技术方案进行确认和验证,并记录和保存验证及确认的结果。
按照确认的灾难备份系统技术方案进行开发,实现所要求的数据备份系统、备用数据处理系统和备用网络系统。
7.1.3 系统安装和测试
按照经过确认的技术方案,灾难恢复规划实施组应制定各阶段的系统安装及测试计划,以及支持不同关键业务功能的系统安装及测试计划,并组织最终用户共同进行测试。确认以下各项功能可正确实现:
——数据备份及数据恢复功能;
——在限定的时间内,利用备份数据正确恢复系统、应用软件及各类数据,并可正确恢复各项关键业务功能;
——客户端可与备用数据处理系统通信正常。
7.2 灾难备份中心的选择和建设
7.2.1 选址原则
选择或建设灾难备份中心时,应根据风险分析的结果,避免灾难备份中心与主中心同时遭受同类风险。灾难备份中心包括同城和异地两种类型,以规避不同影响范围的灾难风险。
灾难备份中心应具有数据备份和灾难恢复所需的通信、电力等资源,以及方便灾难恢复人员和设备到达的交通条件。
灾难备份中心应根据统筹规划、资源共享、平战结合的原则,合理地布局。
7.2.2 基础设施的要求
新建或选用灾难备份中心的基础设施时:
——计算机机房应符合有关国家标准的要求;
——工作辅助设施和生活设施应符合灾难恢复目标的要求。
7.3 专业技术支持能力的实现
组织应根据灾难恢复策略的要求,获取对灾难备份系统的专业技术支持能力。 灾难备份中心应建立相应的技术支持组织,定期对技术支持人员进行技能培训。
7.4 运行维护管理能力的实现
为了达到灾难恢复目标,灾难备份中心应建立各种操作规程和管理制度,用以保证:
——数据备份的及时性和有效性;
——备用数据处理系统和备用网络系统处于正常状态,并与主系统的参数保持一致;
——有效的应急响应、处理能力。
7.5 灾难恢复预案的实现
灾难恢复的每个等级均应按第8章的具体要求制定相应的灾难恢复预案,并进行落实和管理。
7.5.1 灾难恢复预案的制定
灾难恢复预案的制定应遵循以下原则:
——完整性:灾难恢复预案(以下称预案)应包含灾难恢复的整个过程,以及灾难恢复所需的尽可能全面的数据和资料;
——易用性:预案应运用易于理解语言和图表,并适合在紧急情况下使用;
——明确性:预案应采用清晰的结构,对资源进行清楚的描述,工作内容和步骤应具体,每项工作应有明确的责任人;
——有效性:预案应尽可能满足灾难发生时进行恢复的实际需要,并保持与实际系统和人员组织的同步更新;
——兼容性:灾难恢复预案应与其它应急预案体系有机结合。在灾难恢复预案制定原则的指导下,其制定过程如下:
——起草:参照附录B 灾难恢复预案框架,按照风险分析和业务影响分析所确定的灾难恢复内容, 根据灾难恢复能力等级的要求,结合组织其它相关的应急预案,撰写出灾难恢复预案的初稿;
——评审:组织应对灾难恢复预案初稿的完整性、易用性、明确性、有效性和兼容性进行严格的评审。评审应有相应的流程保证;
——测试:应预先制定测试计划,在计划中说明测试的案例。测试应包含基本单元测试、关联测试和整体测试。测试的整个过程应有详细的记录,并形成测试报告;
——完善:根据评审和测试结果,纠正在初稿评审过程和测试中发现的问题和缺陷,形成预案的审批稿;
——审核和批准:由灾难恢复领导小组对审批稿进行审核和批准,确定为预案的执行稿。
7.5.2 灾难恢复预案的教育、培训和演练
为了使相关人员了解信息系统灾难恢复的目标和流程,熟悉灾难恢复的操作规程,组织应按以下要求,组织灾难恢复预案的教育、培训和演练:
——在灾难恢复规划的初期就应开始灾难恢复观念的宣传教育工作;
——预先对培训需求进行评估,包括培训的频次和范围,开发和落实相应的培训/教育课程,保证课程内容与预案的要求相一致,事后保留培训的记录;
——预先制定演练计划,在计划中说明演练的场景;
——演练的整个过程应有详细的记录,并形成报告;
——每年应至少完成一次有最终用户参与的完整演练。
7.5.3 灾难恢复预案的管理
经过审核和批准的灾难恢复预案,应按照以下原则进行保存和分发:
——由专人负责;
——具有多份拷贝在不同的地点保存;
——分发给参与灾难恢复工作的所有人员;
——在每次修订后所有拷贝统一更新,并保留一套,以备查阅;
——旧版本应按有关规定销毁。
为了保证灾难恢复预案的有效性,应从以下方面对灾难恢复预案进行严格的维护和变更管理:
——业务流程的变化、信息系统的变更、人员的变更都应在灾难恢复预案中及时反映;
——预案在测试、演练和灾难发生后实际执行时,其过程均应有详细的记录,并应对测试、演练和执行的效果进行评估,同时对预案进行相应的修订;
——灾难恢复预案应定期评审和修订,至少每年一次。
附 录 A
(规范性附录) 灾难恢复能力等级划分
A.1 第1级 基本支持
第1级灾难恢复能力应具有技术和管理支持如表A.1所示。
表 A.1 第 1 级——基本支持
要素 |
要求 |
数据备份系统 |
a) 完全数据备份至少每周一次; b) 备份介质场外存放。 |
备用数据处理系统 |
— |
备用网络系统 |
— |
备用基础设施 |
有符合介质存放条件的场地。 |
专业技术支持能力 |
— |
运行维护管理能力 |
a) 有介质存取、验证和转储管理制度; b) 按介质特性对备份数据进行定期的有效性验证。 |
灾难恢复预案 |
有相应的经过完整测试和演练的灾难恢复预案 |
注:“—”表示不作要求 |
A.2 第2级 备用场地支持
第2级灾难恢复能力应具有技术和管理支持如表A.2所示。
表 A.2 第 2 级——备用场地支持
要素 |
要求 |
数据备份系统 |
a) 完全数据备份至少每周一次; b) 备份介质场外存放。 |
备用数据处理系统 |
配备灾难恢复所需的部分数据处理设备,或灾难发生后能在 预定时间内调配所需的数据处理设备到备用场地。 |
备用网络系统 |
配备部分通信线路和相应的网络设备,或灾难发生后能在预 定时间内调配所需的通信线路和网络设备到备用场地。 |
备用基础设施 |
a) 有符合介质存放条件的场地; b) 有满足信息系统和关键业务功能恢复运作要求的场地。 |
专业技术支持能力 |
— |
运行维护管理能力 |
a) 有介质存取、验证和转储管理制度; b) 按介质特性对备份数据进行定期的有效性验证; c) 有备用站点管理制度; d) 与相关厂商有符合灾难恢复时间要求的紧急供货协议; e) 与相关运营商有符合灾难恢复时间要求的备用通信线路协议。 |
灾难恢复预案 |
有相应的经过完整测试和演练的灾难恢复预案。 |
注:“—”表示不作要求 |
A.3 第3级 电子传输和部分设备支持
第3级灾难恢复能力应具有技术和管理支持如表A.3所示。
表 A.3 第 3 级——电子传输和部分设备支持
要素 |
要求 |
数据备份系统 |
a) 完全数据备份至少每天一次; b) 备份介质场外存放; c) 每天多次利用通信网络将关键数据定时批量传送至备用场地。 |
备用数据处理系统 |
配备灾难恢复所需的部分数据处理设备。 |
备用网络系统 |
配备部分通信线路和相应的网络设备。 |
备用基础设施 |
a) 有符合介质存放条件的场地; b) 有满足信息系统和关键业务功能恢复运作要求的场地。 |
专业技术支持能力 |
在灾难备份中心有专职的计算机机房运行管理人员。 |
运行维护管理能力 |
a) 按介质特性对备份数据进行定期的有效性验证; b) 有介质存取、验证和转储管理制度; c) 有备用计算机机房管理制度; d) 有备用数据处理设备硬件维护管理制度; e) 有电子传输数据备份系统运行管理制度。 |
灾难恢复预案 |
有相应的经过完整测试和演练的灾难恢复预案。 |
A.4 第4级 电子传输及完整设备支持
第4级灾难恢复能力应具有技术和管理支持如表A.4所示。
表 A.4 第 4 级——电子传输及完整设备支持
要素 |
要求 |
数据备份系统 |
a) 完全数据备份至少每天一次; b) 备份介质场外存放; c) 每天多次利用通信网络将关键数据定时批量传送至备用场地。 |
备用数据处理系统 |
配备灾难恢复所需的全部数据处理设备,并处于就绪状态或 运行状态。 |
备用网络系统 |
a) 配备灾难恢复所需的通信线路; b) 配备灾难恢复所需的网络设备,并处于就绪状态。 |
备用基础设施 |
a) 有符合介质存放条件的场地; b) 有符合备用数据处理系统和备用网络设备运行要求的场地; c) 有满足关键业务功能恢复运作要求的场地; d) 以上场地应保持7x24小时运作。 |
专业技术支持能力 |
在灾难备份中心有: a) 7x24小时专职计算机机房管理人员; b) 专职数据备份技术支持人员; c) 专职硬件、网络技术支持人员。 |
运行维护管理能力 |
a) 有介质存取、验证和转储管理制度; b) 按介质特性对备份数据进行定期的有效性验证; c) 有备用计算机机房运行管理制度; |
|
d) 有硬件和网络运行管理制度; e) 有电子传输数据备份系统运行管理制度。 |
灾难恢复预案 |
有相应的经过完整测试和演练的灾难恢复预案。 |
A.5 第5级 实时数据传输及完整设备支持
第五级灾难恢复能力应具有技术和管理支持如表A.5所示。
表 A.5 第 5 级——实时数据传输及完整设备支持
要素 |
要求 |
数据备份系统 |
a) 完全数据备份至少每天一次; b) 备份介质场外存放; c) 采用远程数据复制技术,并利用通信网络将关键数据实时复制到备用场地。 |
备用数据处理系统 |
配备灾难恢复所需的全部数据处理设备,并处于就绪或运行 状态。 |
备用网络系统 |
a) 配备灾难恢复所需的通信线路; b) 配备灾难恢复所需的网络设备,并处于就绪状态; c) 具备通信网络自动或集中切换能力。 |
备用基础设施 |
a) 有符合介质存放条件的场地; b) 有符合备用数据处理系统和备用网络设备运行要求的场地; c) 有满足关键业务功能恢复运作要求的场地; a) 以上场地应保持7x24小时运作。 |
专业技术支持能力 |
在灾难备份中心7x24小时有专职的: a) 计算机机房管理人员; b) 数据备份技术支持人员; c) 硬件、网络技术支持人员。 |
运行维护管理能力 |
a) 有介质存取、验证和转储管理制度; b) 按介质特性对备份数据进行定期的有效性验证; c) 有备用计算机机房运行管理制度; d) 有硬件和网络运行管理制度; e) 有实时数据备份系统运行管理制度。 |
灾难恢复预案 |
有相应的经过完整测试和演练的灾难恢复预案。 |
A.6 第6级 数据零丢失和远程集群支持
第六级灾难恢复能力应具有技术和管理支持如表A.6所示。
表 A.6 第 6 级——数据零丢失和远程集群支持
要素 |
要求 |
数据备份系统 |
a) 完全数据备份至少每天一次; b) 备份介质场外存放; c) 远程实时备份,实现数据零丢失。 |
备用数据处理系统 |
a) 备用数据处理系统具备与生产数据处理系统一致的处理能力并完全兼容; b) 应用软件是“集群的”,可实时无缝切换; c) 具备远程集群系统的实时监控和自动切换能力。 |
备用网络系统 |
a) 配备与主系统相同等级的通信线路和网络设备; b) 备用网络处于运行状态; c) 最终用户可通过网络同时接入主、备中心。 |
备用基础设施 |
a) 有符合介质存放条件的场地; b) 有符合备用数据处理系统和备用网络设备运行要求的场地; c) 有满足关键业务功能恢复运作要求的场地; d) 以上场地应保持7x24小时运作。 |
专业技术支持能力 |
在灾难备份中心7x24小时有专职的: a) 计算机机房管理人员; b) 专职数据备份技术支持人员; c) 专职硬件、网络技术支持人员; d) 专职操作系统、数据库和应用软件技术支持人员。 |
运行维护管理能力 |
a) 有介质存取、验证和转储管理制度; b) 按介质特性对备份数据进行定期的有效性验证; c) 有备用计算机机房运行管理制度; d) 有硬件和网络运行管理制度; e) 有实时数据备份系统运行管理制度; f) 有操作系统、数据库和应用软件运行管理制度。 |
灾难恢复预案 |
有相应的经过完整测试和演练的灾难恢复预案。 |
A.7 灾难恢复能力等级评定原则
如要达到某个灾难恢复能力等级,应同时满足该等级中7个要素的相应要求。
A.8 灾难备份中心的等级
灾难备份中心的等级等于其可支持的灾难恢复最高等级。示例:可支持1至5级的灾难备份中心的级别为5级。
附 录 B
(资料性附录)灾难恢复预案框架
B.1 目标和范围
定义灾难恢复预案中的相关术语和方法论,并说明灾难恢复的目标,如恢复时间目标(RTO)和恢复点目标(RPO)。说明预案的作用范围,解决哪些问题,不解决哪些问题。
B.2 组织和职责
描述灾难恢复组织的组成、各个岗位的职责和人员名单。灾难恢复组织应包括应急响应组、灾难恢复组等。
B.3 联络与通讯
列出灾难恢复相关人员和组织的联络表。包含灾难恢复团队、运营商、厂商、主管部门、媒体、员工家属等。联络方式包括固定电话、移动电话、对讲机、电子邮件和住址等。
B.4 突发事件响应流程
B.4.1 事件通告
任何人员在发现信息系统相关突发事件发生或即将发生时,应按预定的流程报告相关人员,并由相关人员进行初步判断、通知和处置。
B.4.2 人员疏散
提供指定的集合地点和替代的集合地点,还包括通知人员撤离的办法,撤离的组织和步骤等。
B.4.3 损害评估
在突发事件发生后,应由应急响应组的损害评估人员,确定事态的严重程度。由灾难恢复责任人召集相应的专业人员对突发事件进行慎重评估,确认突发事件对信息系统造成的影响程度,确定下一步将要采取的行动。一旦系统的影响被确定,应将最新信息按照预定的通告流程通知给相应的团队。
B.4.4 灾难宣告
应预先制定灾难恢复预案启动的条件。当损害评估的结果达到一项或多项启动条件时,组织将正式发出灾难宣告,宣布启动灾难恢复预案,并根据宣告流程通知各有关部门。
B.5 恢复及重续运行流程
B.5.1 恢复
按照业务影响分析中确定的优先顺序,在灾难备份中心恢复支持关键业务功能的数据、数据处理系统和网络系统。描述时间、地点、人员、设备和每一步的详细操作步骤,同时还包括特定情况发生时各团队之间进行协调的指令,以及异常处理流程。
B.5.2 重续运行
灾难备份中心的系统替代主系统,支持关键业务功能的提供。这一阶段包含主系统运行管理所涉及的主要工作,包含重续运行的所有操作流程和规章制度。
B.6 灾后重建和回退
最后阶段是主中心的重建工作,中止灾难备份系统的运行,回退到组织的主系统。
B.7 预案的保障条件
预案的保障条件如下:
——专业技术保障;
——通信保障;
——后勤保障。
B.8 预案附录
预案的附录如下:
——人员疏散计划;
——产品说明书;
——信息系统标准操作流程;
——服务级别协议和备忘录;
——资源清单;
——业务影响分析报告;
——预案的保存和分发办法。
附 录 C
(资料性附录)
某行业 RTO/RPO 与灾难恢复能力等级的关系示例
C.1 RTO/RPO与灾难恢复能力等级的关系
表C.1说明信息系统灾难恢复各等级对应的RTO/RPO范围。
表 C.1 RTO/RPO 与灾难恢复能力等级的关系
灾难恢复能力等 级 |
RTO |
RPO |
1 |
2天以上 |
1天至7天 |
2 |
24小时以上 |
1天至7天 |
3 |
12小时以上 |
数小时至1天 |
4 |
数小时至2天 |
数小时至1天 |
5 |
数分钟至2天 |
0至30分钟 |
6 |
数分钟 |
0 |