图8. 容灾组织架构图
由领导小组指挥,业务恢复团队和业务恢复团队分别执行应急响应计划、灾难恢复计划、业务恢复计划,运营管理团队负责容灾系统的运营管理和日常维护、问题收集和解决、系统变更和测试演练等工作,后勤保障和人力资源保障提供支持,从而达到容灾设计的目标。 阶段七、容灾系统运行管理维护
在本阶段,容灾系统运行管理维护主要分为日常运行阶段、应急和恢复阶段及接替生产运营服务阶段
图9:容灾系统运营管理阶段划分
参照国际IT服务管理最佳实践ITIL的标准(具体内容见下图),金税工程
(三期)容灾系统的运行管理应满足三大要求:
? 高度响应要求。
高响应要求是金税工程(三期)容灾系统运营管理的重中之重,也是对金税工程(三期)容灾系统灾难恢复系统运营管理队伍的最直接考验,其关注的是提供支持的及时性与工作导向。当宣告灾难恢复后,只有高响应度的容灾系统,才能够按既定的操作流程在第一时间为发生灾难的国地税数据中心进行应急与切换工作,并根据发生灾难的国地税数据中心的特殊要求提出合理的解决方案并接替生产运营,尽最大可能减轻灾难事件造成的影响。
? 高度可靠性要求
高度可靠性要求是金税工程(三期)容灾系统的基本保障,从管理手段和操作流程上保证响应度与可用性的落地。具体体现在对现有人员、资源与技术在执行层面上的标准化、制度化、规范化,才能在不可预测的灾难事件发生时,容灾灾备系统能够真正意义地起到灾难恢复、业务连续的保障作用。
? 高度可用性要求
高度可用性要求是运营管理体系的基础,从容灾中心资源、业务正常处理流程与人员的支持上为应急响应、系统切换与接替生产运行的服务工作奠定基础。
图10: 容灾系统运营管理体系
阶段八、演练、测试
任何制订的计划,都必须经过不断的测试和修正,才能满足信息系统不断发
展的需求。同时,通过测试过程,也能够使内部各部门及人员熟悉自己在业务连续性计划中所扮演的角色,做到胸有成竹,才能够在灾难真正发生的时刻有条不紊地开展恢复的过程。
测试的过程可以分为“纸上谈兵”和实地演习两种方式,根据需要及对业务影响的不同分别采用。
需要注意的是,无论平时的测试如何完善,也没有办法预测可能发生的灾难情况。关键人员的损失或者关键文档的丢失,都有可能对灾难恢复计划的执行造成巨大影响。因此,在灾难演练过程中要注意到人员的交叉备份情况,除了每个人自己所担负的责任外,尽量做到关键步骤有后备人选作为应变。
三、 容灾项目各阶段主要工作内容
容灾项目建设是一个系统工程,包含一系列的工作及计划的制订,包括业务连续性计划、业务恢复计划BRP,应急响应计划、灾难恢复计划(DRP)等内容。
相比于其它机构和领域,信息系统更容易受到各种灾难的伤害而导致中断,特别是在许多情况下,关键资源可能属于不可控范围(如电力系统中断和通讯系统中断),于是有效的灾难恢复计划、履行计划和对计划进行有效地测试对于削减系统风险与各种服务的不可用性就显得非常重要了。为了保证业务连续性计划和灾难恢复计划的成功执行,容灾体系的管理者应该做到以下几点:
1. 理解灾难恢复计划和业务连续性计划的全部过程及其在整个运行连续性计划和业务连续性计划过程中的地位。
2. 制定或复查其应急策略及计划过程并运用计划周期要素,包括预备计划、业务影响分析和容灾恢复策略等。
3. 制定和复查其灾难恢复计划策略,重点在于计划的维护、培训以及对应急计划的演练。
灾难恢复计划描述
灾难恢复预案 (Disaster Recovery Plan),是指当灾难发生时,迅速采取措施,确保关键业务系统能够持续进行,尽量减少企业的业务损失的计划或框架。灾难恢复测试和演练将以灾难恢复预案为基础进行。
灾难恢复预案需具有清晰的结构和详细的行动步骤,包括所需行动的检查表、角色的解释和资源的定义等。不同职责的人员都有其说明各自的行动步骤的灾难恢复预案文档,所有的灾难恢复预案的统一执行,将保证金税工程(三期)税收业务运行恢复正常,帮助各税务部门达到其业务连续运作的目标。 灾难恢复计划阶段描述
分析评估
评估金税工程(三期)容灾系统的恢复目标、实现方案、系统架构、行动计划和操作流程等资料,建立相应的预案模板,确定哪些是目前金税工程(三期)
相关推荐: