灾难大师:基本入门为SMB提供分步恢复计划

灾难恢复计划似乎是一个抽象的概念,但是对于确保中断期间的业务连续性来说,对它的需求是至关重要的。洪水或火灾等意外事件会启动应急计划。我们在这里提供了一个从计划到实施的灾难恢复的实用指南。

通过Mark Shurr, Ada Business Technology的副总裁 二九年一月二十一日

灾难恢复计划似乎是一个抽象的概念,但是对于确保中断期间的业务连续性来说,对它的需求是至关重要的。洪水或火灾等意外事件会启动应急计划。这里介绍的是灾难恢复的实用指南,从规划到实施。

你的第一个问题:为什么要制定计划?

灾难以各种形式出现:天气风暴、停电、火灾和洪水。企业必须确定宕机将如何影响组织。高级管理人员有责任确定将投资于灾难恢复计划以确保成功的资源。

灾难确实会发生,我们必须做好应对的准备。在过去的20年里,我遇到过几次停电,从简单的电气故障到持续数天的重大中断。如果没有一个经过彻底测试的计划,就会对业务产生严重的影响。

帮助

一个成功的灾难恢复计划需要高级管理层的支持。如果没有管理团队的支持和合作,当灾难发生时,该计划的效果将有限。

需要建立一个团队,并必须制定一份手册,详细说明对每种类型事件的响应。团队应该由来自所有关键领域的知识渊博的用户和管理人员组成,包括IT。他们的目标是确定发生事件时采取的最佳行动方案。

应该审查和记录各种场景。应该开发表单,使企业能够手动记录事务,以便最终更新到计算机系统。

灾难恢复手册应该包括以下几点:

•应急计划概述;

•短期、中期和长期事件的定义;

•由高级管理层批准的官方政策;

•关键资源报表;

•计划确保关键资源;

•理解并接受职责定义;

•完成灾前和灾后活动的详细书面程序;而且

•一种方法,以确保计划可以立即实施。

短期中断是指对主要业务组件影响不到一天的中断。中期情景通常持续几天以上,但有明确的结局。长期停电的定义是需要在远离主要设施的地方运行。

备份与恢复

介质存储规划的第一步是识别服务器和pc上的信息,并进行备份。适用于服务器的备份和恢复保障措施也必须适用于关键pc。

电脑备份
现在有很多备份pc和服务器的方法。一些最经济的备份电脑的方式是u盘驱动器和闪存驱动器。这些方法可以很好地完成工作,但会带来安全问题。首选的方法是使用网络驱动器来确保定期归档用户数据。

服务器备份

传统上,服务器备份执行到磁带存储设备。在过去的几年中,所需的存储量以及24/7提供存储的需求有了巨大的增长。因此,可能需要考虑其他方法。一种方法是备份到远程备份服务器。另一种方法是将数据备份到远程数据存储设施,这是由于高速加密互联网接入的出现而成为可能。备份应储存在一个认证的安全地点。

高可用性

许多组织无法承受任何“停机时间”。高可用性现在不仅仅是一个流行词:它是一种需求。HA需要服务器、应用程序、数据和网络的虚拟复制。甚至可以修改遗留应用程序,通过记录关键数据库来支持高可用性解决方案。

短期的计划

对计算机中心的短期中断需要进行分析,以确定实施下列保障措施的成本效益:

•不间断电源(UPS);

•备用发电机;

•备选语音和数据通信路径。

短期计划必须包括所有人员和主要供应商的联系名单。

中期

在许多方面,计划和恢复过程类似于短期计划。今天,许多组织为他们的语音和数据部署了高速电路。这些线路在停机期间可能不可用。企业应该有固定电话线路,以备停电时使用。高速语音和数据电路应与备用供应商备份,以便在发生故障时能够快速迁移网络。必须考虑到是否有对中期事件作出反应所需的人员。

长期规划

长期事件是最难应对的,需要临时搬迁计算机设施和人员。必须与商业灾难恢复公司、业务伙伴或远程工厂达成协议,并且必须每年进行测试。备份配置必须包括可比较的硬件、软件和通信网络。可能需要应用程序密钥和证书。

业务单元必须每年测试其灾难恢复操作计划。

在重大停机期间,关键功能区域必须能够继续开展业务。

当站点恢复并准备重新联机时,必须彻底测试所有系统。可能需要从备份站点重新加载数据。应该有一个预定义的流程来确认站点已经准备就绪。

结论
所有制造组织都必须解决灾难恢复问题。最好的开始是制定一个跨职能部门的计划。应该成立一个委员会来制定和维护计划,并定期对其进行测试。每个参与的人都必须彻底了解自己的角色,并在灾难发生时能够执行这些任务。

作者简介:

Mark Shurr, Ada Business Technology副总裁,拥有超过20年的IT高管经验,包括在财富1000强国际公司任职。可以在……找到他mshurr@AdaBusTech.com