面对天灾人祸,企业应及早做好灾难备份工作
2008年上半年,南方特大暴风雪和四川大地震给当地企业带来了严重损失。由于长期停电,一些身在灾区的企业总部数据中心无法跟全国各地的分公司进行业务联系。这种自然灾难的突发,往往让企业措手不及。除此之外,许多人为灾难也让企业防不胜防。
灾难很可怕,但更可怕的是没有应对灾难的措施。如今,企业信息化程度越来越高,连一些小企业也有数台计算机,存储经营数据和客户信息,这些都是企业最重要的财产。因此,企业需要有一份灾难恢复计划,尽量拥有自己的灾难恢复方案,让所有的重要数据从此高枕无忧。
当然,企业遭遇天灾的概率比较小,更多的是遇到各种事故。比如,某一天,证券公司的交易数据因操作失误而损坏﹔保险公司的所有保单数据因电源故障而丢失﹔石油勘探公司辛苦一年获取的地质数据因人为的恶意操作而丢失﹔医院保存的所有病历因为磁带的损坏而无法使用……这样的例子举不胜举。
诸如此类的事故,会给企业带来什么后果﹖IBM 全球信息科技服务部中国区业务连续与灾难恢复服务资深专家夏珺说,至少,很难想象这个不幸的企业还能毫发无损地健康生存。因为,对于信息时代的企业而言,健全的信息往往是维持运转所必需的基本条件。灾难发生对企业的影响非常大,尤其是那些没有灾难备份的企业。IDC 的统计数字表明,在 2000 年以前的 10 年间发生过灾难的美国公司中,有 55% 当时倒闭。剩下的 45% 中,因为数据丢失,有 29% 也在两年之内倒闭,生存下来的仅占 16%。国际调查机构 Gartner Group 的数据表明,在大型灾难导致系统停运的公司中,有 2/5 再也没有恢复运营,剩下的公司中也有 1/3 在两年内破产。美国得克萨斯州大学的调查显示,“只有 6% 的公司可以在数据丢失后生存下来,43% 的公司会彻底关门,51% 的公司会在两年之内消失。”另一份针对这一课题的研究报告也显示:灾难之后,如果无法在 14 天内恢复信息作业,有 75% 的公司业务会完全停顿,43% 的公司再也无法重新开业,20% 的企业在两年之内被迫宣告破产。美国明尼苏达大学的研究也表明,在遭遇灾难同时又没有灾难恢复计划的企业中,将有超过 60% 的企业在两到三年后退出市场。而随企业对数据处理依赖程度的递增,这一比例还有上升的趋势。
灾难会给企业造成重大伤害,原因在于现代企业对于 IT 系统的依赖程度越来越大,而企业的 IT 系统大部分都基于集中方式建设。鉴于信息资源对企业的宝贵作用,我们不妨把它们比作一枚枚金蛋,而信息基础设施就是用来装这些金蛋的篮子。对于分布式系统,不同的金蛋分布在不同地域的篮子里,而 IT 系统集中建设所带来的信息基础设施整合,则意味我们将把越来越多的金蛋放进同一个篮子。如果这个篮子翻了,怎么办﹖覆巢之下,焉有完卵﹖
面对灾难,美国等西方国家的灾难备份系统已经很成熟。与他们比起来,中国的灾难备份建设起步较晚。早在上个世纪 70 年代,美国就有了“灾备”概念和相关服务企业。在信息技术较发达的欧美国家,均对银行在保证数据完整性及业务连续性方面的责任做出了明确规定。在美国,金融管理局﹙OCC﹚每隔 18 个月就对金融机构的灾难备份情况进行审查。在澳大利亚,一家世界著名银行的全球灾备系统有五个灾难备份中心,包括三个全球同城灾备中心,两个全球异地灾备中心。再来看看中国的情况,金融、证券和保险等信息技术发展较好的企业,超过 50% 都建立了不同程度的灾难备份及恢复系统,而其它行业大部分还处于起步阶段。最近两年,国内金融、证券和保险等行业已经能做到 4~6 级,其它行业一般做到 1~3 级﹙灾难备份分级请见附文﹚。
专家指出,一个企业的业务运营只要依赖于信息化系统,该企业就需要具备一定的灾难备份措施。总体来说,银行、电力、铁路、民航、证券、保险、海关、税务、电信、医疗卫生等行业最需要灾难备份系统。
企业如何做好灾难备份系统工作﹖夏珺说,可分为技术与管理咨询两大方面:技术角度切入的灾难备份及恢复,包含服务器和存储架构、网络,数据复制实现,灾难恢复系统监控,切换及测试演练等方面﹔管理咨询角度切入的灾难备份及恢复,包含 IT 恢复流程、业务恢复流程、紧急响应流程、灾难恢复团队建设、公共关系、危机处理等方面。
企业灾难备份项目的建设是一个复杂的系统工程,是网络、物理基础设施、数据保护技术、应用系统、业务流程及组织、IT 系统管理等有机结合的一个整体,缺一不可。不同行业的业务规模不同,对于信息数据的依赖程度也存在差异,因此,不同级别的企业进行灾难备份及恢复系统的建设所需的费用也差异较大,少到几十万元,多至几千万元。
灾难备份项目是一项复杂度很高的项目,其建设需要企业多方参与,涵盖企业中的业务、后勤、财务、攻关、人力资源、IT 等多个部门。从目前情况来看,有部分企业灾备系统的建设是为了应付上级单位的检查,系统建设完毕,没有派专人维护,系统也没有及时更新,因此,实施效果不尽人意。而对于金融领域的企业来说,由于领导重视,绝大部分都引入了专业服务公司提供技术支持,从前期的需求分析、架构设计,到后期的灾备方案实施、灾备演练,为企业业务系统的可持续运行提供了有力的支持和保障。
灾难备份项目千头万绪,需要第三方的服务,但这不是说将企业完全交给服务方。一些特大型集团企业,完全可以自己建造灾备中心。像中远集装箱运输有限公司,就建有灾备中心。对于一些中、小型企业,则没有必要费心费力去建造灾备中心,因为建设灾备中心的最大投资是在基础设施方面。如果异地建设的话,需要建设机房、购买设备,这些设备的耗能也比较大。另一个比较大的支出是人员,现在的灾备中心加上网络、安全体系等各种各样的产品,需要管理员分门别类地有不同的能力和知识,需要的人员相对较多。这些人员还需要相应的培训,企业的支出会很大。在这种情况下,将企业的灾难备份项目交给第三方服务公司,可以做到省心省力。另外,灾难备份项目建设,需要具有丰富的灾备实施经验和灾备管理经验,因此,引入专业 IT 服务公司的服务,可以为前期灾备策略及解决方案的设计、后期灾备方案的实施及运﹙营﹚维﹙护﹚提供全面的服务支持。
企业数据灾备能力差异
目前,国际上将企业数据灾备能力定义出以下 7 级
0 级─无异地备份,数据只在本地存储﹔恢复耗时无法预计,数据可能全部丢失。
1 级─备份磁带通过车辆转移到异地保险库﹔恢复耗时数天到 1 周,数据丢失 1 天以上。
2 级─备份磁带通过车辆转移到异地,并在异地建立备用系统﹔恢复耗时 24 到 72 小时,数据丢失 1 天以上。
3 级─备份数据通过网络传输到异地备援中心﹔恢复耗时 12 到 24 小时,数据丢失 1 天以内。
4 级─利用磁盘数组的快照功能,将数据通过网络备份到异地﹔恢复耗时 4 到 12 小时,数据丢失 4 小时以内。
5 级─本地数据与异地中心相互映像,保持同步﹔恢复耗时 2 到 4 小时,数据丢失 2 小时以内。
6 级─实时备份所有数据和业务,灾难发生时可立即切换接管﹔恢复耗时 1 小时以内,数据丢失接近 0。