【转】我国金融业的灾难备份现状

一、我国金融业的灾难备份现状

人民银行1998年在无锡建立了灾备中心,并于2001年完成全国电子联行系统的灾难备份系统,2005年实现支付系统的无锡灾难备份系统。目前在上海建立了完善的支付系统异地灾难备份中心。四大国有商业银行和银联也已经或正在建灾难备份系统,具体情况见表。
其他商业银行也都在建设信息系统的灾难备份中心。如招商银行信息系统的主运行中心在深圳,异地灾难备份系统在南京;交通银行主运行中心在上海,且建设了同城灾难备份中心,并正在筹建异地灾难备份中心。

二、我国金融信息系统运行及故障分析

我国金融信息系统所涉及的金融业务种类繁多,如果从信息系统本身的可靠性分析,现有信息系统分为如下几种。
1.单机系统运行
该模式运行风险最大、可靠性最差,没有抵御系统故障和突发灾难的能力。一旦系统因任何原因出现故障,业务就要停止,且系统及业务数据无法恢复。
2.单机系统运行,每天做业务数据备份
当系统出现故障时,首先重建或恢复系统,然后恢复昨天以前备份的业务数据。在这种情况下,系统可以恢复,但时间较长;业务数据可以恢复,但会丢失半天或一天的数据。
3.冷备份系统
冷备份系统包括两种情况。一是除运行系统外还安装一套和运行系统一样的备份系统。一旦运行系统出现故障,启动备份系统,将备份的业务数据在备份系统中恢复,用备份系统的应用系统代替原运行系统,保证业务的连续运行。
另一种情况是在运行系统运行时,备份系统也处于运行状态。虽然备份系统中的应用系统不运行,但系统软件都在运行,且运行系统每隔一定时间会把业务数据的增量数据备份到备份系统。一旦运行系统出现故障,直接启动备份系统来代运行系统。
4.双机热备份
双机热备份是安装两套信息系统,一般用磁盘阵列或存储区域网络(SAN)来做业务数据的存储系统。有些系统将数据库也安装在磁盘阵列或SAN上, 并且安装热备份软件。系统和业务数据都不需要在热备份系统上恢复,从故障系统将业务切换到热备份系统只需几分钟时间。双机热备份系统当一套系统有故障而切 换到另一套系统后,数据不会丢失。
尽管双机热备份系统解决了主机系统等出现故障后的业务连续性问题,对于电源、网络故障,特别是自然灾难引起的故障如地震、火灾、水灾、台风飓风等以及战争、恐怖袭击等引起故障都还没有任何解决办法。对于要防止这些故障的信息系统,就要建立灾难备份中心。
5.灾难备份中心
灾难备份中心分为同城灾难备份中心和异地灾难备份中心。如果建立了同城灾难备份中心,当运行信息系统运行时,可以同步将业务数据和相关信息传送到 同城灾难备份中心的备份信息系统中。一旦运行中心因故障不能正常运行时,同城灾难备份中心可以很快接管运行中心的系统继续运行,而且不会丢失业务数据。也 可以用异步备份、每天一次或定期备份的形式,虽然建设成本低,但切换到同城灾难备份中心后,业务数据会有一定丢失。
同城灾难备份用于城市局部地方发生灾难时的应急备份措施。对于地震、水灾、台风、飓风以及战争等灾难,需要进行异地灾难备份。
异地灾难备份中心和运行中心不在一个城市,而且距离要远。一旦运行中心的城市发生灾难,业务可以在异地灾难备份中心继续运行,虽然可能丢失数据,但可以保证业务的不间断连续运行。

三、目前灾难备份的主要技术

一个完整的灾难备份系统主要由数据备份系统、备份数据处理系统、备份通信网络系统和完善的灾难恢复计划所组成。在灾难备份系统建设中,数据备份是关键,如何将数据完整地实时复制到灾难备份中心,是金融单位灾难备份建设中需要重点考虑的问题。
目前,灾难备份技术主要有两种,一是基于磁盘系统的硬件方式灾难备份技术,二是软件方式的灾难备份技术。
1.基于磁盘系统的灾难备份技术
基于磁盘系统的远程数据备份技术是以磁盘系统为基础,利用磁盘控制器提供的功能,采用磁盘镜像技术在物理磁盘卷级上实现两地磁盘机之间数据的复 制。这种方式独立于主机和主机操作系统,不占用主机CPU、主机通道和网络资源,对应用透明,不需要对现有应用系统做任何改动和变化。为保证数据的及时 性、完整性和系统性能之间的平衡,基于磁盘系统的远程数据备份主要有两种工作方式。
同步数据复制模式:来自处理器的更新数据在被写入本地连接的磁盘系统前,通过磁盘镜像技术,将更新数据转发至异地磁盘系统中。只有更新数据在两个 磁盘系统完成写操作后,本地磁盘系统才会向处理器返回写完成指令,确保两地磁盘系统数据的一致性、完整性,无数据丢失。在同步数据复制模式下,应用系统会 因等待写I/O操作完成而被延迟。
异步数据复制模式:来自处理器的更新数据首先被写入本地连接的磁盘系统,并立即向处理器返回一个I/O写完成指示,其后磁盘镜像系统在很短的时间内,将更新数据发送至异地磁盘系统。异步数据复制模式对应用程序性能影响最小,但远程磁盘系统的数据和本地磁盘系统相比有延迟。
磁盘镜像数据复制支持几乎所有的主机平台,能够有效地实现操作系统、程序、数据库和文件系统的复制功能。
2.基于软件方式的灾难备份技术
软件方式的灾难备份技术是操作系统级的灾难备份解决方案,它与操作系统平台相关,但对应用程序透明。它通过通信网络,实现数据在两个不同地点间的实时备份。下面针对不同的系统平台分别介绍软件方式的灾难备份技术。
S/390 平台的软件方式灾难备份技术:异地并行耦合系统(GDPS)是目前IBM S/390平台较为完善的灾难备份技术。GDPS将S/390的并行Sysplex技术与磁盘系统远程数据复制技术(PPRC或XRC)集成在一起,并通 过多系统耦合技术,组成完整的灾难备份与恢复整体解决方案,使客户的生产系统在灾难发生的情况下快速恢复。
AS/400平台的软件方式灾难备份技术:一般利用AS400的数据库日志和目标日志,通过一定的数据备份技术,将更新的日志实时传送到远程异地AS400上,不断更新异地AS400上的数据库和目标,使灾难备份中心可实时拥有一套完整的可供灾难恢复的数据库和应用系统。
目前业界的主要热备份产品不仅具有本地的双机实时热备份和灾难恢复功能,还被广泛用于实现本地或异地一对一、一对多的备份形式,实现多台 AS400的相互数据镜像。其主要技术特点有:备份数据的实时更新,保证数据及时、完整、可用;满足不同距离的灾难备份要求;迅速恢复业务处理系统,保证 业务连续运作;提供灵活快速的备份通信网络系统。
UNIX 平台的软件方式灾难备份技术: 该技术独立于硬件存储设备,利用软件的复制功能特性,提供逻辑卷级和文件系统级的远程数据复制能力。它可通过IP网络将数据及时复制到异地灾难备份中心, 确保用户备份数据的及时性和完整性。如果同时结合相应的灾难恢复软件功能,一旦电脑中心发生灾难,灾备中心的主机可自动(或手动)接管电脑中心主机的运行 并提供服务,确保业务的连续性,把意外灾难造成的损失降至最低。
其主要特点:支持数据在两个地点之间实时镜像,两地点之间距离没有限制; 支持所有数据库和文件类型,对应用程序明; 数据复制基于TCP/IP网络; 只复制实际发生变化的数据;有效地利用网络资源,并使数据复制通信量降至最低水平; 无论是同步模式还是异步模式,都能确保备份数据的完整性; 当灾难发生时,在备份地点可自动恢复应用。
3.其他灾难备份技术解决方案
对于数据的远程复制,还有如下数据远程复制技术解决方案:通过磁带库技术实现数据远程备份解决方案;数据库镜像技术解决方案等。灾难备份的另外一 个核心技术是数据的存储备份。存储优化是提高灾难备份系统性能的重要指标之一。目前比较通用的优化技术有直接连接存储(DAS)、网络连接存储 (NAS)、存储区域网络(SAN)。

四、灾难备份建设的主要流程
1.建立专门的灾难备份机构
实施灾难备份应由董事会或高级管理层决策,指定高层管理人员组织实施。由科技、业务、财务、后勤等支持并与灾难备份相关的部门组成专门机构。
2.分析灾难备份需求
重要信息系统灾难备份需求分析应包括对数据处理中心的风险分析和对重要信息系统的业务分析,以确定灾难恢复目标。
数据处理中心风险分析:明确防范风险的技术与管理手段。确定需要采取灾难恢复的类型,如灾备中心距离,数据备份方式和频率等。
业务分析:分析各项业务停业将造成的损失,须考虑流失客户、损失营业额、企业形象、法律纠纷、社会安定等因素。分析每项业务停顿的最大容忍时间;分析各项业务的恢复优先级;分析各项业务的相关性;分析可接受的交易丢失程度。
确定灾难恢复目标:确定恢复业务品种范围及优先级。确定灾难备份中心及服务界面的恢复时限。确定需要恢复的服务网点和服务渠道。
3.制订灾难备份方案
一个完整的灾难备份方案的设计基于灾难备份需求分析所得出的各业务系统灾难恢复目标,可能涉及多个级别的应用,并且需要考虑技术手段、投资成本、管理方式等多方面的因素。
数据备份方案:根据灾难备份需求分析所确定的业务恢复时间和交易丢失程度确定对数据备份的要求。根据应用的重要级别、最大停顿时间、数据传输量、最大数据丢失度、数据相关性、应用相关性确定数据备份方案。
备份处理系统:灾难备份应根据重要信息系统灾难备份需求配置相应的备份处理系统。根据数据备份方案确定相应的数据备份所需的主机、存储、网络、系 统、软件等。根据灾难恢复应用对主机系统、磁盘系统、磁带备份、打印及外围设备的需求确定硬件配置。根据服务界面的范围、备份网络拓扑结构、网络传输速率 需求、网络切换方式、网络恢复时间要求以及本地的网络通信状况确定网络配置。
灾难备份中心建设:配备了各种资源在灾难发生时接替数据处理中心运行的计算机处理中心。重要信息系统可采用自行建设、联合建设和租用商业化灾难备份中心的模式。
规程与管理制度:包括数据备份日常管理制度、备份数据保存制度、灾难备份切换流程、灾难备份系统变更管理规程以及人力资源规程等。重要信息系统需要制订有关灾难备份与灾难恢复的各项规程和管理制度,同时修改数据处理中心原有规程和管理制度以确保灾难恢复的成功。
4.实施灾难备份方案
其主要目标是按照所制订的灾难备份方案,完成灾难备份工作。在实施过程中,要严格按照灾难备份方案的要求和内容进行,落实相应的规章制度,应用灾难备份方案,建设并运行灾难备份中心。
5.制订灾难恢复计划
其主要目的是规范灾难恢复流程,使重要信息系统在灾难发生后能够快速恢复数据处理系统的运行和业务运作。同时,重要的信息系统可以根据灾难恢复计划对其数据处理中心的灾难恢复能力进行测试,并将灾难恢复计划作为相关人员的培训资料之一。
6.保持灾难恢复计划持续可用
灾难恢复计划制订后,为保证计划的可用性和完整性,需要形成工作底稿,制订变更管理流程、定期审核制度和定期演练制度。


Total views.

© 2013 - 2018. All rights reserved.

Powered by Hydejack v6.6.1