金融行业的灾难备份与恢复概要.docx

上传人:b****8 文档编号:9383913 上传时间:2023-05-18 格式:DOCX 页数:13 大小:124.07KB
下载 相关 举报
金融行业的灾难备份与恢复概要.docx_第1页
第1页 / 共13页
金融行业的灾难备份与恢复概要.docx_第2页
第2页 / 共13页
金融行业的灾难备份与恢复概要.docx_第3页
第3页 / 共13页
金融行业的灾难备份与恢复概要.docx_第4页
第4页 / 共13页
金融行业的灾难备份与恢复概要.docx_第5页
第5页 / 共13页
金融行业的灾难备份与恢复概要.docx_第6页
第6页 / 共13页
金融行业的灾难备份与恢复概要.docx_第7页
第7页 / 共13页
金融行业的灾难备份与恢复概要.docx_第8页
第8页 / 共13页
金融行业的灾难备份与恢复概要.docx_第9页
第9页 / 共13页
金融行业的灾难备份与恢复概要.docx_第10页
第10页 / 共13页
金融行业的灾难备份与恢复概要.docx_第11页
第11页 / 共13页
金融行业的灾难备份与恢复概要.docx_第12页
第12页 / 共13页
金融行业的灾难备份与恢复概要.docx_第13页
第13页 / 共13页
亲,该文档总共13页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

金融行业的灾难备份与恢复概要.docx

《金融行业的灾难备份与恢复概要.docx》由会员分享,可在线阅读,更多相关《金融行业的灾难备份与恢复概要.docx(13页珍藏版)》请在冰点文库上搜索。

金融行业的灾难备份与恢复概要.docx

金融行业的灾难备份与恢复概要

收稿日期:

2005-02-08;修返日期:

2005-04-10

基金项目:

国家“十五”科技攻关计划项目(2001BA102A07-04-01

金融行业的灾难备份与恢复

*

岳友宝1

张艳2

李舟军

1

(1.国防科学技术大学计算机学院,湖南长沙410073;2.四川大学数学学院,四川成都610064摘要:

在介绍灾难备份与恢复的基本概念的基础上,分析了目前主要的灾难备份技术以及它们的应用,讨论了金融行业目前灾难备份与恢复中存在的问题,并对灾难备份技术的发展进行了展望。

关键词:

灾难备份与恢复;远程应用级容灾系统;镜像技术

中图法分类号:

TP311文献标识码:

A文章编号:

1001-3695(200602-0104-03

DisasterBackupandRecoveryinFinancialTrade

YUEYou-bao1,ZHANGYan2,LIZhou-Jun1

(1.SchoolofComputerScience,NationalUniversityofDefenseTechnology,ChangshaHunan410073,China;2.SchoolofMathematics,Si-chuanUniversity,ChengduSichuan610064,China

Abstract:

Thispaperintroducestheconceptofdisasterbackupandrecoveryandanalysesthemaindisasterbackuptechnolo-gysandtheirapplication.Itdiscussesthefundamentalproblemsinvolvedinfinancialdisasterrecovery.Finallyitviewsthefu-turedevelopmentofdisasterbackupandrecovery.

Keywords:

DisasterBackupandRecovery;RemoteAppliedLevelDisasterRecoverySystem(RALDRS;MirrorImageTechnology

古人云:

“天有不测风云,人有旦夕祸福”。

1993年美国世贸中心大楼发生的大爆炸导致大楼内350家企业中约有200家企业因无法获取重要的信息而倒闭、消失;后来在2001年的“9・11”事件中,由于有前车之鉴,在世贸中心大楼的许多公司都建立了自己的灾难备份系统。

因此,当灾难再次降临时,这些公司便可及时地通过自己的数据恢复计划来重整旗鼓,但仍有一些企业因无完善的灾备系统而丢失了关键业务数据,造成了惨重的损失,甚至从此退出历史舞台

[1]

当前国内金融

行业纷纷进行“数据大集中”建设,所有关键性业务系统和数据集中在一个数据中心内,使得灾难对企业的杀伤力极大。

由于金融行业自身的特点,业务系统不可用的损失是巨大的,因此灾难恢复的时间是很关键的因素。

金融行业建设业务连续性系统更是一个长远目标。

目前在网络信息安全领域,灾难备份与恢复技术的研究已成为一个备受瞩目的方面,它可以更好地备份和保护重要数据,保证计算机系统的运行安全,更好地为用户提供服务。

1灾难备份与恢复的相关概念

由于IT基础设施的中断而引起业务流程的非计划性中断的事件称为灾难。

灾难备份与恢复是指通过技术和管理的手段,确保在灾难发生后,企业的数据、数据处理系统以及业务系统在短时间内能迅速恢复的过程。

1.1灾难备份的分类

灾难备份的分类方法有很多,这里只介绍与金融系统灾难

备份密切相关的几种方法。

按照距离的远近可以分为同城灾备与异地灾备。

同城灾备的生产中心与灾备中心的距离比较近,比较容易实现数据的同步镜像,保证高度的数据完整性和数据零丢失。

同城灾备一般用于防范火灾、建筑物破坏、供电故障、计算机系统以及人为破坏引起的灾难。

异地灾备主备中心之间的距离较远(一般100km以上,因此一般采用异步镜像,会有少量的数据丢失。

异地灾备不仅可以防范火灾、建筑物破坏等可能遇到的风险隐患,还能够防范战争、地震、水灾等风险。

由于同城灾备和异地灾备各有所长,为达到最理想的防灾效果,像银行这样的金融系统,可考虑采用同城和异地各建立一个灾备中心的方式解决。

按照所保障的内容可以分为数据级容灾和应用级容灾[2]

(灾难备份与恢复系统也称为容灾系统。

数据级容灾系统需要保证用户数据的完整性、可靠性和安全性,提供实时服务的信息系统,用户的服务请求在灾难中会中断。

应用级容灾系统却能提供不间断的应用服务,让客户的服务请求能够透明(客户对灾难的发生毫无觉察地继续运行,保证信息系统提供的服务完整、可靠、安全。

因此金融行业应在数据容灾的基础上构建应用级容灾系统,保证业务系统的不间断运行,为用户提供更好的服务。

1.2远程灾难备份系统的衡量指标

衡量灾难备份的主要技术指标有恢复点目标(RecoveryPointObject,RPO和恢复时间目标(RecoveryTimeObject,RTO。

其中RPO代表灾难发生时丢失的数据量,为尽可能减少数据丢失,需要建立一个远程的数据存储系统,并与生产系统进行数据的镜像备份。

RTO代表系统恢复的时间,为减少

・401・计算机应用研究2006年

系统恢复的时间,需要在数据容灾的基础上,在灾备中心建立一套完整的与生产系统匹配的备份应用系统。

在灾难发生时,灾难备份中心可以迅速接管业务运行,不仅最大限度地降低数据丢失,还最大限度地减少系统恢复时间,可以大大提高金融行业业务系统的连续可用性。

但是用这两个指标还不能完全反映业务连续性系统的好坏,于是又有人提出另外两个辅助R指标[3]:

恢复可靠性指标(RecoveryReliabilityObject,RRO与恢复完整性指标(RecoveryIntegrityObject,RIO。

RRO是指在系统切换或者恢复过程中成功的可靠性。

如果一个业务连续性系统在10次恢复/切换中会有两次失败,则其可靠性只有80%。

虽然成功的恢复/切换可能在几秒内就完成,但不成功的恢复/切换可能需要数小时甚至数天才能修复数据。

因此,RTO和RRO结合起来才能衡量业务连续性系统的控制能力。

RIO是指当系统因为逻辑因素出现脱机或数据丢失时,即使系统恢复到最新的时间点,系统仍然可能处于逻辑上不正确或者不完整的状态。

因此,单独的RPO不能有效衡量业务连续性系统对数据丢失的防范能力。

考虑到逻辑因素对业务连续性的巨大影响,引入RIO指标。

RIO指标能够反映系统恢复到某个正确完整的逻辑状态的能力,这对评估业务连续性系统的水平非常重要。

1.3灾难恢复的级别

按照国际标准,根据数据中心对灾难恢复RPO与RTO要求的不同,数据中心的灾难恢复可以划分为如表1所示的七个等级。

表1灾难恢复等级标准

等级描述恢复点目标

(RPO

恢复时间目标

(RTO

企业应用比率

0没有灾难恢复计划--<0.3%

1用交通工具将备份

磁带放在异地

24~48小时>48小时<0.1%

2磁带异地传输及冷

备份灾备中心

24~48小时24小时90%

3电子传输数据及冷

备份灾备中心

<24小时<24小时6%

4热备份的灾备中心

(主机+电子数据

互传+网络

秒级

>2小时,

<24小时

<0.5%

5少量数据丢失灾备

中心(主机+数据

及时更新+网络

秒级<2小时<0.1%

6

零数据丢失(主机+

数据同步+可切换

的网络

无/秒级<2小时3%

从表1可知,目前大多数数据中心只达到2~3级备份,即

在每天数据处理完成后,将数据磁带传输到异地保存,同时建立冷备份方式的数据中心。

对于国家机关、金融部门等重要企业,数据中心的备份级别要求必须达到4级以上。

一些特别重要的应用,在灾难发生时要保持业务的连续性运作,要求达到6级的标准,即建立无数据丢失、灾难发生时能够自动切换的数据中心,这也是未来容灾的发展方向。

2主要灾难备份技术

数据和恢复时间对金融行业来说都非常重要,因此,要保证没有数据丢失或者有极少量的数据丢失,同时灾难恢复的时间要非常短,最好是建立灾难时能自动切换的备份数据中心。

2.1镜像技术

镜像是在两个或多个磁盘或磁盘子系统上产生同一个数据的信息存储过程[4]。

与磁带拷贝技术相比,具有速度快、实时性强的特点,缺点是价格比磁带备份要高得多。

实时性不强的行业可以采用磁带备份,但像银行这样实时性非常强的金融行业则必须要用磁盘镜像的方式。

按主从镜像存储系统所处的位置可分为本地镜像和远程镜像,远程镜像是数据容灾的核心技术,同时也是实现灾难恢复的基础。

远程镜像按请求镜像的主机是否需要远程镜像站点的确认信息又可分为同步远程镜像和异步远程镜像。

同步镜像和异步镜像各有自己的优缺点,企业可以根据自身的需要来选择不同的镜像方式。

镜像技术是将数据保存到磁盘上,具有速度快的优点,因此用来备份常用的数据。

下面介绍两种有代表性的镜像技术,即同步技术和异步技术。

2.1.1对等远程拷贝(PPRC

PPRC是一种同步镜像技术,它在主存储器子系统和二级内存子系统之间通过控制器微码提供同步数据镜像功能,不需要主机干预,是基于硬件的灾难备份技术。

当生产系统主机完成某个应用后,在生产系统中的应用程序将数据写到生产系统的磁盘,同时将数据传送到备份系统;备份系统中的应用程序将数据写到备份系统的磁盘,然后将写完操作的信息返回给生产系统磁盘;当生产系统收到备份系统传回的已写信息之后,生产系统的磁盘系统通知主机该写操作已完毕,继续执行新的应用[5]。

PPRC是同步技术,因此具有如下优点:

①远程卷总是与生产卷同步;②二级卷在更新时总是与主卷保持完全一致的顺序,因此保证了数据的一致性;③主场地发生灾难时没有数据丢失,所以数据总是最新的和可靠的。

但是PPRC的不足之处是,主机需要等待远程写数据的完成,因此有性能上的损失,系统和应用程序都将受到影响,性能降低的程度取决于数据更新频率以及主备系统的距离。

由此看来,PPRC适用于中远距离的灾难备份,并且适合对数据要求非常严格的行业,但其对生产系统性能的影响较大,目前实际应用得还比较少。

2.1.2扩展远程拷贝(XRC

XRC是一种异步镜像技术,由系统迁移部件SDM来监控主磁盘控制器的更新,同时异步地对远程二级卷进行相同的更新。

这意味着对本地主卷的写完成以后,不必等待远程二级卷的写完成,主机程序就可以立即处理下一个交易或I/O,因此XRC技术可以将对主机应用的影响降低到最低限度,而且主卷和二级卷间的距离几乎不受限制。

XRC技术需要占用主机和磁盘资源,并且二级卷的更新通常总是滞后于主卷,因此单独用于灾难备份时会有一定的数据丢失。

数据丢失量与数据更新频率以及主备系统的距离有关,可以通过调整SDM的参数来减少数据丢失量[5]。

备份卷是异步更新,因此需要保证与主卷的更新顺序相同。

为了保证数据的一致性,XRC采用了时间戳的方式。

主系统有共享的耦合时钟,对所有XRC卷的更新进行时间标记。

当主控制器收到来自主机的一个写更新时,立即返回一个I/O完成的应答,数据被放置到控制器Cache里的一个副本中。

・501

第2期岳友宝等:

金融行业的灾难备份与恢复

SDM定期收集来自所有控制器的更新数据,并根据时间戳形成一致性组,保证备份系统数据更新顺序与主系统相同,保证了数据的一致性。

但是当传送中的数据在SDM中还没有形成一致性组时,万一在生产场地出现灾难性故障,备份系统便无法完成更新,这些数据将会丢失。

从XRC的特点了解到,它可以实现超远距离的灾难备份与恢复,并且还可以控制数据丢失量的大小,可以将数据丢失量控制在很小的范围内,加上它对生产系统性能影响非常小,实际应用比较多,尤其是在金融行业中的应用。

XRC技术是一项非常有前途的容灾技术。

2.2快照技术

远程镜像技术往往同快照技术结合起来实现远程备份,通过镜像把数据备份到远程存储系统中,再用快照技术把远程存储系统中的信息备份到远程的磁带库、光盘库中。

快照技术是将数据备份到磁带库、光盘库中,速度比磁盘要慢很多,但是十分廉价,因此用来备份不经常用的重要数据。

快照是通过软件对要备份的磁盘子系统的数据快速扫描,建立一个要备份数据的快照逻辑单元号LUN和快照Cache。

在快速扫描时,把备份过程中即将要修改的数据块同时快速拷贝到快照Cache中。

快照LUN是一组指针,它指向快照Cache和磁盘子系统中不变的数据块(在备份过程中。

在正常业务进行的同时,利用快照LUN实现对原数据的一个完全的备份,它可使用户在正常业务不受影响的情况下,实时提取当前在线业务数据,可大大增加业务系统的连续性。

快照是通过内存作为缓冲区(快照Cache,由快照软件提供系统磁盘存储的即时数据映像,因此存在缓冲区调度的问题,一个优化的调度算法将会大大减少备份的时间。

2.3跨域并行系统耦合体技术(GDPS

IBM公司根据异地远程灾难备份的需要提出基于大型计算机主机的灾难备份技术,即跨域并行系统耦合体技术(Geo-graphicallyDispersedParallelSysplex,GDPS。

GDPS是一种多站点应用可用性解决方案,具有管理远程拷贝配置和存储子系统、自动执行并行系统耦合体的操作任务、从单一控制点执行故障恢复等功能,提供了根据计划或者非计划的站点故障而自动地进行站点切换的功能,通过多个卷以及存储子系统来保证数据一致性,并且还可以在另一个站点上实现正常的DBMS重启(而非DBMS的恢复,从而达到提高应用可用性的目的,减少灾难恢复的时间。

GDPS的优点是它的操作都是自动完成的,不需要人工的干预,消除了人为故障的产生,可以大大提高业务系统的可用性。

在IBM主机系统的灾难备份中,将S/390并行系统耦合体技术与远程拷贝技术集成在一起,提高了应用的可用性和灾难恢复能力。

GDPS通过运行灾难恢复程序可以大大地缩短灾难恢复的时间,GDPS技术是提高业务系统可用性的关键技术,是一种实现远程应用级容灾的重要技术。

GDPS是一种自动化的管理、控制技术,往往与其他的灾难备份技术结合起来实现自动化的灾难备份与恢复。

与XRC技术结合起来构成GDPS/XRC技术,通过GDPS的自动化管理、控制以及XRC的数据镜像来完成整个灾难备份与恢复。

目前,中国工商银行利用GDPS/XRC技术实现了北京、上海两大数据中心数据的相互备份,而且RPO与RTO都非常小。

2.4远程应用级容灾技术

对于实时在线系统,如金融行业,需要业务的连续性,灾难发生时仍能继续提供服务,不仅要进行数据备份,而且要进行应用备份,即在容灾两地同时建立业务中心,一个主系统负责日常业务的处理,另一个备份系统实时保持数据、应用与主系统同步。

当主系统发生灾难时,应用便可以很快地切换到备份系统,备份系统继续提供服务,直到主系统完全恢复,这就是远程应用级容灾。

如图1[2]所示,远程应用级容灾中主系统和备系统的结构完全一致,分别由应用系统和容灾平台构成,应用系统根据输入的业务数据完成处理,并与容灾平台交互信息。

主系统的容灾平台根据主备系统一致性的要求,产生能够控制主备系统处理结果一致的容灾同步数据,通过容灾平台进行远程传输到备系统的容灾平台;备系统容灾平台完成容灾同步数据的分析和处理,然后控制备系统的应用系统完成相关业务操作,达到与主系统一致的目的。

对远距离的容灾来说,完全采用远程镜像的方式实现主备同步,即使有很高的通信带宽,延时也会很大,会严重影响到生产系统的性能,因此要结合软件的方式来完成整个应用的同步。

可以根据业务处理的特点来完成系统和数据处理的同步,可以大大减少主系统和备系统同步所需的信息,降低了对网络带宽的需求,但其缺点是系统的软件复杂度较高,导致日后在增加新业务功能时软件维护费用大大增加。

由于远程应用级容灾采用两套应用系统,使容灾平台依赖于应用系统,而且建立两套系统使系统的成本非常高,实施困难。

但是对于像银行这样的金融系统,为了提高系统的可用性、提供更好的服务,以便在主系统出现灾难并且可能是完全损毁的情况下,备系统能够接替主系统的工作继续提供服务,必须建立一套与主系统功能完全一致的备系统。

远程应用级容灾是建设业务连续系统的重要保证,对金融系统起着举足轻重的作用。

3目前金融行业灾难备份与恢复中存在的问题3.1效益问题

作为金融行业,数据固然重要,业务实时性要求也很高,但也不能一味地为追求系统的连续性、可用性而采用最先进的灾难备份与恢复技术,购买最先进的设备来建设灾难备份中心,更要考虑到企业自身的发展与效益。

可以根据业务实时性的强弱不同,针对不同业务采用不同的备份与恢复方式,以减少企业的投入。

目前许多企业没有针对自身的特点,盲目购买灾难备份的产品设备,投入了很多的资金。

备份的目的是提高企业的服务质量,为企业创造更多的利润,因此不管采用什么备份方案,关键是在投入与效益间找到最佳平衡点。

3.2缺乏合理的灾难恢复规划

整个灾难恢复不仅仅是数据恢复,还包括网络的恢复以及应用的恢复。

容灾是一项工程,而不仅仅是技术,(下转第110页

图1远程应用级容灾结构示意图

5报警信息XML文档的有效性验证

5.1XML文档有效性验证的必要性

完全遵循XML规范的正确格式的文档并不总能满足需要。

许多情况下还需要保证文档的有效性,否则在应用程序中对XML文档进行操作时,XML代码中的错误会引起其他程序的中断,或者导致错误的数据进入系统。

5.2报警信息XML文档的有效性验证

由于在建模阶段已经分析清楚文档元素的名称、结构和属性,这使得编写XMLSchema非常容易。

并且基于AISM模型,使用工具XMLSPY还可以自动生成XMLSchema文档Alert_message.xsd。

采用XMLSPY验证工具执行的验证操作步骤如下:

(1将要检验的Alert_message.xml文件加载到XMLSPY中;

(2从“XML”菜单选择“Validate”;

(3执行验证操作。

如果发现有效性错误,状态栏将予以指示并提供详细说明,否则,系统提示“Thisfileisvalid”而通过验证。

凭借AISM的优势,XML示例文档Alert_message.xml一次性通过了其对应的Alert_message.xsd文档的有效性验证,其界面如图3所示,(图3左下角“√”标记表示通过有效性验证。

6结束语

针对黑客分布式攻击的新特点,为增强IDS之间信息共享和交换的能力,加强IDS之间的交流和协作,本文给出了统一报警信息格式的详细提案,并提出了用XMLSchema对报警信息建模的方案,最后用XML描述语言实现了该提案并通过了XMLSchema的有效性验证。

本文的研究成果已经在国家“十五”“863”项目分布式网络监控与预警系统中得到了应用,并

取得了较好的效果。

图3XMLSPY效验工具

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 医学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2