村镇银行数据中心重大事件应急管理规定.doc
《村镇银行数据中心重大事件应急管理规定.doc》由会员分享,可在线阅读,更多相关《村镇银行数据中心重大事件应急管理规定.doc(6页珍藏版)》请在冰点文库上搜索。
XXXXX村镇银行
数据中心重大事件应急管理规定
第一章总则
第一条为近一步提高XXXXX村镇银行(以下简称本行)数据中心的应急处置效率,规范数据中心重大事件应急预案的启动程序,及时协调各相关部门和人员参加系统重大运行事件应急响应,确保XXXXX村镇银行重要信息系统安全稳定的运行,结合XXXXX村镇银行实际,特制定本规定。
第二条本规定明确了XXXXX村镇银行数据中心突发事件应急管理的操作流程、控制要点、内容和要求。
本规定适用于XXXXX村镇银行数据中心突发事件应急处置过程的管理。
第三条本预案为《XXXXX村镇银行计算机系统安全应急处置预案》的补充。
第四条本规定所称重大事件是指严重影响XXXXX村镇银行业务运行和系统安全,可能造成重大社会不良影响的系统故障,主要包括:
(一)机房电源、网络设备故障导致的业务大面积中断;
(二)人为误操作导致大量业务数据丢失引起的业务中断;
(三)地震、洪水、火灾等灾害引起的运营事故灾难;
(四)其他因素和事件导致的业务大面积中断。
第五条数据中心重大事件应急管理应遵循及时发现、科学分析、迅速处理、定期演练、确保安全的原则。
第二章职责与权限
第六条为有效处理重大事件,科技部应成立重大事件应急指挥小组。
组长由科技部负责人担任,小组成员由业务应用部门的部门负责人和业务骨干成员,以及第三方服务供应商驻场人员构成。
应急指挥小组设:
数据中心应急领导小组、应急协调小组、应急报告小组、系统应急小组、应用应急小组、网络应急小组和第三方公司应急小组。
第七条应急领导小组:
(一)负责组织、指导和督促重大运行事件的应急响应工作;
(二)现场指挥重大运行事件应急响应;
(三)审定系统技术救治方案;
(四)批准技术救治方案的启用;
(五)组织协调数据中心与各业务部门、开发中心、合作公司之间的应急合作、资源调配等工作;
(六)及时向科技部报告重大运行事件及其处理情况;
(七)审定重大运行事件处理报告和分析报告。
第八条应急协调小组:
(一)负责统一受理全行主要生产系统重大运行事件的申报。
主要生产系统重大运行事件指:
可能造成不良社会影响、影响重要客户业务交易或影响本行正常业务运营的主要生产系统故障;
(二)负责及时向数据中心应急领导小组、相关技术支持人员及其他关联系统运行和支持人员通知重大事件的发生时间、影响范围、应急响应等情况;
(三)组织、协调、督促相关的支持人员及时到场开展应急处理工作;
(四)现场参与和跟踪重大运行事件的应急处理全过程;
(五)通过召开会议等方式,牵头组织科技部的各类技术人员对重大运行故障进行诊断和恢复,提出启用应急预案建议;
(六)负责对各系统的应急预案进行评审,检查各系统应急预案的更新情况和内容有效性;
(七)定期检查各系统应急预案的演练计划和演练记录,根据演练情况督促应急预案的改进和优化;
(八)现场或电话授权值班人员通过短信、电话等方式,定时向所有相关人员报告事件内容、目前事件进展和应急协调小组关于此事件跟踪联系人,以便各方与之联系。
第九条应急报告小组:
(一)负责定时向数据中心应急领导小组汇报应急处理进度和情况;
(二)受领导小组的委托及时向信息科技管理委员会有关领导报告重大运行事件及其处理情况:
(三)草拟重大运行事件的对外统一解释说明材料;
(四)应急处理结束后,及时详细汇报事件发生的过程、现象、原因、影响和采取的措施等情况;
(五)审核重大运行事件处理报告和分析报告。
第十条系统应急小组:
(一)负责编写技术救治方案;
(二)组织技术救治方案的测试、更新;
(三)应急救治方案的演练和培训;
(四)应急救治方案的实施;
(五)及时向应急报告小组通报进展情况;
(六)及时向应急协调小组提出资源请求;
(七)配合技术分析小组制定测试验证方案;
(八)配合测试验证小组查找问题根源。
第十一条应用应急小组:
(一)负责向应急领导小组报告和接收应急指令;
(二)负责收集故障现场应用信息;
(三)负责诊断系统应用故障;
(四)负责应用故障救治实施;
(五)负责应用故障分析和提供报告。
第十二条网络应急小组:
(一)负责包括网络、机房环境、技术资源保障等环节的应急保障;
(二)负责向应急领导小组报告和接收应急指令;
(三)负责收集故障现场网络信息、网络故障诊断、网络故障救治实施、网络故障分析和提供报告;
(四)负责协调相关应急所需的机房环境资源;
(五)负责行内外技术专家、设备、厂商等各类应急技术资源的协调。
第十三条第三方公司应急小组:
(一)负责接收救治应用、故障报告;
(二)负责向科技部负责人报告故障情况;
(三)负责协调组织应急故障救治工作。
第三章应急处置
第十四条应急处置原则
(一)以迅速恢复生产运行为首要目标
一旦发生重大事件,要立即启用应急预案,力争在最短时间内恢复重要系统生产运行。
(二)统一领导,明确职责
在行领导的统一领导下,充分发挥各技术支持组骨干在应急处置中的作用,按照已经制定的应急预案,分别对所管理的系统或基础设施进行应急处置工作。
(三)快速反应,并进行处置
当重要信息系统发生故障时,相关人员一旦接到通知应立即投入应急处置工作,不得以任何借口延误应急时机,要顾全大局,服从统一指挥。
第十五条应急处置流程
(一)受理与确认
1.各类业务人员、机房运行值班人员通过电话、监控系统以及其他渠道获得事件信息后,第一时间通知现场值班人员。
2.现场值班人员尽快确认事件影响范围,并将相关信息反馈给各系统管理人员,各系统管理人员第一时间将信息上报给科技部负责人。
(二)通知
1.科技部负责人确认事件信息后,应立即将信息上报给分管领导,以便及时组织、协调应急小组工作会议,同时通过电话、短信通知相关问题处理人员。
2.接到通知后,分管领导根据具体情况判断是否启动应急小组工作会议。
如需启动,由科技部通知各相关人员按时参加会议。
(三)诊断处理
1.各相关人员接到故障通知后,应立即检查所负责系统的运行状况,及时通报系统正常与否的信息,并提出故障判断的相关意见。
2.已明确定位的故障,由值班人员进行应急处置。
3.对短时间内无法定位的故障,科技部负责人根据上报情况,组织相关人员进行分析,提出应急处置建议,上报分管领导。
4.分管领导根据上报的应急处置建议进行决策,科技部负责人根据分管领导的决策意见组织技术应急处置。
5.在故障处理过程中如需协调资源,处理人员应及时向科技部进行申请,科技部负责人负责审批调度各种资源。
6.科技部负责人负责跟踪并及时通报事件处理进展情况,必要时科技部负责人按相关规定向分管领导上报有关情况。
7.事件处理过程中,各部门应统一口径。
由我行专门的公关部门向媒体和主要客户进行解释和发布消息,其他人员不得私自接受媒体采访,将社会不良影响降至最低。
(四)后续处理
1.故障排除,业务恢复运行后值班人员应第一时间通知科技部负责人和其他相关人员。
2.故障处理完毕后,相关系统负责人员应于3日内完成重大运行事件分析报告,内容包括本次事件发生的过程、现象、对业务的影响及影响范围、受影响的相关系统情况、处理和恢复过程、原因分析和采取的措施等,编制《重大运行事件分析报告》(见附件1)。
3.重大运行事件分析报告经科技部负责人审核后上报分管领导。
4.业务恢复运行后,由相关办公室草拟重大运行事件对外统一解释说明建议,经行领导审核后,由指定部门统一对外发布。
(五)修订
1.对突发事件进行分析和总结,编写记录报告。
2.根据对突发事件的处理经验,加强技术更新改造和制度更新。
3.对应急预案进行补充完善。
(六)资料归档
整理应急处理资料,分析处理结果,总结经验,以便更好的利用,资料转交安全管理岗存档。
第四章工作要求和注意事项
第十六条沟通上报要求:
(一)当运行监控人员(值班人员)发现生产运行事件时,必须立即通知相关系统管理人员;
(二)如果各部室、各支行的系统操作人员通过其他途径,如业务部门人员等获知生产运行事件,必须及时报告给科技部值班人员;
(三)科技部负责人应及时了解跟踪问题处理情况,对于重大事件应立即报告分管领导;
(四)对于自发生之时起20分钟内未解决或对业务、客户造成影响的运行事件,科技部负责人应填写《重大运行事件紧急报告表》(见附件2)上报分管领导及相关部门。
第十七条违规行为处理
对于有重大运行事件发生后,科技部和业务部门相关人员在得知情况后,未按流程立即报告和上报的责任人,应按照总行相关规定接受处罚。
第五章附则
第十八条本规定由XXXXX村镇银行科技部负责解释和修改。
第十九条本规定自印发之日起施行。
附件:
1.重大运行事件分析报告
2.重大运行事件紧急报告表
附件1:
重大运行事件分析报告
20年月日
一、故障描述:
(一)简述故障发生时间、结束时间
(二)故障现象
(三)对业务的影响
(l)影响的业务内容
(2)影响的范围
(3)影响的程度
二、处理过程:
描述故障发生到恢复的全过程
(l)何人发现故障
(2)通知了何人
(3)何人参加了故障处理(包括各业务部门、厂商、集成商人员)
(4)采用何种方法定位了故障原因
(5)采用何种办法恢复了生产
三、故障原因分析:
详细描述是何原因导致故障发生
四、经验教训:
需要通过以下几个层面分析、判断如何避免故障的发生,或者减少故障对业务的影响
(1)日常运维
(2)技术支持
(3)应用开发
(4)技术架构
(5)管理制度
五、下一步工作计划及建议:
(1)提出下一步彻底解决该故障的工作计划
(2)计划采取的管理措施
(3)计划采取的技术措施
(4)通过对此例故障的处理,而获得的经验和教训如何推广到其他系统提出建议
附件2:
重大运行事件紧急报告表
日期
时间
责任部门
地点
联系人A
联系方式
联系人B
联系方式
突发事件性质
涉及生产系统类别
影响系统运行情况
影响人力情况
已采取的措施
拟采取的应急处置方案的建议
资源需求
总行/部门工作配合需求
电话:
邮箱:
6