试运行方案模板.docx
《试运行方案模板.docx》由会员分享,可在线阅读,更多相关《试运行方案模板.docx(26页珍藏版)》请在冰点文库上搜索。
试运行方案模板
,
试运行方案
,有限公司
2012年8月
一、
概述.......................................................
1
1.1
编写目的............................................................
1
1.2
项目背景...........................................
错误!
未定义书签。
1.3
参考资料...........................................
错误!
未定义书签。
二、
试运行环境..................................................
1
三、
试运行内容..................................................
1
3.1
网络环境试运行......................................................
2
3.2
安全环境试运行......................................................
2
3.3
服务器设备/存储设备及支撑软件试运行..................................
2
3.4
软件系统试运行.....................................
错误!
未定义书签。
3.5
试运行记录..........................................................
3
四、
试运行人员安排..............................................
5
五、
日常运行维护................................................
5
5.1
运行维护原则........................................................
5
5.2
硬件运行维护........................................................
5
5.2.1
机房环境维护.......................................................
6
5.2.2
计算机硬件平台维护.................................................
6
5.2.3
网络系统维护.......................................................
6
5.3
软件运行维护........................................................
7
5.3.1
维护的要求.........................................................
7
5.3.2
运行维护目标与原则.................................................
7
5.3.3
运行维护范围与人员.................................................
7
5.3.4
系统维护工作流程...................................................
8
5.3.5
运行维护内容.......................................................
9
5.3.6
运行维护相关制度建设..............................................
12
5.4
运行维护组织保障...................................................
12
5.4.1组织机构保障12
5.4.2技术支撑体系保障12
5.4.3信息安全保障体系保障13
5.4.4运行维护管理机制保障13
六、试运行期间故障响应.13
一、概述
1.1项目实施情况
二、试运行环境
(1)汛期、高温、低温及雷雨风暴等恶劣天气等条件下,系统工作的稳定
性、可靠性和功能、指标的正确性;
(2)在各种工况条件下,特别是在局部故障或个别设备故障时,系统整体
功能的正确性;
(3)各种环境、工况条件下,对设备的安全保护性能和系统的工作性能;
(4)各种环境、工况条件下,远程控制功能在实际操作中的安全性能。
三、试运行内容
试运行期间,主要工作有:
安排人员培训,并进行实际操作;对系统进行日常操作,并予以记录;对系统发生的问题,分重点分层次地予以解决,并由此提出针对性的措施。
发现并总结系统运行中的管理和维护问题,总结经验,以便系统正常运行时参考。
(1)建立专责管理队伍;
(2)建立健全运行操作规程;
(3)建立健全系统日常维护规范;
(4)建立设备运行档案。
根据子系统验收大纲和初步验收会议的规定,系统试运行时间跨度定为一个月。
试运行具体从2012年8月15日开始,到2012年9月15日结束。
2012年9月16日开始进入正式运行。
试运行具体内容包括:
系统软件的试运行及记录、系统硬件的试运行及记
录、系统操作运行及记录、巡检及记录等。
其中需要试运行的具体内容如下:
第1页
3.1网络环境试运行
1)硬件设备试运行
对核心交换机、千兆交换机、链路负载均衡等网络设备进行试运行,验证设备是否完好。
对核心交换机的负载均衡模块进行试运行,验证核心交换机是否能够平衡负载及热备。
2)综合布线试运行
对机房等位置的综合布线进行试运行,试运行网络连通性及链路质量。
3)整体网络试运行
对网络进行整体试运行,包括QoS试运行,QoE试运行等。
3.2安全环境试运行
1)硬件设备试运行
对防火墙、上网行为管理等硬件设备进行加电试运行,验证设备是否完
好。
验证设备各端口是否可用。
验证设备授权是否有效。
2)网络安全试运行
按照系统设计的网络拓扑接口进行安装部署后,对网络进行安全性试运行,确定安全设备是否工作正常,对网络攻击及病毒木马等是否有足够的防范作用。
3.3服务器设备/存储设备及支撑软件试运行
1)服务器设备、存储设备硬件试运行
包括服务器、存储设备的配置检查(CPU、内存、磁盘配置等),设备的加电试运行。
确保设备到货的完整性以及设备运行的稳定性。
2)支撑软件试运行
在安装操作系统后,对服务器设备、存储设备进行功能试运行和性能试运
行,包括CPU计算性能、内存读写性能、磁盘读写性能等,以验证设备是否符合采购标准。
第2页
3.4试运行记录
试运行过程中对系统允许状况要进行详细记录,主要包括以下内容:
1)试运行日常记录
包括:
软件的日常运行记录、硬件的日常运行记录、安全环境的日常运行
记录、服务器/存储设备的日常运行记录。
2)试运行期间服务器等硬件设备操作手动记录
在对服务器等硬件设备进行操作时,手动记录对服务器操作的内容,并记
录非法操作的原因及结果、报警内容、报警处理情况。
由操作人员或值班人员按实际操作记录。
每天都要求有记录。
3)巡检记录
试运行期间,对系统硬件设备和使用环境进行定期巡检,每周巡检一次,
巡检完成后填写巡检记录。
4)试运行期间软件操作手动记录
在对软件进行操作或者更改时,手动记录对软件进行操作或者更改的内容,
并记录更改的原因及结果。
由操作人员或值班人员按实际操作记录。
每天都要求有记录。
5)恶劣环境操作记录
在恶劣环境下设备和系统的运行情况。
根据实际环境随机选取记录。
6)特殊工况操作记录
在系统发生局部故障或个别设备故障时,系统的运行情况。
7)问题记录汇总
(1)半月问题汇总记录(含处理记录)
问题部分由操作人员汇总,主要汇总日常试运行中发现的问题;处理记录单由承建方据实填写。
(2)重大问题记录(含处理记录)
问题部分由操作人员汇总,主要汇总日常试运行中发现的问题;处理记录单由承建方据实填写。
(3)试运行总结报告:
甲方的试运行管理报告、监理单位的试运行报告、承建方试运行总结。
第3页
项目名称:
,项目单位:
试运行开始时间试运行软件
设备开始状态
设备调整记录
试运行异常记录异常记录解决办法
试运行结果
(运行是否正常
或其它运行状态
描述)
记录人
第4页
四、试运行人员安排
我公司针对本项目成立试运行工作组,。
组织职责负责人职位
五、日常运行维护
运维管理是平台的核心环节之一,它为平台的安全、稳定运行提供保障,对平台的服务、安全运行等各环节进行实时监控,对系统运行的关键信息进行记录,对突发事件进行报警处理。
应包括用户管理、权限管理、日志管理、平台监控、运行统计等模块。
5.1运行维护原则
日常管理的机构设置遵守以下原则:
节约成本原则,尽量利用现有的人力资源、减少浪费。
提高效率原则,岗位明确、协同合作。
责任明确的原则,无论是技术岗还是管理岗都应责、权、利统一,责任明确、落实到人。
5.2硬件运行维护
本次项目硬件运行维护主要包括机房环境维护、计算机硬件平台维护和网络系统维护三部分内容。
第5页
5.2.1机房环境维护
机房环境是指保证计算机系统正常稳定运行的基础设施,包含机房建筑、电力供应、空气调节、灰尘过滤、静电防护、消防设施、安防设施、网络布线等子系统。
机房环境维护首先需要制定机房管理规章制度,该规章制度对机房环境各子系统指标进行详细说明,对管理人员职责和工作内容进行详细定义,通过管理人员定期巡检,发现问题或并及时处理,重大故障需及时通知维护单位现场排除。
本次项目我们将组织每月对机房环境进行一次巡检,并提交机房环境巡检报告,记录巡检情况,对机房故障和隐患提出分析判断意见并提出解决方案。
5.2.2计算机硬件平台维护
计算机硬件平台是指服务器以及存储、备份等设备。
硬件平台维护主要分为两个方面,一个方面是硬件设备的运行状态巡查及故障处理,另外一个方面是硬件操作系统软件和硬件配置文件的检查、备份与更新等。
本次项目我们将每月对硬件平台设备进行巡查,检查设备运行状态,跟踪硬件产品信息,制定产品升级计划,备份产品配置文件。
对硬件产品故障及时排除。
每月提交硬件平台维护报告,提出硬件平台维护建议。
5.2.3网络系统维护
计算机网络系统是指保证信息系统相互通讯和业务系统正常运行的网络组
织,包括交换机、路由器、防火墙等网络设备以及联网的综合布线系统等。
网
络系统维护的核心是保障业务系统的正常运行。
本次项目我们每月对所有网络交换设备和网络安全设备运行状态进行巡
检,对核心交换设备、网络安全设备等配置文件进行备份,提交网络系统维护
报告。
第6页
5.3软件运行维护
5.3.1维护的要求
1.根据平台应用需要及甲方要求,完成信息共享服务平台和3个示范应
用。
2.自各项目交付验收通过之日起2年内提供免费的保修和维护服务。
在此期间如发生系统运作故障,或出现瑕疵,我方保证响应时间不超过30分钟,技术人员到达现场服务时间小于4小时。
3.在保修期内如由于我方的责任而需要对系统予以更换或升级,则相应延长该系统的保修期。
4.系统维护期内,我方根据系统运行情况进行不定期的检测与调优,每半年对系统进行一次总体检测,系统维护期满后为业主方提供一套完整的运行记录。
5.3.2运行维护目标与原则
系统运行维护的目标:
1)通过采取主动的系统运行维护方案,确保系统的安全、稳定运行,尽量
减少运行故障;
2)在系统故障无法避免及突发故障的情况下,也可保证系统能够得到最快
的响应和最及时的恢复;
系统运行维护的原则:
1)节约成本原则:
尽量利用现有的人力资源、减少浪费。
2)提高效率原则:
岗位明确、协同合作。
3)责任明确的原则:
无论是技术岗还是管理岗都应责、权、利统一,责任明确、落实到人。
5.3.3运行维护范围与人员
系的运行维护工作将由业主方、我方售后服务机构,共同协调配合承担。
我方在项目验收前由项目建设小组对系统进行维护,验收后有售后服务小
第7页
组负责对系统进行维护。
我方软件部分的运行维护范围主要包括项目所采购的基础软件、信息共享
服务平台、古建保护与修缮管理信息系统、公园绿化网格管理信息系统和文物
管理展示信息系统三个典型业务应用系统。
故障报修
日常维护系统定期维护/应急维护
业主方我方
规范行为参与制定
运行维护制度
图错误!
文档中没有指定样式的文字。
-1运行维护范围
5.3.4系统维护工作流程
在项目正式验收前,我方建设小组将在现状进行维护。
当系统遇到故障时,用户可以直接当面或通过电话向建设小组提交维护请求。
在项目正式验收后。
当系统遇到故障时,用户可以直接当面或通过电话向售后服务小组提交维护请求。
在电话提交问题时,售后维护工作人员根据问题描述给出解决方案指导业主方系统维护人员排除故障;如果问题不能通过电话解决,我方派出技术人员在4小时内赶到现场协助业主方解决问题。
到达现场后,技术人员大致判定故
障等级、故障类型与解决故障的时间,如果判断24小时内不能够解决问题,我方提供备用系统,以保证业主方的正常使用,问题得到解决后,记录问题原因以及解决问题的方法,并收集业主方对于维护工作的评价,以便我方进一步晚上维护工作。
系统运行情况记录对于系统的管理维护与评价具有重要意义。
系统管理维护人员在系统投入试运行的一开始就应注意积累系统运行情况记录材料。
在本平台的运行过程中,需要收集和积累的资料包括以下四个方面:
第8页
1)有关工作数量的信息如:
每天(周、月)录入数据的数量、平台中积累的数据量、数据使用的频率等反映系统的工作负担、所提供的信息服务的规模以及计算机应用系统功能的最基本的数据。
2)工作的效率即系统为了完成所规定的工作,占用了多少人力、物力及时间。
如,用户提出一个临时的查询要求,系统花费了多长时间才
给出所要的数据。
此外,系统在日常运行中,例行的操作所花费的人力是多少等。
3)系统的维护修改情况系统中的数据、软件都有一定的更新、维护和检修的工作规程。
这些工作都要有详细的及时的记载,包括维护工作的内容、情况、时间、执行人员等。
这不仅是为了保证系统的安全和正常运行,而且有利于系统的评价及进一步扩充。
4)系统的故障情况无论大小故障。
都应该及时地记录以下这些情况:
故障的发生时间、故障的现象、故障发生时的工作环境、处理的方法、处理的结果、处理人员、善后措施、原因分析。
要注意的是,所说的故障不只是指计算机本身的故障,而是对整个系统来说的。
上述四个方面中,通常在正常情况下的运行数据是比较容易被忽视的。
因为发生故障时,人们往往比较重视对有关的情况加以及时的记载,而在系统正常运行时,则不那么注意。
事实上,要全面地掌握系统的情况,必须十分重视正常运行时的情况记录。
如果缺乏平时的工作记录,就无从了解瞬时情况。
如果没有日常的工作记录,表示可靠性程度的平均无故障时间指标就无从计算。
5.3.5运行维护内容
智慧颐和园综合信息平台的维护主要包括服务器和系统的运营维护,系统
管理员主要工作内容包括:
系统能否提供服务,保证用户能够正常使用。
系统的日志,确认系统的工作状态。
数据的备份/恢复,保证数据的安全性。
系统的更新,保证系统的安全性和可靠性。
具体内容如下:
第9页
网络:
服务器网络的连接状态。
服务器:
服务器本身的运行状态。
操作系统:
操作系统的各设备、服务的运行状态以及版本更新情况。
数据库服务器:
数据库的运行情况以及数据的备份和恢复。
Web服务器:
Web服务器的运行状态以及站点、虚拟目录的安全设置。
应用系统:
系统能够正常向用户提供服务。
操作系统的运行维护
任何操作系统都有漏洞,网络系统管理员每周定期对系统服务器及客户端
及时打上“补丁”(Patch)。
使系统采用的操作系统时刻保持最新的版本,从
而排除操作系统Bug可能带来的安全隐患。
数据库运行维护
1.用户管理
利用数据库的安全机制:
对各个数据库设置不同的口令(8位以上的密
码)、权限等;设置不同的角色权限管理。
2.警告日志文件监控
数据库在运行过程中,会在警告日志文件(alert_SID.log)中记录数据库
的一些运行情况:
数据库的启动、关闭,启动时的非缺省参数。
数据库的重做日志切换情况,记录每次切换的时间,及如果因为检查点
(checkpoint)操作没有执行完成造成不能切换,会记录不能切换的原因。
对数据库进行的某些操作,如创建或删除表空间、增加数据文件。
数据库发生的错误,如表空间不够、出现坏块、数据库内部错误(ORA-
600)DBA应该定期检查日志文件,根据日志中发现的问题及时进行处理。
3.监控数据库表空间
数据库运行了一段时间后,由于不断的在表空间上创建和删除对象,会在
表空间上产生大量的碎片,DBA应该及时了解表空间的碎片和可用空间情况,
以决定是否要对碎片进行整理或为表空间增加数据文件。
监控数据库的连接情况:
DBA要定时对数据库的连接情况进行检查,看与
数据库建立的会话数目是不是正常,如果建立了过多的连接,会消耗数据库的
资源。
同时,对一些“挂死”的连接,可能会需要DBA手工进行清理。
第10页
4.备份控制文件
在数据库结构发生变化时,如增加了表空间,增加了数据文件或重做日志
文件这些操作,都会造成数据库控制文件的变化,DBA应及进行控制文件的备份,备份方法是:
5.检查数据库文件的状态
DBA要及时查看数据库中数据文件的状态(如被误删除),根据实际情况决定如何进
行处理,检查数据文件的状态的SQL如下:
selectfile_name,statusfromdba_data_files;如果数据文件的STATUS列不是AVAILABLE,那么就要采取相应的措施,如对该数据文件进行恢复操作,或重建该数据文件所在的表空间。
6.数据库备份与恢复
当我们使用一个数据库时,总希望数据库的内容是可靠的、正确的,但由
于计算机系统的故障(包括机器故障、介质故障、误操作等),数据库有时也
可能遭到破坏,这时如何尽快恢复数据就成为当务之急。
如果平时对数据库做
了备份,那么此时恢复数据就显得很容易。
服务器备份
为防止不能预料的系统故障或用户不小心的非法操作,必须对系统进行安
全备份。
服务器备份内容:
对全系统进行每月一次的备份外;对修改过的数据
进行每周一次备份;同时,对修改过的重要系统文件存放在不同的服务器上,
在出现系统崩溃时(通常是硬盘出错),可以及时地将系统恢复到正常状态。
在条件允许的情况下,可实现异地备份,采多种备份模式,可以全方位保
证系统的安全性。
系统维护
为客户整体系统提供一体化、有效的问题解决方案;
为客户提供每周七天,每天二十四小时,即7*24实时支持;
接到问题30分钟内响应,24小时内解决故障;
提供大量服务项目,包括提供信息技术咨询、教育和培训。
长期免费提供硬件平台相关设备理论培训,为甲方培养专业人才。
必要时提供设备原厂工程师的现场指导与服务。
第11页
5.3.6运行维护相关制度建设
想要建立切实可行的运行维护体系,制度建设是必不可少的要求。
我方将
协助业主方建立和落实系统运行维护的一系列相关制度。
机房管理条例
服务器系统的管理按照IDC机房的管理制度执行。
对于机房环境的管理,
有必要制定规范的《机房管理条例》,进行规范、有序的管理,以保障系统安
全、稳定运行。
保密与信息安全制度
系统内的部分数据将涉及保密数据,有必要进行安全防护。
而数据安全的
防护需要从计算机网络、系统内部、人为因素等多方面去考虑,为了杜绝由于
人为疏忽导致的数据泄密,需要制定和执行《信息安全条例》。
业主方内部管理保密管理,负责数据管理和系统维护(涉及数据库)的人
员要求签订保密协议。
另外,为保证部门之间地理数据共享交换时的数据安全,需制定数据版权
保护和数据保密的合同制度。
系统维护责任制度
为了使系统能够长期稳定运行,需要对计算机硬件设备和软件系统进行定期和不定期的维护。
不定期的维护主要由相关的使用人员负责。
因此,有必要建立系统维护责任制度,将责任以制度的形式加以明确。
5.4运行维护组织保障
5.4.1组织机构保障
为进一步加强智慧颐和园的建设工作,构建智慧景区,需要成立专门的智慧颐和园综合信息平台建设工作领导小组。
我方将为此项目成立专门的项目组,以保证项目的顺利实施。
5.4.2技术支撑体系保障
,综合工程,需要建设和整合的系统很多,涉及到很多关键技术,如集
第12页
成技术、安全技术、空间数据库技术等,这些技术的成熟度直接影响着系统的建设效果。
开展技术支撑体系建设,不仅对关键技术进行预研,还要抓好实施,降低技术的实施成本。
既要重视科学原创,又要重视技术的创新和发明,加强系统集成。
5.4.3信息安全保障体系保障
智慧颐和园综合信息平台建设的一个重要的内容就是要保证各系统中的信息安全,只有在安全的基础上,才能考虑信息的共享。
完善的安全保障体系是信息化顺利运行的“守护神”。
安全保障体系包括软硬件的安全保障与管理制度的安全保障。
网络安全体系是通过软硬件设备,保证系统在运行中安全稳定运行,不会被突发状况或恶意程序破环。
信息安全保障体系是保证信息系统能够遵循安全稳定的制度运行,在制度与操作上保证信息的安全与稳定。
包括:
信息备份机制
信息系统人员管理机制
历史信息追溯机制
安全评估机制
5.4.4运行维护管理机制保障
良好的运行机制是智慧颐和园综合信息平台维护管理规范化的保证。
在运
行机制的设计上,应着重于制度的健全和办事程序的规范,让信息化管理工作
在信息化建设中发挥积极的作用。
根据颐和园目前的信息化管理现状,建议在
建设过程中设计好项目管理机制、业务协同机制和监督评价机制等。
六、试运行期间故障响应
由于本项目涉及产品多、覆盖范围广,因此在系统试运行过程中技术故障
的出现将是不可避免的,针对这种情况,我公司设计了完善的技术故障应急策
略。
当客户服务中心收到系统出现技术故障的运行维护与支持服务需求时,我
第13页
们将立即做出实质性响应,联系项目单位技术人员核实故障情况,收集故障信
息,并且立即派出试运行工作组技术支持人员到达项目单位故障现场,以最快
的速度分析故障原因,确定故障点,在根