A具体系统运维方案和措施投标文件Word下载.docx
《A具体系统运维方案和措施投标文件Word下载.docx》由会员分享,可在线阅读,更多相关《A具体系统运维方案和措施投标文件Word下载.docx(48页珍藏版)》请在冰点文库上搜索。
故障恢复时间
72小时内
全面巡检,巡检时检查蓄电池使用情况,进行充放电;
并且
1次/年
要求完整、详细、真实的维护记录文档,月、季、年度提交规范的维护报告。
按
维护文档
日常运行状态监控
BUG管理
数据库
数据库安装、配置管理
存储管理
对数据库进行优化
按季度进行巡检
解决数据库运行中出现的各类故障
文档提交
规范的维护制度
中间件
安装维护
7*24小时
解决中间件运行中出现的各类故障
立即响应
备件保证
备件库
备件更换
现场更换
技术服务
驻点服务:
1•提供7X24小时免费故障检测与
维修换件现场服务2.预防性维护服务
远程技术支持服务:
1.提供7X24小时的故障响应电话支持2.每周一次与客户沟通交流
培训服务:
1.专业知识培训2.日常运维管理
远程诊断
远程拨入系统分析
远程故障解决
远程系统性能监控
7.3运维人员组织架构
7.3.1运维组织结构介绍
我公司将在此运维项目中投入业务水平高、技术能力强的运维人员和质量控制人员,采用本公司严格规范的运维管理模式,进行全方位管理。
为了进一步确保运维项目的进度与质量,本公司在项目运维阶段、质量管理、技术文档等方面进行严密规范的部署。
本公司的运维队伍组成包括:
运维项目总负责人(常务总经理兼任);
运维管理委员会(项目经理、甲方代表、监理代表);
运维驻点服务小组;
技术支持专家组;
备品备件供应小组;
文档管理小组
732运维成员职责
项目经理职责:
项目经理受公司总经理任命和委托,全权负责运维项目合同的各项条款的履行。
对运维项目的优质、高效、安全负全责。
驻点工程师职责:
1、负责对小型机、服务器、存储设备相关的申报事件进行处理和解决。
2、负责对小型机、服务器、存储设备提供日常性能和运行状况监控,对故障进行分析处理及建立完善预警机制。
3、负责保障机房服务器正常运行,遵循用户的安全保障管理要求。
4、接受用户对服务器维护事件的督办、检查,协助服务台完成对用户意见进行回访和事件统计、分析。
对服务过程和反馈的意见进行改进,同时接受服务台的绩效考评工作。
5、及时提供服务器运行和问题处理情况,并向用户负责,并按周、月、季、年提交运维运维服务工作进度总结和计划。
6负责整理和归纳服务器日常维护知识库,提交至运维服务平台。
7、负责整理和提交服务器运维过程资料和相关配套维护文档。
技术支持专家职责:
1•为客户提供7X24小时的故障响应电话支持。
2.接听客户服务热线电话和接收(电话/Email/Fax等)客户服务请求;
3.通过网络或电话为客户提供即时的远程技术支持,包括软硬件故障的诊断和排除,客户端软件的安装和设置
4.协调多方服务团队,及时跟进未完成的服务请求并及时更新系统信息和状态;
备品备件管理员职责:
1.组织实施备品备件的订购、运输及入库工作
2.负责汇总待料备件,及时采购或调拨,并主动向项目经理说明待料原因、追踪处理。
7.3.3运维成员组织结构
针对本次维保项目我公司配备了5名专职人员具体如下表:
序号
分派职位
数量(人)
姓名
获得证书
1
项目经理
项目管理师资格证
2
驻点工程师
3
技术支持专豕
OCP证书IBM认证证书
4
备件管理员
5
文档管理员
备注:
人员证书附下页:
7.4运维质量保证措施
7.4.1质量控制管理
按照相应的IS09001:
2000国际质量体系标准及国家规定进行质量控制,还以相应的规范要求对设计质量,施工质量、材料和设备质量进行管理、要求、控制。
公司的施工阶段性内部验收制度,是质量控制管理的有利保证。
工程的每一个阶段完成时,公司技术支持部门都要按有关部门规范和要求进行严格的内部验收。
验收标准整体上高于用户验收标准。
7.4.2进度控制管理
针对本次项目我公司结合客户要求做出如下运维计划:
序
名称
人员
周期
号
小型机、存储系统巡检报告
驻点工程师/技术支持专家
每周
pc服务器
网络设备
机房空调巡检报告
UPS巡检报告
每季
6
数据库系统运维
7
中间件系统运维
8
问题报告
问题解决后
9
月总结报告
每月
10
季度总结报告
每季度
11
年总结报告
驻点工程师/技术支持专家/项目经理
每半年
12
定期培训
具体输出见本投标文件7.6具体服务项目及输出文档
7.5运维流程及服务方式
7.5.1服务方式
针对本次项目我公司为保证各系统的稳定可靠的运行我公司根据该项目的具体要求提供三种方式的技术支持服务,分别为:
现场服务、
远程技术支持服务、针对甲方运维人员的技术培训服务。
现场服务
对客户的系统进行现场维护和巡检,驻点工程师对各个应用系统完成定期巡检,同时输出巡检报告提交给客户,驻点工程是还应对客户的故障设备进行维修和更换备件服务。
为了让客户得到更及时和更快的服务,驻点工程师还提供7X24小时的故障响应电话支持。
远程技术支持服务
远程技术服务主要是通过电话或其他方式受理客户和驻点工程师的疑难问题,通过沟通来指导客户或驻点工程师解决问题,同时远程
技术服务工程师还通过电话或者其他方式与客户主动沟通来提高客户管理和运维能力。
技术培训服务
为提高客户的运维人员的技术水平及运维管理能力,我公司将派遣具有丰富实施经验的技术专家定期对客户进行相关专业(主机、存
储、数通、网络、安全、机房环境等)的培训。
培训可以采用灵活多样的方式如面对面交流、课堂授课、邮件沟通等。
7.5.2运维流程
1、技术人员现场值守运行维护服务的基本操作流程如下图所示:
2、定期巡检结合故障现场运行维护服务的基本操作流程如下图所示
7.6具体服务项目及输出文档
7.6.1小型机、pc服务器、网络设备及存储系统
小型机、pc服务器、网络设备及存储系统运维部分主要分为三部分,分别为小型机存储系统运维、pc服务器运维、网络设备运维。
小机存储系统运维内容主要包含小型机设备、光纤交换机、存储设备三部分主要从以下几个方面进行维护:
1检查设备各部件的状态灯;
2、检查并处理设备的错误日志;
3、硬件设备的全面检查;
4、网络配置的检查及测试;
5、操作系统性能分析;
6、核对各小型机配置信息,根据需要调整配置;
7、检查设备的微码版本;
8检查存储设备运行情况;
针对如上要求输出如下检测报告:
小型机系统巡检报告
用户单位名称:
设备名:
设备型号:
产品序列号:
检测项目
检测方式
说明
检查结果
巡检周期|
电源风扇
检查主电源灯状态
指示灯常绿表示系统正在运仃
正常□异常□
检查直流电源指示灯状态
指示灯常绿表示电源供电正常
检查直流电源风扇状态
检查风扇是否散热
处理器
执行命令:
Isdev-Ccprocessor
检查CPU的数量及状态。
CPU状态为AvaiIabIe,表示
CPU使用正常
内存
Isattr-ElmemO
检查内存数量及状态。
size与goodsize的数量相等表示内存使用正常
磁盘
Isdev-Ccdisk
检查磁盘的数量及状态。
磁盘状态为Available,表示
磁盘使用正常
适配器
Isdev-Ccadapter
检查系统中配置了哪些适配器及使用状态。
各个适配器的状态为Available,表示各个适配器目前工作正常。
若适配器状态为Define,则表示该设备已经被配置但是未被当前系统使用。
分页空间
Isps-a
检查分页空间的分配数量及利用率。
Size为已分配的分页空间数量;
%Used为目前系统的分页空间使用率,该值若超过70%,
表示糸统内存不足
系统镜像
Isvg-lrootvg
检查系统卷组的镜像状态。
各个逻辑卷的PPs数量应该为LPs数量的整数倍,倍数大于1并且能被PVs整除,表示卷组已经作镜像。
各个逻辑卷的LVSTATE应该为syncd,否则表示镜像不冋步。
文件系统
df-k
检查已经挂载的文件系统的使用状态。
重点检查/(根)
/tmp(临时)/var(日志文件)这些动态文件系统的使用率最好保持在70%以下。
错误日志
errpt
检查系统日志是否有硬件或软件方面的永久错误。
若发现错误类型为P的信息,则需要注意。
网卡配置情况
ifconfig-a
检查各个网卡的配置情况,状态是否为UP,检查ip地
址和子网掩码等配置是否正确。
系统备份
Ismksysb-V
-f/dev/rmtO
检查磁带备份的可读性。
若没有错误显示,则表示备份磁带的数据是有效可恢复的。
客户确认
巡检结论:
【】合格【】
不合格
用户代表签字:
年月日
服务工程师签字:
存储系统设备巡检:
设备名称:
检查时间:
年月曰时
本年度第
次检查
检查项目:
检查结果:
1.检查存储硬件情况:
设备故障灯是否有亮
SAN交换机端口LED状态
□有
□无
□正常
□不正常
2.存储系统故障报告(ProblemLog):
ProblemLog/ServiceableEvent
有否硬件故障
3.存储系统运行状态:
ViewStorageFacilityState/
CdaPreverify/ViewRIOTopology
4.通信:
/MasterConsole/SMC/HMC和存储设备的通信
□Good□Degraded□Offline□Rebuilding
6.存储设备内部状态:
7.存储系统硬件状态:
双控制器同时正常工作
电池、电源和风扇模块
□是
□否
物理硬盘和逻辑盘
8.微码(Microcode)是否满足IBM的最低要求
9.是否启用了CallHome
10.收集存储设备基本信息存档
目前存在的冋题:
改进措施或建议:
检杳结论:
客户签字:
工程师签字:
日期:
年月曰
Pc服务器运维内容主要包含设备硬件、操作系统、软件几个方面进行考虑。
PC服务器巡检:
服务器设备巡检报告
巡检周期
显示器
光驱
磁带机
电源
键盘/鼠标
风扇
系统指示灯状态
前面板指示灯
电源指示灯
磁盘指示灯
系统控制板指示灯(CPU/MEMI/O等)
系统日志信息
IML日志
操作系统日志
交换区使用率
TOP或任务管理器查看使用率%
磁盘分区使用率
Windows系统
Unix系统用命令
C:
/使用率%
D:
/usr使用率%
E:
/var使用率%
其它分区
操作系统版本/
核心patch版本
咼可用性软件
数据库软件
存储软件
备份软件
【】合格【】不合格
年月日
服务工程师签字:
网络设备的运维内容主要包含交换机、防火墙以及负载均衡等相关设备
输出文档按照如下:
网络安全设备巡检报告
正常□异常口
正常□异常口V
正常□异常口1
正常□异常口n
7.6.2机房空调、UPS设备运维服务
为保证机房内各个应用系统的设备正常稳定的运行,良好的机房环境是非常
必要的,我公司针对本次项目主要从机房空调系统、UPS供配电系统,作为重点运
维内容,同时对机房内的其他指标项进行检测如机房内温度、湿度、消防系统、新风系统等。
机房空调系统的运维内容主要遵循如下表单进行巡检:
系统
检杳项目
检杳时间:
空调1
控制温度
C
控制湿度
%
当前温度
当前湿度
业务机房
监控室、/ups
当前运行空调
检查空调是否有排水不出产生积水、漏水现象
()1号机在用
()2号机在用
()无积水、漏水现象
()有积水、漏水现象
年月日
我公司巡检人员每周会严格按照机房空调巡检报告具体要求对客户的
空调系统检测,为保证空调系统的工作正常,每年不低于2次的全面巡检,对故
障配件进行检修,在日常维护中及时清理及更换过滤网和加湿罐等耗材,定期清理机房空调的室外机,检修内各供水管路及排水管路,杜绝漏水,保证管路畅通。
在设备出现故障后,保证在48小时内恢复正常。
机房UPS系统的运维内容主要遵循如下表单进行巡检:
产品序列号:
信息显示检查
检杳量
测量值
显示值
输入电压Vab
输入电流Ia
输入电压Vbc
输入电流Ib
输入电压Vca
输入电流Ic
输出电压Vab
输出电流Ia
输出电压Vbc
输出电流Ib
输出电压Vcb
输出电流Ic
输入频率Hz
输出频率Hz
输出功率KW
输出视在功率
电池电压Vdc
电池电流Id
当前UPS运行状态□市电逆变□旁路□电池逆变□故障停机□单机□并机
旁路或电池逆变的原因:
内部检查:
(检查时可能断电,用户需断开负载)
是否合格
处理概要
检视输入/输出端子、螺栓、螺帽紧固性
检视所有主控板电气连接是否安全可靠
检查器件、电缆等损坏、老化情况
检查风扇及风道状况
检查机柜、电池架等结构件腐蚀、形变与连接紧固情况
检查机内变压器、散热器等散热环境和通道状况
检测所有滤波电容外观、紧固和泄露情况
清扫可达空间和无源空间
视检整流器和逆变器驱动板是否过热或烧焦
视检整流器充电器晶体二极管是否老化
视检直流电容/交流电容是否老化
检查所有保险丝是否正常
功能测试(如果必须进行以下测试,经客户同意后按照操作流程进行)
市电逆变/旁路转换功能
正常□异常口
实际负荷下电池放电和充电等电池管理功能
UPS逆变同步,并机均流
报警功能和历史故障信息记录,并清除历史记录
处理概要:
其他问题或建议:
电池检测报告□有□无
巡检人签名:
用户签名:
日期日期
我公司巡检人员每周会严格按照UPS巡检报告具体要求对客户的UPS供配电系统进行检测,根据具体的检测结果对UPS设
备进行合理维修,为保证UPS设备的正常运行,每年至少进行一次全面巡检,巡检时检查蓄电池使用情况,在客户授权的情况下进行充
放电,当UPS设备发生故障时,应在72小时内恢复正常运行。
7.6.3数据库系统运维服务
针对数据系统的运维我公司提供如下解决方案:
本方案适用于技术人员的日常运维工作。
ORACLED维护方法
数据库启动
1、以oracle用户用户登录,
sqlplus‘/assysdba'
sqlplus>
startup
2、以oracle用户或ora816用户登录
startupnomunt
sqlplus>
alterdatabasemount;
alterdatabaseopen;
3、第一种启动方式是最常用的手工启动方式,第二种启动方式是数据库有故
障时常用的逐步启动方式,可以观察故障点。
因为startupnomount语句只读取
spfile(serverparameterfile数据库参数文件),启动instanee,启动SGA和
后台进程;
alterdatabasemount语句打开控制文件,确认数据文件和联机日志
文件的位置,但此时不对数据文件和日志文件进行校验检查;
alterdatabaseopen
打开包括Redolog文件在内的所有数据库文件,这种方式下可访问数据库中的数
据。
S