IBM服务器及存储设备维护方案样本.docx
《IBM服务器及存储设备维护方案样本.docx》由会员分享,可在线阅读,更多相关《IBM服务器及存储设备维护方案样本.docx(26页珍藏版)》请在冰点文库上搜索。
![IBM服务器及存储设备维护方案样本.docx](https://file1.bingdoc.com/fileroot1/2023-5/7/881063e1-0a59-4681-b47e-fdadc72efe9c/881063e1-0a59-4681-b47e-fdadc72efe9c1.gif)
IBM服务器及存储设备维护方案样本
文件编号
文件版本
V1.0
编制
日期
.12.18
审核
日期
XXXX企业
IBM服务器及存放设备维护方案
序言
很感谢XXXX企业领导给我企业机会,我们怀着极大热情精心组织、精心设计相关XXXX企业IBM小型机及相关存放保修方案,特提交此保修服务方案提议书供领导及相关教授参阅。
项目背景及需求
中国XXXX企业为了满足业务需要,采取了大量IBM小型机及相关存放设备。
为了确保业务可连续运行,需要有专业厂商提供确保硬件环境7X24可用性能力。
而作为上市企业,XXXX企业期望在确保满足质量要求前提下有更合理最具性价服务方案及相关厂商。
服务等级:
7*24服务期:
12个月
#
机型
基础配置
数量
单价
单位
小计
1
7029-6C3
P6152-WAY1.45GHZ/2GB/2*73GB/DVD-ROM
1
¥19,600
台
¥19,600
2
1722-60U
TotalStorageFAStT600Storage
1
¥18,500
台
¥18,500
累计:
¥38,100.00
人民币金额(大写):
叁万捌仟壹佰元整
一、服务方案制订标准
本方案关键针对XXXX企业IBM服务器主机及相关操作系统、数据库、系统软件制订合理科学维保策略。
方案制订遵照以下标准:
●业务为中心:
本项目标最终目标是确保业务系统安全和可靠运行。
包含计算机系统可靠运行和业务数据安全确保,我们将动用一切有效方法手段,努力争取业务系统万无一失,我们目标是:
“非正常性停机时间为零”。
●重在方法:
重视预防。
我们将在传统被动式服务基础上提供主动式服务,和用户一起做好系统监控维护工作。
采取以预防为主策略,把故障隐患消亡在萌芽中。
服务组织。
服务组织管理和步骤管理是项目成功得关键。
我们将在责任工程师(项目经理)统一调度下,指挥技术、应用、商务及服务监督人员,在售前、服务实施、售后各个步骤紧密和用户方配合
●追求最好性价比:
服务等级意味着用户成本,我们在保障高标准服务前提下,努力经过精心组织、精心实施来降低用户成本,同时为用户提供更多增值服务。
二、保修服务内容及标准
本方案针对XXXX企业上IBM服务器及相关硬件设备及操作系统保修服务和数据库帮助保修服务、帮助应用软件升级、应用软件备份等服务内容。
关键服务项目以下:
1)故障排除
在要求时限内排除故障恢复系统运行,包含故障定位、部件更换、数据恢复全部工作,不在另外收取任何费用。
2)定时巡检
定时对系统进行预防性维护,包含检验系统状态、设备清洁、系统备份,和和用户工程师技术交流。
3)培训
我们将无偿提供针对项目标技术培训和技术交流。
包含:
现场培训:
关键在巡检及项目实施过程中进行,由我企业工程师结合实际情况,对工程设备安装调试、使用和维护进行具体讲解,达成用户相关人员能够自主使用和维护系统设备目标。
专业技术培训:
经过培训使相关技术人员能有效管理IBM服务器、监控、日常操作维护,对集群环境、AIX环境、系统性能优化等尤其给予关注。
我企业将无偿提供培训师资、教材及搭建培训软硬件环境。
培训具体地点及安排由我企业和用户协商而定。
参考课程以下:
●AIX系统及网络管理
●集群高可用方案HACMP
●故障定位和系统运维常见问题
4)增值服务
●咨询服务:
解答用户在系统使用中问题。
可经过电话解答用户非保修设备使用中技术问题。
通常情况下,指导用户处理问题,特殊情况下,可到用户现场指导并处理问题,这么能够有效地提升用户系统管理水平,降低系统人为故障率。
定时发送相关资料,使用户立即跟踪掌握相关IT新技术及新产品,相互交流系统使用及维护方面经验。
帮助用户建立健全规范管理制度和系统使用维护技术步骤及规范。
建立系统配置档案和升级维护档案,定时提交系统维护及管理汇报。
●系统升级、扩充
为用户提供系统升级、扩充、改造、迁移等服务。
结适用户实际情况,为用户具体制订切实可行技术方案和合理费用计划,并可提供现场实施工作。
如用户需要搬迁设备,我们能够为用户制订安全周密搬迁计划,并负责实施,确保用户设备搬迁后正常运转,省去了用户自行搬迁所带来烦恼。
●协调工作
协调原厂商(包含软硬件)维护和维修工作。
定时召开例会,双方交流,向用户方领导汇报工作并听取领导及技术人员意见和提议。
服务标准
●服务工作时间:
7X24X365电话受理服务请求或帮助用户处理技术问题。
●响应时间:
接到报修后30分钟内给予实质性响应,工程师8小时内抵达服务现场。
●故障恢复时间:
接到报修后24个小时内恢复系统正常运行。
●服务热线:
项目经理:
张旭二十四小时手机
800-810-7333(全国无偿服务热线)
-101(总调度长/工作时间)
●现场服务规范:
详见《金支点企业工程师规范》
●保密条款
金支点企业将严格遵照保密协议,凡包含用户机型配置、IP地址、软件等信息不得向第三方泄露,维护过程中如需包含用户系统数据信息,必需先经过用户方认可,维护工作数据信息(不管是打印或介质上数据信息)不得带离用户工作现场。
三、服务实施细则
1)前期工作
在保修协议生效前,金支点将派出硬件工程师和系统软件工程师前往用户现场,对现场IBMP615、DS4300及相关网络设备进行测试,并对运行情况做好文档统计。
然后对设备进行必需清洁、保养和维护,使设备处于良好运行状态。
施工交底依据协议明确服务标准、工作步骤、联络方法;
建立设备档案具体统计设备型号、出厂编号、版本号、工作状态;
场地环境检验包含供电装置、电源电压、接地和室内湿度、温度、温变梯度、空气洁净度、防雷方法等进行检验,对问题隐患提出改善提议;
数据备份在用户方配合下,将操作系统、应用程序、应用数据等做一次完整备份交用户保管以备使用;
现场培训和交流;
制订服务个案依据具体系统配置制订《XXXXIBM服务器服务实施计划书》,具体描述保修服务内容、人员组织分工、工作标准、服务步骤、应急预案、现场备件清单、投诉管理、突发或不可估计事件管理等内容,报双方领导批复后实施;
承诺现场备件到位,同时在北京中心备件库中配置或补充本案专用备件,配置对应系统及软件环境。
2)故障预防提议
系统工程师经过预防性检验对系统硬件进行检测和诊疗,对系统中潜在硬件故障采取预防方法。
假如一些部件出现无法恢复故障,系统工程师将立即给予修理更换。
维护期内提供定时巡检服务。
系统工程师定时巡检目标在于经过巡检立即发觉和纠正可能出现硬件和系统问题,从而在最大程度上为设备连续稳定运行提供确保,巡检内容关键包含:
1)服务器主机系统运行状态;
2)网络设备运行状态;
3)外部设备(包含磁盘阵列)运行情况;
4)全部连接接口,CABLE,电源等可能轻易造成设备出现问题敏感部件;
5)检验系统Errorlog;
6)帮助用户机房技术人员处理和分析日常设备运行中出现未处理问题。
3)故障排除
保修协议生效后,系统发生故障后每次服务步骤以下:
●报修
系统发生故障,用户可在第一时间内和金支点项目经理(责任工程师)取得联络,说明用户单位、故障机型,尽可能说明故障现象和可能故障原因。
用户也可和金支点北京服务中心直接联络,服务中心调度长在第一时间内和金支点项目经理取得联络,北京服务中心SMS系统会全程跟踪此次服务。
●响应
金支点项目经理会立即在响应时间(本项目为30分钟)和用户现场工程师取得联络,取得具体故障信息,做出对应判定,在电话中和用户工程师互动交流,首先排除因系统参数设定、使用中软性故障,假如未能排除故障则服务工程师立即准备赴现场服务。
●现场服务
服务工程师携带对应备件赴用户现场进行维修。
首优异行现场诊疗,分析锁定故障部件,更换部件或调整参数,数据恢复,直至系统恢复正常运行。
每次现场服务完成后,由金支点工程师填写《现场工作日志》,由用户方代表确定并签署意见后交企业存档。
如第一次现场服务不能处理故障,则立即开启应急预案。
●第三方配合
金支点企业承诺:
只要是金支点所保系统发生故障,我们服务工程师必需在第一时间内赶赴用户现场。
不管是系统硬件、操作系统故障,还是非金支点负担网络、应用程序故障,或系统升级改造、系统迁移等,金支点服务工程师将主动配适用户完成系统维护工作,绝不会因扯皮推卸责任而损害用户利益。
4)AIX常见故障诊疗技术
计算机故障类型和故障诊疗手段有很多,对于AIX小型机故障我们通常采取以下2种诊疗方法:
✧硬件故障诊疗,诊疗并排除由硬件引发故障;
✧软件故障诊疗,诊疗并排除由软件(操作系统和应用软件如Oracle数据库、中间件等)引发故障
软件故障诊疗
因为软件故障情况错综复杂,通常我们常见以下命令来查看系统状态。
●#lsdev–Ccadapter
列出各I/O卡及设备全部相关信息:
如逻辑单元号,硬件地址及设备文件名等。
●#ps-ef
列出正在运行全部进程多种信息:
如进程号及进程名等。
●#netstat–rn
列出网卡状态及路由信息等。
●#ifconfig-a
列出网卡状态及网络配置信息。
●#df
列出已加载逻辑卷及其大小信息。
●#lsvg-o
列出已加载逻辑卷及其加载位置。
●#oslevel–s#uname–a
列出系统ID号,OS版本及用户权限等信息。
●#hostname
列出系统网络名称。
●#lsdev–Ccdisk
显示磁盘多种信息,如磁盘大小,包含逻辑卷,设备名称等。
●#lsvg–lvgname
显示逻辑卷组信息,如包含哪些物理盘及逻辑卷等。
网络故障
●如需修改网络地址、主机名等,一定要用smittymktcpip命令
●查看网卡状态:
ifconfig-a
HardwareStationCrdHardwareNet-Interface
PathAddressIn#statenameunitstate
8/20/5/10xFB0uplan0up
●确定网络地址:
#ifconfigen0
●开启网卡:
#ifconfigen0up
●网络不通诊疗过程:
Ifconfig-a查看网卡是否开启(up)
ping自己网卡地址(ip地址)
ping其它机器地址,如不通,在其机器上用lanscan命令得悉stationaddress,然后linkloopstation_address来确定网线及集成器是否有问题。
在同一网中,subnetmask应一致。
●配置网关
手动加网关:
/usr/sbin/routeadddefault20.08.28.981
把网关自动加入系统中
vi/etc/rc.config.d/netconf
:
ROUTE_DESTINATION[0]=default
ROUTE_GATEWAY[0]=20.08.28.98
ROUTE_COUNT[0]=1
:
/sbin/init.d/net将实施:
/usr/sbin/routeadddefault20.08.28.981
命令netstat-rn查看路由表
另外也可用set_parmsaddl_netwrk来设缺省路由。
Oracle数据库预防和检测帮助
因为采取预防为主策略,现在我们知道仅仅靠电话支持服务和紧抢救援服务不是处理ORACLE数据库问题根本方法,因为这些方法无法避免和预防ORACLE突发问题产生。
为使生产系统能够愈加安全,高效地运行,避免ORACLE数据库因意外问题而带来损失,所以用户需要定时数据库系统维护服务,我企业将派工程师为用户定时巡检。
定时巡检和检测服务能够享受到以下好处
✓加紧应用系统实施周期
✓规范化用户数据库维护工作
✓最大程度地提升系统可用性
✓经过高水平系统维护最大程度降低系统停机时间
✓在现场进行数据库监控和信息搜集,缩短问题处理时间
✓将ORACLE经验和技术带给您支持队伍
✓完善和增强现有系统维护人员能力
✓得到专门技术支持资源,确保技术支持工程师熟悉现场配置和环境
✓和我ORACLE工程师共同工作,以更高效方法提升问题处理能力
✓把ORACLE资深支持工程师技术和经验传授给您系统维护人员
定时巡检和检测服务承诺
✧定时对系统进行全方面检验,给出具体汇报,依据检验结果给出对应提议和改善方案
✧检验并分析系统日志及跟踪文件,发觉并排除数据库系统错误隐患
✧检验数据库空间使用情况
✧数据库备份和恢复
✧帮助处理数据库维护和开发过程中出现问题
✧提出检验汇报和提议和改善方案
5)巡检
定时巡检目标在于立即发觉和预防可能出现硬件和系统问题,从而在最大程度上为系统连续稳定运行提供确保,巡检工作关键包含:
Ø主机系统运行状态,对系统CPU、内存、I/O状态、进程等检验;对系统设置、日志文件、ErrorReport进行检验分析,清理系统中日志文件和垃圾文件;
Ø外部设备运行状态,对磁盘阵列、磁带机、外置光驱、维护终端等状态、设置进行检验;对风扇、后备电池、磁盘、磁带、键盘等敏感部件进行关键检验,如有故障征兆则进行先期更换;
Ø数据备份;
Ø网络设备运行状态;
Ø连接件检验,对连接插头、电缆、电源插座等进行检验;
Ø环境检验,包含电源电压、接地和室内温度、湿度、空气洁净度等;
Ø清洁保养,清除机箱、滤清器内灰尘和异物;
Ø系统优化,帮助用户对OS进行系统性能调整和系统优化,提升系统效率;进行相关安全性进程检验;
Ø技术交流,双方技术人员分析和处理日常运行中出现未处理问题;
Ø工作汇报,在对系统进行全方面检验后,给出具体汇报,依据检验结果给出对应提议和改善方案。
北京金支点技术服务为XXXX企业提供每三个月一次全方面巡检,并出具具体《巡检汇报》,由金支点工程师填写,由用户方代表确定并签署意见后交企业存档,方便XXXX企业控制和管理。
6)备份和恢复策略
伴随信息技术广泛应用,计算机系统可靠性对生产系统影响越来越大。
作为IT服务提供者,我们将仔细、全方面地考虑而且制订备份和恢复策略。
操作系统备份以系统卷为主,必需建立完整系统备份档案,确保系统宕机时能立即恢复系统原有状态,包含此系统下运行全部相关软件配置。
双机热备份软件应按应用系统实际配置情况制订相关数据备份计划,如卷组备份、卷备份、文件系统备份、文件备份等。
应用系统数据备份应由应用部门依据应用实际情况列出全部相关数据连接关系,方便制订出一份具体数据备份计划,为数据恢复提供一份完整依据。
我企业系统工程师将为用户制订一份完整系统备份方案,在日常维护过程中有义务帮助用户做好系统数据备份工作,并提供相关技术支持,用户备份介质将存放在用户处,方便故障恢复。
当用户系统出现故障以后,我企业系统工程师将在用户故障现场,开始进行故障排除工作。
需要用备份数据做系统恢复时,用户方需提供完整数据备份。
系统工程师还将对用户提供系统升级和安装补丁工作。
若包含非系统软件补丁,只要用户提供补丁,我们也承诺帮助用户完成安装任务。
7)项目实施计划
北京金支点技术服务依据实际服务要求、多种资源情况、系统运行情况和其它现实原因,要求项目组长必需要全方面计划出一个符合实际整个工作进度计划。
这里我们估量时间大致为:
8)工作结果和工作汇报
●现场服务汇报:
抵达时间,工作内容,工作结果,遗留问题,用户评价等。
每次工作完成后提交。
●巡检汇报:
系统状态检测评定,系统备份统计,系统管理提议。
汇报每三个月提交一次。
●年度汇报:
包含年度保修工作统计,保修工作统计,更换部件统计,联席工作会议统计,系统管理提议,最终系统状态检测评定统计。
项目结束后一周内提交。
现场服务报告样表
四、服务保障方法
行话常讲:
说得好不如干好,干好就要看得见。
保修服务含有不可感知性、差异性等特点,就是说服务好坏只有到项目结束时才能得出评价,而且不一样人评价结果会有一定差异,所以光凭事前承诺和事后处罚约束不一定就能选择适宜服务提供商。
金支点在多年IT服务经验基础上基础形成了科学量化、规范化、可视化服务体系。
1)备件保障
考虑到本项目含有系统安全性要求高、所保机型技术水准高等特点,为了做好本项目标服务,首要原因是必需含有有效备件保障,我们提议备件保障分三级布署:
1级—当地备件保障,设置备件库,配置对应机型关键系统及常见易损件,包含CPU、电源、硬盘、网卡、SCSI卡、风扇等,当系统故障时立即更换损坏部件,或当第一次现场服务故障未能排除时,开启应急预案,将现场备机顶替故障系统运行,这么能够有效确保协议约定修复时间。
此备件为XXXX企业项目专题专用,不能调用于其它服务项目,并随项目情况应随时调整补充库存。
我们将和XXXX企业项目经理共同分析所保系统运行情况,圈定系统微弱步骤,共同商议当地备件布署计划,包含型号、数量、保留地点、检验方法、调整周期等,北京金支点企业必需在保修服务开始前将协议约定备件运抵用户现场。
注:
“配置整机”是指一套能够加电运行系统,其和保修设备同型号但可能配置有所不一样。
“配置备件”是指关键计算机部件,如CPU、内存、磁盘等。
2级—北京中心备件库,作为1级备件库后盾和补充。
针对本项目将配置对应(或类似)整机及备件,包含IBM小型机及存放,北京单程响应周期为2小时。
企业在北京设有中心备件库,备有品种齐全备件,保持备件库中总可随时提供给用户使用。
对于服务等级高关键用户,企业将专题配置关键备件或整机。
企业设有专用机房,配置有多种VAX、ALPHA、RS6000、HP整机,利用系统模拟现场工作环境用来远程诊疗测试,能够立即有效地锁定故障,缩短维修周期。
企业有着通畅备件配送渠道,确保了企业立即备件供给和处理突发事件能力。
3级—合作厂商资源
北京金支点企业和其它同业企业建立有很好合作关系,突发情况下我们可和IBM企业服务站等合作厂商取得紧急备件支援,企业建立有通畅快捷备件供给和配送渠道,能够快速地从美国、欧洲调配到所需备件。
2)当地化服务
我们将把本项目标服务基地为北京金支点总企业,有十分充足备件库,有优异工程技术人员,能提供优质高效服务。
3)组织及人员保障
制订了和服务相关一系列管理措施、标准作业步骤和规范化技术规范,并在不停地加以修改和完善。
金支点已经过了服务和支持方面ISO9001国际认证。
我们一直用ISO质量标准来管理和指导服务业务。
企业专门为用户设置了800无偿服务热线,设有专员值守负责接待用户来电来访,使用户需求能够得到立即有效响应。
在较长节日前,企业将立即提醒用户检验、备份系统,并提供节日期间金支点值守安排计划。
金支点有60余名技术人员,其中30名工程师专业从事服务业务,主攻专业包含主机、网络、数据库、应用及用户资源管理等,数名资深高级工程师有着十多年丰富实践经验,含有高超技术水平和服务水平,大部分服务工程师经过了原厂商专业技术认证。
企业定时对服务工程师进行多种新产品、新技术和服务技巧等内容培训,以提升技术人员技术水平和服务水平。
项目领导组
组长:
由XXXX企业指定;
副组长:
张华雷,北京金支点技术服务总经理;
职责:
Ø审核同意项目标总体维护维修服务方案,并制订工程验收标准;
Ø负责本项目维护维修实施过程中重大事件决议;
Ø依据项目过程进度、质量、技术、资源、风险等实施宏观监控;
Ø负责组建验收小组,主持验收工作;
项目实施组
组长:
杨振广,北京金支点技术服务技术总监,IBM高级工程师;
副组长:
由XXXX企业指定;
职责:
Ø依据项目要求制订整体维修服务工作计划;
Ø协调项目组内人员分工合作,资源分配;
Ø负责制订阶段验收标准和最终验收标准,报领导小组审批;
Ø负责计算机设备定时检验、故障维护、性能优化、调试等工作;
Ø依据各阶段工程安排,有组织地对用户工程技术人员进行技术培训。
Ø负责将按时提供本项目所需服务人员、技术和设备;
Ø依据项目实施计划,进行文档标识和追踪、整理存档。
组员:
XXX,AIX高级工程师;
XXX,资深ORACLE工程师;
XXX,HP/Alpha工程师;
XXX,技术支持工程师;
XXX,测试工程师;
XXX,服务专员;
XXX,商务助理,物流主管;
项目验收组
组长:
由XXXX企业指定;
组员:
XXXX企业技术人员、北京金支点技术服务工程技术人员;
职责:
Ø依据项目实施组制订验收标准进行验收;
Ø生成验收汇报,提交项目领导组审批。
针对本项目将专门成立XXXX企业项目组,人员及分工以下:
项目经理:
专职负责所保设备故障维修和日常维护,是用户和金支点企业保修工作唯一界面。
经过项目经理用户能够处理技术、商务等一切问题。
凡涉密系统保修业务,金支点企业将选派政治可靠、技艺高超、认真负责工程师担当项目经理。
服务专员:
负责和用户联络和回访,帮助责任工程师协调和处理保修过程中出现商务事务工作。
服务工程师:
在项目经理领导下实施故障维修和日常维护。
调度长:
负责企业日常保修业务调度。
当项目经理在现场需要支持时,由调度长整体负责调度协调我企业人力、物力资源,包含派出第二批次现场工程师、开启应急预案、调用第三方资源等。
后备工程师:
金支点在中国各地配置有30名熟练技术工程师专职从事保修服务工作,专业覆盖小型机系统(IBMRS6K、HPALPHA、HP9K、SUN)、数据库(ORACLE、ORACLE)、网络(CISCO、3COM、CABLETRON及网管、网络安全)等。
金支点企业将对用户设备及使用情况进行分析,计划调配工程师,当项目经理无法快速抵达用户现场或不能在第一时间内排除故障情况下,由后备工程师出任支援现场服务。
服务总监:
定时对服务质量和完成情况进行监督,受理甲方业务投诉,由企业主管副总经承当。
政治面貌
-
职称
高工
职务
工作简历
4)安全条款
在维护工作前,金支点服务工程师须提前二十四小时(紧急故障处理除外)向XXXX企业项目主管提出书面维护申请。
内容包含维护目标、操作工程师、操作步骤、包含系统硬件变更、包含系统软件变更、估计操作所需时间、申请操作所需时间等内容。
待得到XXXX企业项目主管书面批复后维护工作方能开始,且全部操作必需有XXXX企业方代表在场。
如维护工作需要使用移动介质,则必需事先在XXXX企业当地进行病毒检验,经用户方确定方可使用。
维护操作必需事先做好操作方案并制订应急方案,必需严格掌握控制操作时间。
全部操作必需两人以上在场,其中一人主持操作一人确定具体统计,全部操作统计须存档并长久保留。
5)巡检
经过巡能够立即发觉并排除故障隐患,有效确保用户系统正常运行。
定时系统和数据备份能够快速恢复业务应用,一旦系统故障能够把损失风险降到最小。
常常化、制度化巡检能够保持双方技术人员活跃接触,有更多机会交流在系统使用及系统维护方面经验,有利于提升系统维护效率。
我企业每三个月巡检一次。
6)服务监督
用户可随时拨打800热线,对企业服务提出批评和提议,企业将热情接待每一位用户,认真听取用户意见,并将处理结果立即反馈给用户。
金支点设有专门服务监督机构,由主管服务副总经理全方面负责。
服务监督机构不定时以多种方法向用户咨询对企业服务意见和提议