系统运维操作手册范本Word格式.doc
《系统运维操作手册范本Word格式.doc》由会员分享,可在线阅读,更多相关《系统运维操作手册范本Word格式.doc(29页珍藏版)》请在冰点文库上搜索。
1 概述 5
2 主机系统 6
2.1 检查文件系统利用率 6
2.2 查看系统硬件软件告警日志 6
2.3 检查僵死或运行时间过长的进程 7
2.4 检查系统CPU利用率 8
2.5 检查系统内存利用率 8
2.6 检查系统IO利用率 9
2.7 检查系统交换量 10
2.8 检查系统高可用性(HA)的使用状态 10
2.9 清理过时的系统临时文件 11
2.10 检查磁带库和磁带使用情况 11
2.11 修改用户口令 12
2.12 清洗磁带机 12
2.13 检索操作系统日志 13
3 系统启动与关闭 14
3.1 系统的运行架构 14
3.2 系统的启动 15
3.3 系统的关闭 18
4 系统部署 24
4.1 生成部署包 24
4.2 程序部署 28
5 重要的系统参数配置 41
5.1 Config.properties 41
5.2 spring-mistask.xml 41
6 日志查看 43
6.1 WAS日志 43
6.2 DB2日志 43
7 查系统是否正确运行 45
8 系统管理员维护人员信息日志 47
9 查看表空间及附件硬盘的使用情况 48
9.1 Db2表空间查看 48
9.2 115服务器附件文件占用情况 48
10 服务停启顺序 50
1概述
本手册给出了湖南省移动公司的报账平台系统及报账平台外围系统的运维操作细则。
手册从主机系统、应用系统以及数据库系统三个方面对任务项进行组织,对应章节包括第Error!
Referencesourcenotfound.章报账平台主机系统,第Error!
Referencesourcenotfound.章报账平台应用软件系统以及第Error!
Referencesourcenotfound.章报账平台数据库系统。
每个任务项中可能涉及的表格将在第5章表单模板中统一给出。
2主机系统
2.1检查文件系统利用率
编号
名称
检查文件系统利用率
描述
此任务检查文件系统利用率不低于85%或有大于0.5G以上的空闲空间
操作角色
主机系统
管理员
所属管控类别
巡检
执行频度
每日
操作说明
1.系统的正常运行应保证有足够的磁盘空间,文件系统被写满会导致系统服务的中断,可以使用df–k进行检查是否有文件系统利用率高于85%并且可用空间小于500M,对于保存数据库数据文件所在的磁盘空间和保存归档日志的应有更高的空闲空间。
2.但也不可以盲目的扩展文件系统,因为目前31省所使用的文件系统均不可以缩小,如果要回收空间只能删除重建
表单填写
参见表单模板中的巡检单表格
2.2查看系统硬件软件告警日志
查看系统硬件软件告警日志
此任务查看系统硬件软件告警日志
以root运行tail/var/adm/messages查看,如果系统写满了一个message文件会自动备份为message.0,message.1等。
2.3检查僵死或运行时间过长的进程
检查僵死或运行时间过长的进程
此任务查看检查僵死或运行时间过长的进程
1.使用ps–ef|grepapplprd和ps–ef|greporaprd进行检查(运行时间超过12小时的绝大部分是需要注意的进程)。
2.而程序名为defunct的均为孤儿或僵死进程。
3.由于,夜晚为非工作时间,因此运行超过12个小时的应用服务例如,form服务的客户端进程(AIX平台为f60runm,SUN平台为f60webmx),很可能是运行出错的进程,应可以kill掉,对于数据库进程一般不采用在UNIX命令中kill的方法而是登陆到数据库使用altersystemkillsession‘<
sid>
<
serial#>
’的方法中止该数据库进程。
2.4检查系统CPU利用率
检查系统CPU利用率
此任务检查系统CPU利用率
1.prstat–asolaris
2.psrinfo-v(CPU状态)
2.5检查系统内存利用率
检查系统内存利用率
此任务检查内存利用率
1.solarisvmstat查看free值
2.prtdiag-v
2.6检查系统IO利用率
检查系统IO利用率
此任务检查IO利用率
1.solarisiostat
2.7检查系统交换量
检查系统交换量
此任务检查系统交换量
1.手动运行的方法如下:
topas
2.swap–l&
&
swap–ssolaris
2.8检查系统高可用性(HA)的使用状态
检查系统高可用性(HA)的使用状态
此任务检查系统高可用性(HA)的使用状态
1.webview状态
#/etc/opt/FJSVwvbs/etc/bin/wvstat
2.CF和心跳状态
#cftool-和cftool-r
3.SF状态
#sdtool-s
4.CIP状态
#ciptool-a和#ciptool-n
5.CRM状态
#/etc/opt/FJSVcluster/bin/clgettree
6.RMS状态
#hvdisp-a
1.
2.9清理过时的系统临时文件
清理过时的系统临时文件
此任务清理过时的系统临时文件
每周
1.f60*dump*。
2.$ORACLE_HOME/reports60/server/cache/*(最好关闭服务清理)。
3.$APPLTMP/*(只有关闭服务后可以进行)。
2.10检查磁带库和磁带使用情况
检查磁带库和磁带使用情况
此任务检查磁带库和磁带使用情况
1.检查是否有足够的空间保存备份。
2.磁带库运行中是否有错误出现。
2.11修改用户口令
修改UNIX用户口令
此项目修改用户口令
用户帐号及密码管理
每月
1.修改UNIX密码步骤如下:
letterbox{username}1:
passwd
Enterloginpassword:
您的旧密码
Newpassword:
您的新密码
Re-enternewpassword:
passwd(SYSTEM):
passwdsuccessfullychangedforusername
letterbox{username}2:
2.密码修改之后,必须及时通知系统管理员。
修改过UNIX口令之后,需要通知需要知道口令的人员。
参见表单模板中的用户帐号管理情况登记表
2.12清洗磁带机
清洗磁带机
此任务将清洗磁带机清洗干净
备份管理
用清洗带清洗磁带机。
2.13检索操作系统日志
检索AIX操作系统日志
此任务检索操作系统日志
日志管理
1.查看用户登陆日志:
在命令行输入命令:
last
2.查看用户失败登陆日志:
在命令行输入命令,进入日志所在目录:
cd/etc/security
查看日志内容:
vifailedlogin
3.查看su命令执行日志内容:
在命令行输入命令,进入日志所在目录:
cd/var/adm
查看日志内容:
visulog
4.查看Auditor文件操作日志
首先需要在系统中开启audit功能,会在系统中自动生成/etc/security/audit/bin*文件。
此处的bin*指所有以bin开头的文件
进入日志所在目录:
cd/etc/security/audit/
查看日志:
vibin*
参见表单模板中《日志检索申请表》及《日志检索记录表》
根据情况可能需要《备份介质访问登记表》
3系统启动与关闭
3.1系统的运行架构
3.2系统的启动
检查系统启动
此任务查看系统登录以了解应用系统此时此刻的运行状况
应用系统
系统更改
第一步:
第二步:
挂接NFS:
第三步:
启动其他软件,
输入用户名root和root的密码,点击OK。
选择GlobalClusterService;
选择ClusterAdmin,选择其中的任意一个节点,如dbsvr;
选择rms标签页,在Tools菜单中选择启动;
启动后的状态如下图所示:
3.3系统的关闭
系统关闭
此任务查看系统关闭
关闭其他软件
这样,应用就关闭完成了。
选择rms标签页,在Tools菜单中选择关闭;
根据需要,选择stopallApps。
关闭完成后,如下图所示:
4系统部署
4.1生成部署包
首先,需要更新SVN上的版本,在版本管理机器F:
\ProductSpecial\Src1128\src下,选定下面的文件,按右键,选择update:
F:
\ProductSpecial\Src1128\WebRoot下,选定下面的文件,按右键,选择update:
进入Eclipse:
查看项目属性,确实为F:
\ProductSpecial\Src1128的项目:
在项目上按右键,选择Refresh。
在Project菜单,选择Clean:
待Clean完成后,在File菜单选择Export,
选择Warfile:
导出到一个文件夹:
这样,部署包就生成了。
4.2程序部署
登录到:
http:
//10.154.140.115:
9060/ibm/console/
输入用户名,可输入root:
选择应用程序——》企业应用程序,选定eFinance.war,点击停止:
待停止完成后,选择eFinance.war,点击删除:
点击确定:
点击保存:
点击安装:
点击浏览,选定部署包:
输入上下文根:
eFinance,点击下一步:
点击下一步:
选定所有集群和服务器,选定ent_bpms,点击应用;
选定ent_bpms,点击下一步:
点击完成:
部署包已经部署完成,如下图所示:
下一步的任务是启动应用程序。
点击集群:
选择Cluster,点击停止:
待选择Cluster,点击启动:
启动完成后,如下图所示:
启动完成后,进行验证:
//10.154.140.116/eFinance
5重要的系统参数配置
6日志查看
6.1WAS日志
检查WAS日志
此任务查看WAS日志状况
1.Wassvr日志存放于:
/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/logs/wassvr
2.dbsvr日志存放于
/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/logs/dbsvr
6.2DB2日志
检查DB2日志
此任务查看DB2日志状况
1.Db2日志存放与dbsvr服务器的:
/ef/appinst/sqllib/db2dump
7查系统是否正确运行
检查系统登录
1.如果页面能正常显示,说明115服务器或117服务器运行正常如图所示:
检查登录页面公司参照列表是否能正常显示所有公司
2.检查是否能正常登陆
115服务器运行页面:
117服务器运行页面:
8系统管理员维护人员信息日志
当管理员登录后可以看到如下图所示的页面:
您可以先点击:
系统管理员专区(用红色的框标出)进入相应的页面后,可以看到一个日志管理(用红色的框标出)的菜单,点击日志管理就可以查询相应的历史人员维护信息。
9查看表空间及附件硬盘的使用情况
9.1Db2表空间查看
检查DB2表空间情况
此任务查看DB2表空间情况
1..登录117dbserver,进入到db2cmd命令格式下,链接到数据库下使用listtablespaseshowdetail命令查看数据表使用情况,空间是否快满。
9.2115服务器附件文件占用情况
检查115服务器附件文件占用情况
此任务查看115服务器附件文件占用情况
1.Telnet到115服务器,使用df–h命令查看attachment文件目录的占用情况,以便及时扩容快满的硬盘
10服务停启顺序
-29-