IBM小型机维护指导书V100326B.docx

上传人:b****3 文档编号:5708638 上传时间:2023-05-09 格式:DOCX 页数:22 大小:55.57KB
下载 相关 举报
IBM小型机维护指导书V100326B.docx_第1页
第1页 / 共22页
IBM小型机维护指导书V100326B.docx_第2页
第2页 / 共22页
IBM小型机维护指导书V100326B.docx_第3页
第3页 / 共22页
IBM小型机维护指导书V100326B.docx_第4页
第4页 / 共22页
IBM小型机维护指导书V100326B.docx_第5页
第5页 / 共22页
IBM小型机维护指导书V100326B.docx_第6页
第6页 / 共22页
IBM小型机维护指导书V100326B.docx_第7页
第7页 / 共22页
IBM小型机维护指导书V100326B.docx_第8页
第8页 / 共22页
IBM小型机维护指导书V100326B.docx_第9页
第9页 / 共22页
IBM小型机维护指导书V100326B.docx_第10页
第10页 / 共22页
IBM小型机维护指导书V100326B.docx_第11页
第11页 / 共22页
IBM小型机维护指导书V100326B.docx_第12页
第12页 / 共22页
IBM小型机维护指导书V100326B.docx_第13页
第13页 / 共22页
IBM小型机维护指导书V100326B.docx_第14页
第14页 / 共22页
IBM小型机维护指导书V100326B.docx_第15页
第15页 / 共22页
IBM小型机维护指导书V100326B.docx_第16页
第16页 / 共22页
IBM小型机维护指导书V100326B.docx_第17页
第17页 / 共22页
IBM小型机维护指导书V100326B.docx_第18页
第18页 / 共22页
IBM小型机维护指导书V100326B.docx_第19页
第19页 / 共22页
IBM小型机维护指导书V100326B.docx_第20页
第20页 / 共22页
亲,该文档总共22页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

IBM小型机维护指导书V100326B.docx

《IBM小型机维护指导书V100326B.docx》由会员分享,可在线阅读,更多相关《IBM小型机维护指导书V100326B.docx(22页珍藏版)》请在冰点文库上搜索。

IBM小型机维护指导书V100326B.docx

IBM小型机维护指导书V100326B

资料编码

产品名称

IBM小型机

使用对象

产品版本

编写部门

资料版本

V1.0

IBM小型机维护指导书

拟制:

日期:

审核:

日期:

审核:

日期:

批准:

日期:

修订记录

日期

修订版本

描述

作者

2005-3-28

V1.0

HACMP管理整合到该文档中

目录

第1章AIX系统管理日常工作(检查篇)1

1.1常用的命令1

1.2语法介绍1

1.2.1vmstat:

检查内存、CPU、进程状态1

1.2.2sar:

检查CPU、IO2

1.2.3PS:

检查进程状态命令3

1.2.4svmon:

显示进程占用内存3

1.2.5iostat:

显示磁盘IO4

1.2.6netstat,entstat:

显示网卡信息4

1.2.7no:

显示tcpip参数设置5

1.2.8其它命令5

第2章AIX系统管理日常工作(LV篇)6

2.1IBMAIX系统管理的日常工作6

2.1.1开关机步骤6

2.1.2用户组及用户管理6

2.1.3文件系统维护6

2.1.4系统日常管理6

2.1.5系统备份6

2.1.6定时清洗磁带机7

2.1.7定时检查设备指示灯状态7

2.1.8简单故障的判断7

2.1.9熟悉ibmaix操作系统7

2.2关于IBMAIX的逻辑卷管理7

2.3LVM命令8

第3章AIX系统管理日常工作(关键参数检查篇)10

3.1AIO参数检查10

3.2磁盘阵列queue_depth参数检查10

3.3用户参数检查11

3.4激活SSAFast-WriteCache11

3.5IO参数设置11

3.6syncddaemon的数据刷新频率12

3.7检查系统硬盘的镜像12

第4章AIX系统管理日常工作(性能分析篇)13

4.1性能瓶颈定义13

4.2性能范围13

第5章AIX系统管理日常工作(SHUTDOWN篇)14

5.1概念14

5.2关机命令14

第6章AIX系统管理日常工作(备份与恢复篇)14

6.1用SMIT备份14

6.2手工备份14

6.3恢复系统14

第7章HACMP的双机系统的管理和维护15

7.1HACMP双机系统的启动15

7.2HACMP双机系统的关闭15

7.3察看双机系统的当前状态16

7.4HACMP环境下的排错17

7.4.1了解问题的存在17

7.4.2判断问题的出处18

关键词:

AIX系统管理IBM

摘要:

缩略语清单:

参考资料清单:

第1章AIX系统管理日常工作(检查篇)

1.1常用的命令

CPU

Memory

Disk

Network

标准UNIX命令(包括HP、SUN等)

vmstat,sar,ps

vmstat,ps

iostat,sar,vmstat,

netstat,nfsstat

AIX详细输出

tprof

svmon,rmss

filemon,fileplace

entstat

AIX非常详细输出

syscalls,trace,emstat

trace

trace

trace,iptrace

分析工具

topas

topas

topas

topas

1.2语法介绍

1.2.1vmstat:

检查内存、CPU、进程状态

#vmstat115

kthrmemorypagefaultscpu

---------------------------------------------------------------

rbavmfrerepipofrsrcyinsycsussyidwa

10281328127700000013237567651340

20281328127700000012733813199000

20281328127700000013231613199000

20281328127700000012031712699000

20281328127700000014631612799000

20281328127700000013031712599000

20281328127700000013531612799000

20281328127700000012931712499000

20281328127700000013330412799000

r:

正在运行的进程

b:

被阻挡的进程

avm:

活动的虚内存,单位4kb

fre:

自由列表,位4kb

po:

页换出

pi:

页换入

sy:

系统占用CPU

id:

空闲CPU

wa:

等待的CPU

1.2.2sar:

检查CPU、IO

例如:

sar-u130

sar-PALL110

语法:

sar-[abckmqruvwyA]intevalrepetition

-bbuffer活动

-c系统调用

-k内核进程统计.

-m消息及信号量活动

-q正在运行的队列数及等待队列数

-r页交换统计

-uCPU利用

-PCPU负载.

1.2.3PS:

检查进程状态命令

ps:

显示当前SHELL重所有进程

ps-ef:

显示系统中所有进程,-f显示更详细信息

ps-uoracle:

显示oracle用户进程

ps–emoTHREAD:

显示线程信息

psau;psvg:

按使用时间显示进程(最近一次调用)

psaux:

按使用时间显示进程(进程启动)

1.2.4svmon:

显示进程占用内存

svmon–G:

显示系统占用内存

svmon-Ccommand_name:

显示某个用户进程占用内存

svmon-Ppid

显示某个进程占用内存

svmon–S:

显示段占用内存

1.2.5iostat:

显示磁盘IO

tty:

tintoutavg-cpu:

%user%sys%idle%iowait

0.04.00.91.395.42.5

Disks:

%tm_actKbpstpsKb_readKb_wrtn

hdisk058.4218.341.2172920

hdisk116.885.621.44280

hdisk250.6223.955.6110020

hdisk316.885.621.44280

hdisk40.00.00.000

hdisk543.4279.169.813960

hdisk60.00.00.000

hdisk716.427.220.20136

hdisk80.00.00.000

hdisk99.4156.011.40780

hdisk1016.427.220.20136

cd00.00.00.000

1.2.6netstat,entstat:

显示网卡信息

netstaten0:

显示en0信息

netstat–s:

显示网络信息

netstat-m

显示网络buffers.

netstat-i

显示网卡状态

netstat-Ien01

显示eno网卡塞(1秒间隔)

1.2.7no:

显示tcpip参数设置

no–a:

显示tcpip所有参数当前设置

no-otcp_keepalivetime=7200000

设置tcp_keepalivetime等于3600000秒

no-d恢复默认值

注:

该方法在重启后失效

1.2.8其它命令

检查文件系统

df-k

检查设备

lsdev-C

检查物理卷

lspv

检查交换区

lsps-a

检查配置

lscfg-vp

检查软件

lslpp-l

检查用户

who

第2章AIX系统管理日常工作(LV篇)

2.1IBMAIX系统管理的日常工作

系统管理员对小型机系统的正确管理是系统稳定运行的保障,作为系统管理员应注意以下几个方面:

2.1.1开关机步骤

2.1.2用户组及用户管理

2.1.3文件系统维护

发现文件系统已满,应及时删除无用文件或扩大文件系统。

2.1.4系统日常管理

系统管理员最好用smit来进行系统管理。

Smit是以菜单方式工作的工具包,它包括了日常管理工作的所有命令,操作简便。

2.1.5系统备份

备份是保护用户数据不丢失的重要手段。

一般系统备份的要求如下:

A.每一台机器的操作系统至少有一个全备份。

B.每天备份用户数据。

C.操作系统配置修改后重新备份操作系统。

2.1.6定时清洗磁带机

2.1.7定时检查设备指示灯状态

2.1.8简单故障的判断

2.1.9熟悉ibmaix操作系统

2.2关于IBMAIX的逻辑卷管理

IBMAIX存储管理的五个基本概念:

物理卷PhysicalVolume,称为PV:

指物理上硬盘,一个硬盘就是一个PV,名字为HDISK0、HDISK1。

物理分区(PhysicalPartitions):

物理卷被划分成大小一样的物理分区PPs

逻辑卷组LogicalVolumeGroup,称为VG:

一个VG包含整数个PV,可理解为一个大硬盘。

逻辑卷LogicalVolume,称为LV:

相当于对大硬盘进行逻辑分区,一个VG里可有若干个LV,对用户讲,LV上的数据是连续的,但PV上的数据可能是分散的。

逻辑分区(LogicalPartitions):

每个LV有若干逻辑分区(LPs)组成,每个逻辑分区至少有一个PV组成。

文件系统FileSystem:

在逻辑卷的基础上,可建立文件系统JFS,然后MOUNT到一个目录下,这样就可以文件存取的方式来使用这块硬盘了。

当然,您也可以不建文件系统,而直接把LV当作裸设备,以TRUNK方式来存取数据,许多数据库都是用这种方式存取数据。

LVM的关系如下图:

2.3LVM命令

一般采用smit命令可对PV、VG、LV、JFS等进行图形化管理,命令如下:

smitlvm

屏幕显示如下:

AddaLogicalVolume

LogicalvolumeNAME[scratch]

*VOLUMEGROUPnametestvg

*NumberofLOGICALPARTITIONS[64]#

PHYSICALVOLUMEnames[hdisk1hdisk2hdisk3]+

LogicalvolumeTYPE[jfs]

POSITIONonphysicalvolumemiddle+

RANGEofphysicalvolumesminimum+

MAXIMUMNUMBERofPHYSICALVOLUMES[]#

touseforallocation

NumberofCOPIESofeachlogical2+

partition

MirrorWriteConsistency?

yes+

Allocateeachlogicalpartitioncopyyes+

onaSEPARATEphysicalvolume?

RELOCATEthelogicalvolumeduringyes+

reorganization?

LogicalvolumeLABEL[]

MAXIMUMNUMBERofLOGICALPARTITIONS[512]#

EnableBADBLOCKrelocation?

yes+

SCHEDULINGPOLICYforreading/writingparallel+

logicalpartitioncopies

EnableWRITEVERIFY?

no+

FilecontainingALLOCATIONMAP[]

StripeSize?

[64K]

行命令:

.lsvg:

查看vg名字

查看vg详细信息:

lsvg

查看vg内的LVs:

lsvg-l

查看vg内的PV:

lsvg-p

查看激活的VG:

lsvg–o

.lspv:

查看物理卷组pg名字

查看PV详细信息:

lspvhdiskN

查看PV内的LVslspv-lhdiskN

查看PV内的PP:

lspv-phdiskN

.lslv:

查看LV的信息

查看LV名字:

lsvg-l

查看LV详细信息:

lslv

查看PV内的LVs:

lslv-l

查看PV内的PP:

lslv-p

查看镜像的LV:

lslv-m

第3章AIX系统管理日常工作(关键参数检查篇)

3.1AIO参数检查

#lsattr-Elaio0

minserversXMINIMUMnumberofserversTrue

maxservers80MAXIMUMnumberofserversTrue

maxreqs4096MaximumnumberofREQUESTSTrue

kprocprio39ServerPRIORITYTrue

autoconfigavailableSTATEtobeconfiguredatsystemrestartTrue

fastpathenableStateoffastpathTrue

●MaxServers=10*numberofdisks

●MinServers=MaxServers/2

其中MaxServers最大为80

可用命令#smittyaioChange/ShowCharacteristicsofAsynchronousI/O

修改相应的值。

3.2磁盘阵列queue_depth参数检查

假设DATAVG的RAID盘为hdisk2

#lsattr-Elhdisk2

pvid00019081a0dc91ea0000000000000000PhysicalvolumeidentifierFal

queue_depth8QueuedepthTrue

queue_depth值设置为7133硬盘个数

可用命令#chdev–lhdisk2–aqueue_depth=x修改,但VG必须为VARYOFF状态。

3.3用户参数检查

#smittychlicense

修改MaximumnumberofFIXEDlicenses为10

#lsattr-Elsys0|grepmaxuproc

maxuproc200MaximumnumberofPROCESSESallowedperuserTrue

用#smittychgsys修改

利用lsattr-Elsys0检查maxuproc,minpout,maxpout等参数的大小。

maxuproc为每个用户的最大进程数,当应用涉及大量的顺序读写而影响前台程序响应时间时,可考虑将maxpout设为33,minpout设为16,利用smittychgsys来设置。

3.4激活SSAFast-WriteCache

利用smittyssafastw来激活每一个逻辑盘hdiskn的Fast-WriteCache:

选择硬盘后,把EnableFast-Write一项改为Yes后回车即可。

对于OPS必须关闭,对于GAILOVER或单机必须打开。

3.5IO参数设置

HighwatermarkforpendingwriteI/Osperfile(maxpout)和LowwatermarkforpendingwriteI/Osperfile

它们缺省值为0,在双机环境中一般应设Highwatermark为33,Lowwatermark为24,这两个参数可用smittychgsys来设置。

3.6syncddaemon的数据刷新频率

该值表示刷新内存数据到硬盘的频率,缺省为60,一般可改为20,也可根据实际情况更改。

该参数通过vi/sbin/rc.boot更改,其中一行如下:

nohup/usr/sbin/syncd60>/dev/null2>&1&

改为:

nohup/usr/sbin/syncd20>/dev/null2>&1&

3.7检查系统硬盘的镜像

#lsvg–lrootvg

rootvg:

LVNAMETYPELPsPPsPVsLVSTATEMOUNTPOINT

hd5boot122closed/syncdN/A

hd6paging48962open/syncdN/A

paging00paging32642open/syncdN/A

hd8jfslog122open/syncdN/A

hd4jfs122open/syncd/

hd2jfs32642open/syncd/usr

hd9varjfs5102open/syncd/var

hd3jfs482open/syncd/tmp

hd1jfs122open/syncd/home

注意:

PPs为LPs的两倍,PVs为2

如果系统盘未镜像,而系统盘为18G盘,用命令镜像

#mirrorvgrootvghdisk0hdisk1

(对rootvg进行镜像)

#bosboot–a

(在两块盘上重建bootimage)

#bootlist–mnormalhdisk0hdisk1

(设置机器的启动顺序)

第4章AIX系统管理日常工作(性能分析篇)

4.1性能瓶颈定义

项目检查命令判断标准

CPUvmstat%user+%sysgreater大于75%

DiskI/Ovmstat%iowait大于30%(AIX4.3.3orlater)

应用程序磁盘iostat%tm_act大于60%

交换区lsps-a大于60%

页交换数量iostatvmstat大于10×CPU数量

4.2性能范围

好坏极差

CPU60%75%90%+

Disk<30%<40%<50%+

Memory010pages/秒CPU>50

第5章AIX系统管理日常工作(SHUTDOWN篇)

5.1概念

IBMAIX的启动分为多用户(normal)和单用户(service)模式,在正常情况下,一般选择多用户模式。

5.2关机命令

快速关机,不警告用户

shutdown-F;halt

快速关机并重启

shutdown–Fr;reboot

警告一分钟后关机并重启

shutdown-r

发送关机命令,但不关机

shutdown-k

关机并警告用户推出

Shutdownnow

关机到单用户模式

Shutdown-m;inits;telinits

第6章AIX系统管理日常工作(备份与恢复篇)

6.1用SMIT备份

#smittymksysb进行系统备份

当COMMANDSTATUS页面中Command:

OK出现后,表示备份成功。

取出制作完毕的磁带,在磁带上的标签上注明备份机器的名称和序列号

6.2手工备份

#mksysb–i/dev/rmt0

6.3恢复系统

#bootinfo–e

检查系统所带的磁带机是否能启动系统,如果返回值是1,表示该磁带机支持启动系统,如果返回值是0,就是不支持。

插入备份带,检查设备启动顺序:

#bootlist-mservice-o

如果需要,将启动顺序改为从磁带启动:

#bootlist-mservicermt0

重启机器,系统从磁带读数据,根据提示恢复系统。

第7章HACMP的双机系统的管理和维护

7.1HACMP双机系统的启动

要启动HACMP双机系统必须要有root用户的特权分别进入到系统各节点主机在命令行上执行下述命令即可。

#smitclstart或

#/usr/sbin/cluster/etc/rc.cluster-boot-N-i

注:

在双机系统中HACMP双机软件先启动的节点将成为主节点拥有资源,后启动的节点将成为备用节点。

7.2HACMP双机系统的关闭

要关闭某节点上的HACMP双机软件必须要有该节点root用户的特权,以root用户进入到该节点主机在命令行上执行下述命令即可。

#smitclstop

#clstop-gr

说明:

若该节点是主节点并且备节点上的HACMP软件亦正常运行,则clstop关闭模式的三种选项行为不同。

forced:

是指立即关闭双机软件不调用任何客户应用的善后处理例程。

graceful是指在关闭双机软件时将调用客户应用预定义的善后处理例程。

takeover是指该节点将关闭双机软件并释放资源请求备节点进行接管。

检查HACMP双机软件在该节点是否已启,动命令如下:

#lssrc-gcluster

若是系统显示出下面类似的信息则说明HACMP双机软件已正常启动.

SubsystemGroupPIDStatus

Clstrmgrcluster22500active

Clsmuxpdcluster23674active

Clinfocluster28674active

7.3察看双机系统的当前状态

#/usr/sbin/clu

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2