1、Tuxedo性能监控详解Tuxedo性能监控文档控制修订记录版本日期作者变更说明1.02007-7-19郭瑞升1.1.Tuxedo命令1.1.启动和停止一个应用1.1.1.启动和停止应用的流程1.1.2.设置环境变量1.1.3.创建TUXCONFIG文件将文本配置文件转换成二进制文件tmloadcf -n -y -c -b blocks UBBCONFIG_file|- -n:只进行系统检查,报告错误。-y:强制覆盖已存在的TUXCONFIG文件。-c:计算配置文件需要的最少IPC资源。-b:限制TUXCONFIG文件的大小,主要用于TUXCONFIG文件存储在裸设备的情况。tmloadcf
2、y ubb.guoruisheng1.1.4.在所有站点(site)启动tlisten1.1.5.手动复制应用程序的目录和文件1.1.6.创建TLOG设备(Device)1)在配置文件的MACHINES部分设置TLOGDEVICE, TLOGOFFSET, TLOGNAME和 TLOGSIZE参数2)在MASTER机器上执行如下命令.$tmadmin -c-c:为配置模式3)创建TLOG设备crdl -z config -b blocks-z:为文件的存放路径,应该和配置文件中的TLOGDEVICE参数一致。-b:指定块的数量。4)在其它需要全局事务的机器上重复步骤1到3。注:如果TLOG存储
3、在镜像的磁盘上,则不需要作步骤4。1.1.7.启动应用程序$ tmboot -g grpname -o sequence -S -s servername -A -y-g:启动指定的组名中的服务器(server)。-o:按指定的顺序启动服务器(server)。-S:启动所有在配置文件SERVERS部分的服务器(server)。-s:启动指定的服务器(server)。-A:启动所有在MACHINES部分列出的所有管理服务器(server)。-y:启动所有的管理和应用服务器(server)1.1.8.停止应用程序1)运行tmshutdown。$tmshutdown2)当应用没有正常关闭时,使用IP
4、C工具清除系统分配的资源。$tmipcrm -y -n TUXCONFIG_file命令会列出所有的Tuxedo使用的IPC资源,然后提示你是否清除。3)删除/Q的IPC资源,需要使用ipcrm命令。1.2.创建和配置TMS1)编辑/udataobj/RM 加入如下行: Oracle_XA:xaosw:-L$ORACLE_HOME/lib lclntsh其格式为:rm_name:rm_structure_name:library_names Oracle使用32位,RM中这么写: # ORACLE 9 Oracle_XA:xaosw:-L$ORACLE_HOME/lib32 -lclntsh
5、事实上,RM不需要写的很复杂,在32位模式下,写入下面的语句就足够了 Oracle_XA:xaosw:-L$ORACLE_HOME/lib32/ $ORACLE_HOME/precomp/lib32/cobsqlintf.o -lclntsh 当然,把那些库写到RM中也能带来一定的方便,至少buildserver时可以少写一些参数。 我的习惯是在makefile中把这些东东写在CFLAGS变量中然后传递给buildserver,也是很灵活方便的 此外,我在oracle9i下好像没找到libsql.a这个库还有,如果你加了cat $ORACLE_HOME/lib32/sysliblist就不需要
6、再写-lld -lm -lc_r -lpthread了2)编译生成TMS serverbuildtms -v -o name -r rm_name_in_RM例如:buildtms -o $TUXDIR/bin/TMS_ORA9i -r Oracle_XA2.性能监控前准备2.1.监控应用程序的方法2.2.选择合适的监控工具2.3.用管理控制台监控应用程序2.4.用命令行工具监控应用程序2.5.用EventBroker监控应用程序2.6.用日志文件监控应用程序2.7.用MIB监控应用程序2.8.用运行时和用户级跟踪工具设置客户端的TMTRACE环境变量TMTRACE=on日志输出到ulog日志
7、中使用表达式1)运行时表达式 TMTRACE=atmi:/tpservice/ulog2)用户级表达式 TMTRACE=atmi:utrace可以用tmadmin的changetrace命令激活和删除跟踪设置。2.9.用DBBL和BBL处理错误2.10.用ATMI处理系统级和应用级错误BLOCKTIME 62.11.监控多线程多上下文应用程序2.12.如何查看tuxedo的详细版本1)查看大版本tmadmin -v2)查看补丁$TUXDIR/udataobj/patchlev2.13.了解应用的配置1)登录应用系统2)切换到tuxedo用户(假设用户名为tuxedo)#su - tuxedo3
8、)确定tuxedo软件的安装目录$ echo $TUXDIR/tuxedo974)确定应用系统的安装目录$ echo $APPDIR/tux97_app/spgroup/bin5)确定应用配置的存放目录$ echo $TUXCONFIG/tux97_app/spgroup/bin/tuxconfig6)将当前正在运行的配置文件信息存储到tuxconfig.backuptmunloadcf tuxconfig.backupdmunloadcf domconfig.backup bbsCurrent Bulletin Board Status: Current number of servers:
9、 546 Current number of services: 12059 Current number of request queues: 249 Current number of server groups: 4 Current number of interfaces: 07)确定DOM配置文件的存放目录$ echo $BDMCONFIG/tux97_app/spgroup/bin/dmconfig8)查看dom信息$dmadmindefault d domnameprintdomainprintstats help pdprintdomain (pd) Print informa
10、tion about the named local domain-printdomain (pd) -d local_domain_name printdomain -d bill13Local domain :bill13 Connected domains: Domainid: sp3_1_lf Domainid: 666666_hd Domainid: kf_hd Domainid: kf_lf Domainid: sp3_dm_t Domainid: sp3_1_cz Domainid: wtc1 Domainid: sp3_dm_c Domainid: wtc2 Domainid:
11、 wtc6 Domainid: kf_cz1 Domainid: ap2_2 Domainid: kf_bd Domainid: kf_cz2 Domainid: simpapp_bd Domainid: wtc5 printstats -d bill13Time statistics were reset: Thu Jul 26 23:37:17 2007Total # of service requests received from local requesters: 0Total # of service requests received from remote domains: 0
12、Total # of service replies sent to local requesters: 0Total # of service replies sent to remote domains: 0Total # of active service requests : 0Total # of service requests completed: 0Total # of service requests that failed: 0Total # of conversational service requests received from local requesters:
13、 0Total # of conversational sends sent to local requesters: 0Total # of conversational service requests received from remote domains: 0Total # of conversational sends sent to remote domains: 0Total # of active conversational service requests: 0Total # of transactions begun: 0Total # of transactions
14、committed: 0Total # of transactions rolled back: 0Total # of heuristic transactions committed: 0Total # of heuristic transactions rolled back: 0Total # of active events: 0Total # of suspended /T events: 0Total # of suspended NW events: 0Total # of shared memory contentions: 0Total # of log contentio
15、ns: 0 Disconnected domains being retried: Domainid: ap1_2 Domainid: ap1_1 Domainid: ap2_1 Domainid: simpapp2_bd pt -d bill13No outstanding transactions2.14.设置report选项在命令行CLOPT参数中,加入-r选项,可以用-e选项指定日志文件的名称。GlobalServ SRVGRP=GROUP1 SRVID=1 MIN=15 MAX=25RQADDR=GlobalServ1REPLYQ=YCLOPT=-A -r -p 1,100:2,10
16、使用-r选项时,确保ULOGDEBUG环境变量已设为y在SERVICES部分,设置如下参数:*SERVICESservopts -r3.性能监控3.1.查看ULOG日志ULOG日志每天生成一个日志格式:hhmmss.hostname!.processname.processid.threadid.contextid:message catlog name:message number:message text系统信息日志例子:151550.gumby!BBL.28041.1.0: LIBTUX_CAT:262: std main starting151550.gumby!BBL.28041.1
17、.0: LIBTUX_CAT:358: reached UNIX limit on semaphore ids151550.gumby!BBL.28041.1.0: LIBTUX_CAT:248: fatal: system init function .151550.gumby!BBL.28040.1.0: CMDTUX_CAT:825: Process BBL at SITE1 failed .151550.gumby!BBL.28040.1.0: WARNING: No BBL available on site SITE1.Will not attempt to boot server
18、 processes on that site.tlisten信息日志例子:121449.gumby!simpserv.27190.1.0: LIBTUX_CAT:262: std main starting3.2.查看TLOG日志1)将二进制形式的TLOG转换成文本文件形式。$tmadmindumptlog -z config -o offset -n filename -g groupname-z:TLOG的路径-o:默认为0-n:默认为TLOG-g:只转换指定组名的TLOG2)将文本文件形式TLOG转换成二进制形式的TLOG $tmadminloadtlog -m machine fil
19、ename3.3.性能监控脚本uname -awhile truedodatenetstat -an|grep TIME_WAIT|wc -lecho pclt |tmadmin -r|grep -v tmadmin|grep -v WSH|wc lecho psr |tmadmin -r|grep -v IDLE|sort +0echo pq |tmadmin -r|sort +4|grep -v 0 #vmstat 1 50ipcs -qob|grep -v 0 |sort +7sleep 5done3.4.各监控命令输出的含义3.4.1.psr输出服务器信息以下是tmadmin命令的pr
20、intserver(简写为psr)的简单输出。列项含义Prog Name服务的可执行文件名Queue Name服务连接的队列名Grp Name组名ID服务的数字idRqDone服务已经处理的请求数LoadDone服务处理的全部请求的参数和,为已处理的请求数乘以负载因子,即RqDone*LOADCurrent Service服务正在处理的交易,若为IDLE则服务当前是空闲 Prog Name Queue Name Grp Name ID RqDone Load Done Current ServiceQRRept 00100.00030 QRGRP 30 164 8200 QRGETRDATAW
21、MEngineSvr WMEngineSv+ WFMSGRP 222 1384 69200 WMCreProcInstWMWorkItemSvr WMWorkItem+ WFMSGRP 251 684 34200 WMRetWkItemWMWorkItemSvr WMWorkItem+ WFMSGRP 253 663 33150 WMGetSoWkItemWMWorkItemSvr WMWorkItem+ WFMSGRP 254 638 31900 WMGetSoWkItem3.4.2.psc输出服务信息以下是tmadmin命令的printservice(简写为psc)的简单输出。列项含义Se
22、rvice Name交易名Routine Name交易函数名Prog Name服务可执行文件名Grp Name服务所在组名ID服务的数字idMachine提供交易的机器的LMID#Done交易已经执行的次数Status交易当前状态 Service Name Routine Name Prog Name Grp Name ID Machine # Done StatusACS_GEN_U ACS_GEN_U acs_serv2 ORAGRP 1500 telcom 0 AVAILACS_G_1ST ACS_G_1ST acs_g_info ORAGRP 2800 telcom 2541283 A
23、VAILACS_G_CNT ACS_G_CNT acs_g_info ORAGRP 2800 telcom 0 AVAILACS_IVQ_U ACS_IVQ_U acs_serv2 ORAGRP 1500 telcom 0 AVAILACS_LOG_ACS+ ACS_LOG_ACS+ uc_temp_w+ ORAGRP 2000 telcom 0 AVAILACS_Q_FILD_U ACS_Q_FILD_U acs_serv2 ORAGRP 1500 telcom 0 AVAIL3.4.3.pq输出队列信息以下是tmadmin命令的printqueue(简写为pq)qaddress的简单输出。
24、如果不指定address,所有队列信息将被输出。列项含义Prog Name队列连接的服务的可执行文件名Queue Name字符队列名,是RQADDR参数或一个随机值#Serve连接的服务数Wk Queued当前队列的所有请求的参数和,为排队数乘以负载因子,即#Queued*LOAD#Queued实际请求数,为当前队列的排队数Ave.Len平均队列长度Machine队列所在机器的LMID Prog Name Queue Name # Serve Wk Queued # Queued Ave. Len Machinenet_svr 00001.01800 1 5150 103 0.4 telcom
25、GWTDOMAIN 00009.01003 1 72650 1453 461.2 telcom3.4.4.pclt输出客户端信息以下是tmadmin命令的printclient(简写为pclt)的输出:列项含义LMID已经登录的客户端机器的LMIDUser Name用户名,由tpinit()提供的Client Name客户端名,由tpinit()提供的Time客户端连接后经过的时间Status客户端状态IDLE表示客户端目前没有任何交易在工作IDLET表示客户端启动了一个交易BUSY表示客户端在工作中BUSYT表示客户端正在交易控制下工作Bgn/Cmmt/Abrt启动/提交/中断的交易数 LM
26、ID User Name Client Name Time Status Bgn/Cmmt/Abrtsimple ccsmis WSH 17:42:47 IDLE 0/0/0simple ccsmis tmadmin 0:44:28 IDLE 0/0/04.性能分析txrpt -t -n names -d mm/dd -s time -e time-t:按使用的总时间排序,不使用这个选项,则按调用次数排序。-n:只对指定的服务进行分析,多个服务名之间用逗号分隔。-d:指定月/日,默认为当天。-s:开始时间-e:结束时间txrpt -d 04/24 -s 11:00 -e 15:00 trace
27、log5.性能优化及建议5.1.何时使用MSSQ队列5.2.配置domain网关时注意的步骤及问题以上是配置域访问的一个场景,首先券商(JS)域中的服务会调用CTS域的服务;然后银行端也会通过CTS域调用JS域的服务。1)券商端ubb配置ubbjs*GROUPSGROUP_APP LMID=TUXAPP GRPNO=3 OPENINFO=NONEGROUP_APP2 LMID=TUXAPP GRPNO=5 OPENINFO=NONEGWTGP1 LMID=TUXAPP GRPNO=31 TMSCOUNT=3GWTGP2 LMID=TUXAPP GRPNO=32 TMSCOUNT=3GROUP_
28、WSL LMID=TUXAPP GRPNO=4 OPENINFO=NONELDMGRP LMID=TUXAPP GRPNO=20 LGWGRP LMID=TUXAPP GRPNO=21 *SERVERS# first start partDMADM SRVGRP=LDMGRP SRVID=1GWADM SRVGRP=LGWGRP SRVID=1GWTDOMAIN SRVGRP=LGWGRP SRVID=2 CLOPT=-A -t - GWADM SRVGRP= GWTGP1 SRVID=20001GWTDOMAIN SRVGRP= GWTGP1 SRVID=20002 CLOPT=-A -t
29、- GWADM SRVGRP= GWTGP2 SRVID=20003GWTDOMAIN SRVGRP= GWTGP2 SRVID=20004 CLOPT=-A -t - *SERVICES2)券商端domain配置dmjs*DM_RESOURCES*DM_LOCALctsccb1 GWGRP=GWTGP1 # 和券商ubb配置文件中GWTDOMAIN的GROUP名相同 ACCESSPOINTID=ctsccb1 BLOCKTIME=10 DMTLOGNAME=DMTLOG MAXTRAN=100 BLOB_SHM_SIZE=1000000 CONNECTION_POLICY=INCOMING_ONLYctsccb2 GWGRP=GWTGP2 # 和券商ubb配置文件中GWTDOMAIN的GROUP名相同 ACCESSPOINTID=ctsccb2 BLOCKTIME=10 DMTLOGNAME=DMTLOG MAXTRAN=100 BLOB_SHM_SIZE=1000000 CONNECTION_POLICY=INCOMING_ONLYdm_0011 GWGRP=LGWGRP # equal GWTDOMAIN s GROUP name # DOM
copyright@ 2008-2023 冰点文库 网站版权所有
经营许可证编号:鄂ICP备19020893号-2