ImageVerifierCode 换一换
格式:DOCX , 页数:60 ,大小:190.58KB ,
资源ID:9433171      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-9433171.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(H3C核心交换机常见故障定位手册.docx)为本站会员(b****0)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

H3C核心交换机常见故障定位手册.docx

1、H3C核心交换机常见故障定位手册核心交换机常见故障处理手册1 故障处理通用流程1.1 信息搜集为方便故障快速定位,建议不要关闭设备的信息中心(info-center enable)。缺省情况下信息中心处于开启状态。1.1.1 搜集设备日志信息1. 收集diag信息执行display diagnostic-information命令后,请输入“Y”,以选择将diag保存到CF卡中(选择display会出现信息搜集不全)。设备上单板越多,diag信息搜集的时间越长,信息搜集期间不能输入命令,请耐心等待。display diagnostic-informationSave or display di

2、agnostic information (Y=save, N=display)? Y/N:yPlease input the file name(*.diag)cfa0:/default.diag:20130517.diagDiagnostic information is outputting to cfa0:/20130517.diag.Please wait.Save successfully.也可以将diag信息直接显示出来(不建议这样搜集),搜集前请先执行screen-length disable,避免屏幕输出被打断,如下:screen-length disable% Screen

3、-length configuration is disabled for current user.display diagnostic-informationSave or display diagnostic information (Y=save, N=display)? Y/N:n= =running CPU usage information= Current CPU usage info =CPU Usage Stat. Cycle: 19 (Second)CPU Usage : 5%CPU Usage Stat. Time : 2013-05-21 10:06:25CPU Us

4、age Stat. Tick : 0x19aa(CPU Tick High) 0xa57f44e1(CPU Tick Low)Actual Stat. Cycle : 0x0(CPU Tick High) 0x39fb1e03(CPU Tick Low)2. 其他注意事项建议记录设备操作时的命令行显示信息,便于后续分析。明确每一配置操作的影响,保证出现异常时配置能够被恢复。保证当前配置与保存的配置一致,在IRF分裂、单板Fault、单板重启时请不要保存配置,否则可能会导致配置不一致。操作执行后请等待一定时间来确认执行效果。更换主控板时,请确保新、老主控板的软件版本一致。1.1.2 搜集其他运行

5、信息除设备日志信息外,还需要搜集设备的其他运行信息(包括但不限于以下):故障现象、故障时间、网络拓扑、配置信息、现场处理措施及其实施后的现象效果;操作日志记录、抓取的报文信息、Debug开关打印信息、主控板与网板持续异常重启的串口输出信息等;设备故障时单板、电源、风扇指示灯的状态或现场图片等搜集信息越全面、越详细,越有利于故障的快速定位。1.2 故障定位和处理设备出现故障时,请先搜集设备运行的相关信息,判断大致的故障类型,然后参照对应类型的故障处理流程进行确认。如遇到故障无法确认,请将故障描述连同搜集的信息发送给公司技术支持人员分析。1.2.1 故障处理流程图图1为故障处理的一般流程,可以大致

6、判断出故障的类型。图1故障处理流程图故障分析时常用的方法有:端口报文计数报文镜像端口抓包配置QoS策略进行流量统计Debug开关信息对怀疑故障的模块交叉验证(比如:怀疑某个端口光模块异常,可以将其他正常的光模块装在这个端口、将怀疑异常的光模块装到别的端口进行确认;怀疑某个槽位单板异常,可以将别的正常单板装到这个槽位、将怀疑异常的单板装到本设备其他槽位或装到别的S12500-X上确认)。1.2.2 故障原因分类1. 单板故障如单板出现异常重启、状态异常、无法启动、反复重启,请参照2.1 单板故障处理。2. 电源故障如设备电源指示灯异常、不断打印告警信息,请参照2.2 电源处理。3. 风扇故障如设

7、备风扇指示灯异常、风扇停转、不断打印风扇告警信息,请参照2.3 风扇故障处理。4. 温度告警如设备打印温度告警,请参照2.4 温度告警处理。5. 链路端口故障如端口出现无法UP、频繁UP/DOWN、端口错包,请参照3 链路端口故障处理。6. 硬件转发故障如日志不断出现Forwarding fault、Board fault: chassis X slot Y, please check it等打印信息,请参照4 硬件转发故障处理。7. 报文转发故障如出现ping、tracert丢包或不通、二层丢包或不通、三层丢包或不通、MPLS业务异常等,请参照5 报文转发故障处理。8. IRF故障如设备无法

8、形成IRF、IRF分裂等,请参照6 IRF类故障处理。9. CPU占用率高如设备单板CPU占用率很高,请参照7.1 CPU占用率处理。10. 内存占用率高如设备单板内存占用率很高,请参照7.2 内存占用率处理。11. 资源不足如设备打印No enough resource资源不足,请参照7.3 资源不足处理。1.2.3 故障模型及影响分析图2是一个典型网络故障模型,为提高网络的可靠性,便于故障时快速切换恢复,组网中采用双上行链路,两台核心交换机之间互为备份。图2典型网络故障模型表1故障点影响分析故障点可能现象影响范围1(含光模块)端口down业务会切换端口错包增加影响该链路上的业务(影响范围大

9、)2单板fault 业务会切换单板芯片故障(单板状态正常)该芯片上的业务异常交换网板芯片故障会影响整机软件异常设备重启,业务会切换协议模块异常一般会影响业务3同1影响该接入层交换机上的业务(影响范围比故障点1小一些)4设备down影响该设备下的业务单板芯片故障影响部分端口或整机业务软件异常设备重启,影响设备下连业务协议模块异常一般会影响业务5同1影响该链路上服务器涉及的业务6网络正常,业务异常影响该服务器涉及业务1.2.4 常见的故障恢复措施表2常见的故障恢复措施故障原因业务恢复动作故障排除动作硬件 隔离故障单板;调整业务流向来隔离故障设备(如可以调整路由的优先级,避免流量经过故障设备,实现流

10、量切换)更换备件(备件上线应用前应进行必要的测试)软件 重启故障设备的协议;调整业务流向来隔离故障设备升级版本(含补丁版本) ;调整组网或配置消除引发故障因素链路调整业务流向来隔离故障线路 检修线路 其他 修改错误配置;正确连接设备端口;调整业务流向来隔离故障线路修改错误配置;正确连接设备端口;检修机房的电源、空调等支撑系统 2 硬件类故障处理2.1 单板故障2.1.1 故障描述单板状态异常(比如状态为Absent、Fault、Loading)。单板出现异常重启、无法启动或不断重启等。1. 单板状态查询单板状态包括:Normal、Master 、Slave 、Absent、Fault、Load

11、ing。Master 与Slave分别表示主、备主控板。Normal表示单板处于正常运行状态。如果发现单板状态出现Fault、Offline、Loading,或该槽位存在单板但状态却是Absent的,说明单板可能出现故障,请参考2.1.2 故障处理步骤处理。display deviceSlot No. Brd Type Brd Status Subslot Sft Ver Patch Ver 0 LSX1TGS48EC1 Normal 0 S12510-X-1005 None 1 LSX1TGS48EC1 Normal 0 S12510-X-1005 None 2 LSX1TGS48EC1 N

12、ormal 0 S12510-X-1005 None 3 LSX1TGS48EC1 Normal 0 S12510-X-1005 None 4 LSX1TGS48EC1 Normal 0 S12510-X-1005 None 5 LSX1TGS48EC1 Normal 0 S12510-X-1005 None 6 LSX1TGS48EC1 Normal 0 S12510-X-1005 None 7 NONE Absent 0 NONE None 8 NONE Absent 0 NONE None 9 NONE Absent 0 NONE None 10 LSX1FAB10B1 Normal 0

13、 S12510-X-1005 None 11 LSX1FAB10B1 Normal 0 S12510-X-1005 None 12 LSX1FAB10B1 Normal 0 S12510-X-1005 None 13 LSX1FAB10B1 Normal 0 S12510-X-1005 None 14 LSX1FAB10B1 Normal 0 S12510-X-1005 None 15 LSX1FAB10B1 Normal 0 S12510-X-1005 None 16 LSX1SUP10A1 Standby 0 S12510-X-1005 None 17 LSX1SUP10A1 Master

14、 0 S12510-X-1005 None 2. 单板重启确认可以通过logfile日志或display version查看设备启动后运行时间来确认单板有没有出现过重启,出现过重启的单板运行时间会明显短于设备上其他单板。如果有单板出现过重启,请参考2.1.2 故障处理步骤处理。display versionH3C Comware Software, Version 7.1.045, Release 1005Copyright (c) 2004-2013 Hangzhou H3C Tech. Co., Ltd. All rights reserved.H3C S12510-X uptime is

15、 0 weeks, 4 days, 1 hour, 55 minutesLast reboot reason : Cold rebootBoot image: flash:/S12500X-CMW710-BOOT-R1005.binBoot image version: 7.1.045P18, Release 1005 Compiled Nov 11 2013 15:38:46System image: flash:/S12500X-CMW710-SYSTEM-R1005.binSystem image version: 7.1.045, Release 1005 Compiled Nov 1

16、1 2013 15:39:12LPU 0:Uptime is 0 weeks,4 days,1 hour,52 minutesH3C S12510-X LPU with 1 XLP308 ProcessorBOARD TYPE: LSX1TGS48EC1DRAM: 4096M bytesFLASH: 0M bytesNVRAM: 0K bytesPCB 1 Version: VER.BPCB 2 Version: VER.CBootrom Version: 108CPLD 1 Version: 002CPLD 2 Version: 002CPLD 3 Version: 002Release V

17、ersion: H3C S12510-X-1005Patch Version : NoneReboot Cause : ColdRebootLPU 1:Uptime is 0 weeks,4 days,1 hour,50 minutesH3C S12510-X LPU with 1 XLP308 ProcessorBOARD TYPE: LSX1TGS48EC1DRAM: 4096M bytesFLASH: 0M bytesNVRAM: 0K bytesPCB 1 Version: VER.BPCB 2 Version: VER.CBootrom Version: 108CPLD 1 Vers

18、ion: 002CPLD 2 Version: 002CPLD 3 Version: 002Release Version: H3C S12510-X-1005Patch Version : NoneReboot Cause : ColdRebootLPU 2:Uptime is 0 weeks,4 days,1 hour,52 minutesH3C S12510-X LPU with 1 XLP308 ProcessorBOARD TYPE: LSX1TGS48EC1DRAM: 4096M bytesFLASH: 0M bytesNVRAM: 0K bytesPCB 1 Version: V

19、ER.BPCB 2 Version: VER.CBootrom Version: 108CPLD 1 Version: 002CPLD 2 Version: 002CPLD 3 Version: 002Release Version: H3C S12510-X-1005Patch Version : NoneReboot Cause : ColdReboot2.1.2 故障处理步骤1. 单板状态Absent、Fault(1)确认单板是否插稳,如检查单板与机框之间是否有空隙,也可以将单板拔出后重插入。(2)将单板放到别的槽位,将框上别的正常的单板放到这个槽位,进一步确认是不是单板故障。(3)检查

20、单板面板、内部的指示灯是否发光。(4)如果单板是主控板、网板,请连上串口线,查看配置终端上是否有单板正常启动的显示信息、或单板启动是否异常。(5)如确认为单板故障,请更换单板并将故障信息发送技术支持人员分析。2. 单板状态Loading(1)检查单板面板、内部的指示灯是否发光。(2)如果单板是主控板、网板,请连上串口线,查看配置终端上是否有单板正常启动的显示信息、或单板启动是否异常。(3)如确认为单板故障,请更换单板并将故障信息发送技术支持人员分析。3. 单板重启这里的单板重启是指单板出现过重启,而当前单板状态是Normal。(1)通过日志或运行时间分析重启的时间段,确认重启的时间点附近有无用

21、户通过命令行reboot重启或进行单板上下电等操作。(2)1005以上版本display version命令支持查询单板最近一次重启的原因。比如下面示例中“Power on”表示单板最近一次重启原因是掉电重启。display versionH3C Comware Software, Version 7.1.045, Release 1005Copyright (c) 2004-2013 Hangzhou H3C Tech. Co., Ltd. All rights reserved.H3C S12510-X uptime is 0 weeks, 4 days, 1 hour, 55 minut

22、esLast reboot reason : Cold reboot(3)如果所有单板同时出现重启,请检查设备电源模块是否正常,确认外部电源是否出现过停电,电源进线是否插稳、是否出现松动。(4)确认日志中重启时有无出现“Slot X need to be rebooted automatically!”提示信息,这种情况是不正常的。请更换单板并搜集故障信息并发送技术支持人员分析。(5)确认日志中有无Hardware error提示信息,设备运行过程中单板出现Hardware error是不正常的。请搜集信息发送给技术支持人员分析。%437307%May 15 22:03:02:122 2013

23、 S12508-X DIAG/3/ERROR: Hardware error! chassis=1, slot=7, code=0%437308%May 15 22:03:02:122 2013 S12508-X DIAG/3/ERROR: Hardware error! chassis=1, slot=7, code=1%437309%May 15 22:03:02:122 2013 S12508-X DIAG/3/ERROR: Hardware error! chassis=1, slot=7, code=2(6)如无法确认,请搜集故障信息并发送技术支持人员分析。2.2 电源故障2.2.1

24、 故障描述设备电源指示灯异常或上报fault2.2.2 故障处理步骤1. 检查是否存在Fault或Absent状态的电源模块使用display power命令显示电源模块状态,查看是否存在Fault或Absent状态的电源模块。display power PowerID State Mode Current(A) Voltage(V) Power(W) 1 Normal AC 2.60 53.81 139.90 2 Absent - - - - 3 Absent - - - - 4 Normal AC 1.60 53.82 86.11 5 Absent - - - - 6 Absent - -

25、 - - 7 Absent - - - - 8 Absent - - - -如果存在Absent状态的电源模块,请前往步骤3。如果存在Fault状态的电源模块,请前往步骤4。2. 检查电源异常模块查看电源异常状态:Absent 或者 Fault. 使用display alarm命令。HPdisplay alarm Slot Level Info - ERROR Fan 1 is faulty. - INFO Power 1 is absent. - INFO Power 2 is absent. - INFO Power 3 is absent. - INFO Power 5 is absen

26、t. - INFO Power 6 is absent. - INFO Power 7 is absent. - INFO Power 8 is absent.如果存在Absent状态的电源模块,请前往步骤3。如果存在Fault状态的电源模块,请前往步骤4。3. 检查Absent状态电源模块如果电源模块状态为Absent,表示对应槽位没有在位的电源模块或者电源模块没有安装牢固。如果电源模块槽位有电源模块在位且显示为Absent,请将电源模块拆卸后重新安装,然后使用display power命令查看对应槽位电源状态是否显示为Normal。如果仍然显示为Absent状态,请更换新电源模块。如果更换

27、新电源模块后仍然显示为Absent状态,请前往步骤5。4. 检查Fault状态电源模块如果存在Fault状态电源模块,表示该电源模块异常,无法供电。电源处于Fault状态可能有以下原因:(1). 电源线可能没接稳而脱落。如果电源线脱落,那么电源的电流和电压都会显示为0,电源状态显示为Fault。请检查电源是否接线,接线后使用display power命令查看对应槽位电源状态是否显示为Normal。如果没有恢复为Normal,请前往 (2) 。display power PowerID State Mode Current(A) Voltage(V) Power(W) 1 Normal AC 2

28、.60 53.81 139.90 2 Fault AC 0 0 0 /*电源没接线状态显示*/ (2). 可能是电源模块本身温度过高导致。如果电源模块上积灰较多可能引起电源模块温度升高。请查看电源模块积灰情况,如果灰尘较多,请清理灰尘,并将电源模块拆卸后重新安装。然后使用display power命令查看对应槽位电源状态是否显示为Normal。如果没有恢复为Normal,请将该电源模块插入其它空闲电源模块槽位并查看电源状态是否为Normal。如果该电源模块仍然显示为Fault状态,请更换电源模块。如果更换新电源模块后仍然显示为Fault状态,请前往步骤5。5. 寻求技术支持如果上述检查完成后故

29、障仍无法排除,请联系H3C的技术支持工程师。2.3 风扇故障2.3.1 故障描述风扇框指示灯异常,设备打印风扇异常信息,如:%Sep 22 20:38:32:947 2009 H3C xxxxxxx2.3.2 故障处理步骤(1)风扇框在位时,用手放在设备出风口,判断是否有出风,如果出风口无风,则风扇异常(2)检查风扇的入风口、出风口是否被挡住或积累太多灰尘。(3)检查风扇框是否正常在位,各个风扇的状态是否正常、转速是否相差达到50%以上。如存在异常,建议通过风扇框拔插、更换交叉进一步确认。(4)如果故障不能恢复,需要更换该风扇框,但当前没有风扇框,请关闭设备以免发生温度高导致单板烧坏;如果有降温措施保证系统工作在xx度以下,可以暂时继续使用设备。 display fan Fan-tray 1: Status : Normal Fan number: 5 Fan mode : Auto Airflow Direction: Front-to-back Fan Status Speed(rpm) - - - 1 Normal 3707 2 Normal 1909 3 Normal 2031 4 Normal 1863 5 Normal 1921 Fan-tray 2: Status : Normal Fan number: 5 Fan mode : Auto

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2