载频告警收集.docx
《载频告警收集.docx》由会员分享,可在线阅读,更多相关《载频告警收集.docx(29页珍藏版)》请在冰点文库上搜索。
载频告警收集
载频告警处理
目录
1.序言--------------------------------------------------------------------------------------------------------------------3
2.TRAG模块的告警类型---------------------------------------------------------------------------------------------3
3.判断TRAG故障的一般步骤--------------------------------------------------------------------------------------3
4.TRAG模块告警原因及解决办法---------------------------------------------------------------------------------4
4.1SW-Problem(TRE)告警原因及解决办法--------------------------------------------------------------4
4.2Wrong-Configuration(TRE)告警原因及解决办法----------------------------------------------------6
4.3Config-Fail(TRE)告警原因及解决办法----------------------------------------------------------------11
4.4Temperature-Warning(TRE)告警原因及解决办法---------------------------------------------------12
4.5FatalTemperature告警原因及解决办法-------------------------------------------------------------------13
4.6Module-Inserted告警原因及解决办法---------------------------------------------------------------------14
4.7RX-Cable(TRE)告警原因及解决办法------------------------------------------------------------------15
4.8TRE-VSWR告警原因及解决办法--------------------------------------------------------------------------16
4.9Module-Frame-Signal(TRE)告警原因及解决办法----------------------------------------------------18
4.10Module-Clock-Signal(TRE)告警原因及解决办法---------------------------------------------------19
4.11Module-Not-Present(TRE)告警原因及解决办法-----------------------------------------------------20
4.12IOM-Disconnection(TRE)告警原因及解决办法-----------------------------------------------------22
4.13HW-Degraded(TRE)告警原因及解决办法------------------------------------------------------------23
4.14HW-Degraded(RA)告警原因及解决办法--------------------------------------------------------------25
4.15HW-Failure(TRE)告警原因及解决办法----------------------------------------------------------------27
4.16Restart(TRE)告警原因及解决办法----------------------------------------------------------------------31
5.后言-----------------------------------------------------------------------------------------------------------------------33
关于降低TRAG模块NFF的建议
1.序言
根据工厂2002年度的维修数据统计发现,目前ASBTRAG模块的NFF率较高(平均在40%左右,而欧洲平均只有20%),分析NFF产生的原因主要有两方面:
一方面是由于现场工程师在判断TRAG故障或更换时没有仔细分析故障原因而随意更换所至或者现场工程师的现场经验不足所至;另一方面由于工厂在检测维修过程中未发现现场产生的故障,判断为NFF但实际无法在现场使用。
将从两方面分析,提出降低TRAG模块NFF的建议。
2.TRAG模块的告警类型
从BTS的维护手册和告警信息中可以总结得出,在现场将TRAG判断为故障或者更换TRAG时,有关的告警信息有SW-Problem(TRE)、Wrong-Configuration(TRE)、Config-Fail(TRE)、Temperature-Warning(TRE)、FatalTemperature、Module-Inserted、RX-Cable(TRE)、TRE-VSWR、Module-Frame-Signal(TRE)、Module-Clock-Signal(TRE)、Module-Not-Present(TRE)、IOM-Disconnection(TRE)、HW-Degraded(TRE)、HW-Degraded(RA)、HW-Failure(TRE)、Restart(TRE)共16种。
3.判断TRAG故障的一般步骤
在现场更换TRAG之前,都必须用基站调测软件与BTS连接,具体步骤如下:
1)第一步观察模块的状态和告警信息;
2)第二步在OMC-R上对该TRE进行Lock和Unlock的操作或者在基站侧对TRE进行Disable和Initial的操作,以确定TRE能否正常启动和占用话务,若能够正常工作则故障解决;
3)第三步对于启动不正常的TRE观察TRAG电源指示灯是否点亮过,若电源指示灯无法点亮且该TRE的状态仍然处于OPR下,也没有任何告警信息的可以初步确定TRAG的电源子模块(TREPS&TREPSH)损坏;
4)第四步对于启动过程中电源指示灯能够点亮,在ActiveAlarms处出现告警信息的,按照以下16种告警信息处理,如果本次操作没有出现告警信息的则在调测软件的菜单中寻找ErrorStatus的选项,点击进去后查找以往告警信息,帮助分析告警情况。
4.TRAG模块告警原因及解决办法
4.1SWProblem告警的原因及解决办法
SWProblem(TRE)告警主要原因是软件不正常或遭到破坏而引起的故障,它表现为模块在初始状态时,现有参数的结构出现错误;TRE模块从SUM下载软件过程中出错或模块在初始状态时软件在激活过程中出错。
在解决问题时,如果遇到多个TRAG模块出现这种告警,则先检查参数设置是否正确?
然后ResetBTS。
如果单个TRAG模块出现告警,则先进行Disable/Initial操作。
其次可以插拔该TRAG模块,最后可通过对BTS开关电或插拔SUM重新下载软件来消除故障。
如果故障依旧则更换TRAG模块,为减少误判建议把该TRAG模块放到机架的其它位置试验。
Figure1:
SW-Problem(TRE)故障解决流程
4.2WrongConfiguration告警的原因及解决办法
WrongConfiguration告警的原因是参数与设备性能不匹配造成的故障。
出现WrongConfiguration告警的原因有5种:
第一种包括TSdefinition、Frequencyrange、extendedcell、等参数设置与TRE模块性能不一致;第二种是SUM板中关于TRE模块的文件丢失。
第三种TRE模块与Abis的RSL速率不一致;第四种是结构数据中参数出错、TRE与RSL的对应关系不一致;第五种是没有对应的RSL/TCH映射。
上述故障通常与硬件本身无关,解决的方法是检查参数设置或者重新下载软件。
Figure2:
Wrong-Configuration第一种故障情况解决流程
Figure3:
Wrong-Configuration第二种故障情况解决流程
Figure4:
Wrong-Configuration第三种故障情况解决流程
Figure5:
Wrong-Configuration第四种故障情况解决流程
Figure6:
Wrong-Configuration第五种故障情况解决流程
4.3ConfigFail告警的原因及解决办法
ConfigFail是一个与TRE相关的故障,告警的原因是TRE在初始化时对OMU没有应答而出现的故障。
表现为TRAG无法通过BTSCommission测试,在ActiveAlarms上能够明确的看到该告警信息。
TRE出现这个告警,通常可以确定故障在该TRAG模块上,为减少误判建议把该损坏的TRAG模块放到机架的其它位置试验。
Figure7:
Config-Fail故障解决流程
4.4TemperatureWarning告警的原因及解决办法
TemperatureWarning是TRE的温度达到或超过TemperatureWarning的门限,此时TRAG工作时的温度将升高到摄氏70度左右。
出现TemperatureWarning告警的原因有2种:
第一是风扇故障引起的,此时先检查FAN单元是否正常工作?
如果没有正常工作则判断是相关FANU还是FACB的问题。
排除风扇问题后再对TRAG进行降温,降温后插到机架上检查TRE是否还有TemperatureWarning告警。
第二是外部温度过高而引起的故障,此时可以检查机房的通风是否良好?
空调运行是否正常?
排除此类问题后检查TRE是否还有TemperatureWarning告警。
如果排除了以上2种原因而故障依旧,则有可能是TRAG内部温度传感器损坏造成的,在对该TRAG模块进行了Disable/Initial的操作无效后则更换TRAG模块。
为减少误判建议把该损坏的TRAG模块放到机架的其它位置试验。
Figure8:
Temperature-Warning故障解决流程
4.5FatalTemperature告警的原因及解决办法
FatalTemperature告警的原因是TRE模块的温度超出预定义门限值,为避免硬件损坏,TRE的PA(功放子模块)会自动关闭。
出现FatalTemperature告警的原因有2种:
第一是风扇故障引起的,此时先检查FAN单元是否正常工作?
如果没有正常工作则判断是相关FANU还是FACB的问题。
排除风扇问题后再对TRAG进行降温,降温后插到机架上检查TRE是否还有TemperatureWarning告警。
第二是外部温度过高而引起的故障,此时可以检查机房及机架的通风是否良好?
空调运行是否正常?
排除此类问题后检查TRE是否还有FatalTemperature告警。
如果排除了以上2种原因而故障依旧,则有可能是TRAG内部温度传感器损坏造成的,在对该TRAG模块进行了Disable/Initial的操作无效后则更换TRAG模块。
Figure9:
Fatal-Temperature告警解决流程
4.6ModuleInserted告警的原因及解决办法
ModuleInserted告警的原因是TRE已经插入机架但没有通过RF电缆与ANX/ANY/ANC连接。
出现这种告警可以先检查连接TRAG模块和ANX/ANY/ANC模块的RFCable,如果RFCable没有问题,再查看ANX/ANY/ANC模块运行状态,确认是否有故障?
如果有,则先排除这些模块的故障。
排除后再查看TRAG模块运行状态,通过故障确认步骤判断故障是否在TRAG上,如果确为TRAG故障则更换TRAG。
Figure10:
Module-Inserted告警解决流程
4.7RXCable告警的原因及解决办法
RXCable告警的原因是TRE和ANX/ANC之间的连接电缆故障引起的。
当RX0上的DC信号丢失或RX1上的DC信号丢失以及RX0和RX1的DC信号全都丢失的情况下都会出现这种告警。
这种告警一般为RXCable问题,可以通过更换或插拔RXCable来消除告警。
如果RXCable没有问题,则查看TRAG模块运行状态,确认TRAG模块是否有故障?
如果有,则更换对应的TRAG模块,为减少误判建议把该损坏的TRAG模块放到机架的其它位置试验。
Figure11:
RX-Cable故障解决流程
4.8TREVSWR告警的原因及解决办法
TREVSWR告警的原因是TRE在初始化或操作状态中,TRE模块输出口检测到VSWR告警,故障一般是在连接到ANX/ANY/ANC的TX电缆处或者是由于ANY/ANC的WBC的不同TX信号之间隔离不好引起。
为了避免损坏硬件,TRE的PA(功放子模块)会自动关闭。
解决TREVSWR告警首先检查连接到TRAG模块和ANX/ANY/ANC模块的TX电缆,如果TX电缆没有故障,再查看TANX/ANY/ANC模块是否有故障?
如果有,则排除这些模块的故障,排除后再查看TRAG模块运行状态。
如果故障依旧则更换TRAG模块,为减少误判建议把该损坏的TRAG模块放到机架的其它位置试验。
Figure12:
TRE-VSWR故障解决流程
4.9ModuleFrameSignal告警的原因及解决办法
ModuleFrameSignal告警的原因是来自SUM的复帧时钟信号出错引起的故障。
在解决告警时,遇到多个TRAG模块出现这个告警时,先检查SUM的时钟是否有告警?
其次检查有SUM连接的排线,如果问题依旧没有得到解决则更换SUM模块,然后查看TRAG模块运行状态。
遇到单个TRAG模块出现这个告警,先用确定好的TRAG模块插到该位置试验,如果能够正常工作则可以排除Cable的问题,并初步确定故障产生在该TRAG模块上,更换该TRAG模块再查看TRE运行状态。
如果不能工作则可能是BCBBus等原因引起的,这时要通过更换相关连接电缆来排除故障。
Figure13:
Module-Frame-Signal故障解决流程
4.10ModuleClockSignal告警的原因及解决办法
Module-Clock-Signal(TRE)表现为TRAG无法通过BTSCommission测试,在ActiveAlarms上能够明确的看到该告警信息。
该告警主要是由于丢失时钟信号引起的,表现在模块初始阶段丢失同步信号或者在运行阶段无法检测到CLKI主时钟信号。
在硬件上主要由于SUMA、BCBBus等原因造成的,首先应判别是否属于SUMA的故障,一般SUMA的故障将会造成大面积的载频单元产生此类告警,此时应解决SUMA的故障。
如果是个别TRAG模块存在该问题,用确定好的TRAG插到该位置试验,能否正常工作。
如果能够工作则排除连接器件的问题,可以初步确定故障产生在该TRAG模块上,如果不能工作则可能是BCBBus等原因引起的。
Figure14:
Module-Clock-Signal故障解决流程
4.11ModuleNotPresent告警的原因及解决办法
ModuleNotPresent告警的原因是TRE模块没有初始显示或最近被拔出过。
表现为BCB检测到模块被拔出或SBL中没有与之对应的TRE模块。
出现这个告警时首先检查位置上是否有TRAG模块存在?
在确定TRAG模块位置正确后对该模块进行Initial的操作。
Figure15:
Module-Not-Present故障解决流程
4.12IOMDisconnection(TRE)告警的原因及解决办法
IOMDisconnection(TRE)告警的原因是在BSII接口的IOM连接出错。
出现这个告警时首先查看TRAG模块是否有故障?
如果TRAG模块没有故障,则查看后背板排线是否有故障?
如果TRAG模块有故障,则更换该TRAG模块继续查看运行状态直到告警消除。
Figure16:
IOM-Disconnection(TRE)故障解决流程
4.13HWDegraded(TRE)告警的原因及解决办法
HW-Degraded告警信息表现为TRAG能够通过BTSCommission测试,但在进行模拟发射或在线发射时(即话务占用时)Fault红灯常亮,该告警信息产生的主要原因是TRE性能下降、BCBBus与载频单元的连接不良好或者PA(功放子模块)输出功率小于标称值时所产生的告警。
对于BCBBus连接不好产生的告警能够通过把该TRE模块插到其它机架或者本机架正常工作载频单元的位置判断出来(在其他位置该载频单元能否正常工作),由BCBBus引起的TRAGHW-Degraded需检查BCBBus、ANC、ANY、XIOB、SUMA等器件解决。
对于其它原因引起的告警则可能是TRE模块性能和电源子模块性能下降造成,只能通过更换TRAG解决,也就是说产生HWDegraded的TRAG如果换到其他的机架,故障仍然存在。
因此要求存在该告警时,把该模块换到其它机架试验,以判断模块本身的故障。
Figure17:
HW-Degraded(TRE)故障解决流程
4.14HWDegraded(RA)告警的原因及解决办法
HWDegraded(RA)告警产生时的故障原因与HWDegraded(TRE)的原因有相同之处,排除故障的方法与上面提到的排除方法相一致,区别之处在于,HWDegraded(TRE)侧重于个别TRAG的故障,而HWDegraded(RA)则侧重于整个扇区的故障现象。
Figure18:
HW-Degraded(RA)第一种故障解决流程
Figure19:
HW-Degraded(RA)第二种故障解决流程
4.15HWFailure(TRE)告警的原因及解决办法
HWFailure(TRE)告警现象是TRAG模块的硬件出现故障,并且无法恢复。
它表现为TRAG无法通过BTSCommission测试,在ActiveAlarms上能够明确的看到该告警信息。
产生HWFailure(TRE)告警的主要原因有3种:
第一种是TRAG模块在自检时出错,原因可能是模块没有电源输入或者是模块面板电源上的开关没开以及DC/DC变流器损坏。
第二种是DSP在其内部处理过程中出错或DSP在SCP检测时没有应答等;第三种是其它模块故障引起的TRE模块HWFailure告警,在OMC-R上可以查看详细的告警信息。
出现HWFailure告警时,首先查看是否有电源告警?
如果有,则检查外部电源确保BTS的供电正常。
其次可检查TRAG模块前面板的开关是否打到“Enable”的位置?
在OMC-R上是否存在其它告警?
排除电源故障及其它告警后,继续观察TRAG模块的运行状态是否正常?
如果告警依旧就可以初步判断故障在该TRAG模块上,更换一块TRAG模块继续查看运行状态直到告警消除。
根据工厂的维修情况来看,通常在现场无法正常加电(没有任何电源指示灯亮)的TRAG模块大都会出现HWFailure告警,一旦出现这种情况,往往可以判断是TRAG模块出现问题。
Figure20:
HW-Failure(TRE)第一种情况故障解决流程
Figure21:
HW-Failure(TRE)第二种故障情况解决流程
Figure21:
HW-Failure(TRE)第三种故障情况解决流程
4.16Restart(TRE)告警的原因及解决办法
Restart(TRE)告警的现象是TRE自动重启。
在重启期间,TRE无法正常工作,但重启结束后,BCCH得到恢复,TRE也可以正常工作。
产生Restart(TRE)告警的原因可能是:
运行状态时,SCP的软件出错;运行状态时,DSP在SCP检测时没有应答;运行状态时,ECPL接口管理发现错误;运行状态时,FN-SUP时钟由于FCLK缺少而消失;运行状态时,无线第一层的DSP发送出错报告;运行状态时,TS重新配置失败等等。
出现这个告警时首先检查参数的配置并纠正可能错误的参数。
然后再查看TRAG模块运行状态,如果问题依旧,则更换一块TRAG模块继续查看运行状态直到告警消除。
Figure22:
Restart(TRE)故障解决流程
5.后言
以上所分析的关于TRAG模块的16种告警情况大部分在现场比较常见,为减少误判建议现场工程师把损坏的TRAG模块放到机架的其它位置试验。
如果有条件允许,也可以放到其它站点进行试验。