华为传输optix2500复用段保护倒换故障处理.docx
《华为传输optix2500复用段保护倒换故障处理.docx》由会员分享,可在线阅读,更多相关《华为传输optix2500复用段保护倒换故障处理.docx(21页珍藏版)》请在冰点文库上搜索。
![华为传输optix2500复用段保护倒换故障处理.docx](https://file1.bingdoc.com/fileroot1/2023-7/22/3e045d02-f301-47b2-b765-e16165d5c4d3/3e045d02-f301-47b2-b765-e16165d5c4d31.gif)
华为传输optix2500复用段保护倒换故障处理
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统
维护手册故障处理分册
第6章复用段保护倒换故障处理............................................................................................6-1
6.1背景知识............................................................................................................................6-1
6.1.1复用段保护分类及保护原理....................................................................................6-1
6.1.2OptiX2500+设备复用段倒换的实现........................................................................6-3
6.1.3K字节......................................................................................................................6-6
6.2常见故障现象及原因..........................................................................................................6-8
6.3故障定位方法与步骤..........................................................................................................6-9
6.3.1常用定位方法..........................................................................................................6-9
6.3.2故障定位步骤..........................................................................................................6-9
6.4分类故障定位与排除........................................................................................................6-12
6.4.1检查并分析外部原因.............................................................................................6-12
6.4.2检查APS协议和复用段参数................................................................................6-12
6.4.3其他......................................................................................................................6-13
6.5常见故障处理案例...........................................................................................................6-14
6.5.1复用段节点倒换状态不正确的处理.......................................................................6-14
6.5.2复用段节点参数设置错误导致倒换失败................................................................6-15
6.5.3网元处于安装态复用段倒换异常...........................................................................6-16
6.5.4光路误码复用段未倒换.........................................................................................6-17
6.5.5下插了MS_RDI告警导致复用段倒换异常...........................................................6-18
i
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统维护手册故障处理分册
第6章复用段保护倒换故障处理
第6章复用段保护倒换故障处理
复用段保护(MSP)是实现SDH传输网自愈功能的重要方法之一。
本章描述复用段保护倒换故障的处理方法。
6.1背景知识
这里只介绍与复用段相关的一些原理知识和技术要点。
6.1.1复用段保护分类及保护原理
复用段保护可以分成以下4种:
zzzz
二纤双向复用段共享保护环;二纤单向复用段保护环(专用环);线性复用段1+1/1:
1保护;四纤双向复用段保护环。
下面对最常用的二纤双向复用段共享保护环作一简单介绍:
1.二纤双向复用段共享保护环的原理
二纤双向复用段共享保护环的保护倒换过程如图6-1所示。
(a)
(b)
图6-1二纤双向复用段共享保护环
在二纤双向复用段共享保护环中,将每个传输方向光纤的容量一半分配给业务通道,另外一半分配给保护通道。
正常情况下,图(a)所示,从节点A进环以节点C为目的的业务信号沿S1/P2光纤按顺时针方向传输;而从节点C进环以节点A为目的的业务信号则沿S2/P1光纤按逆时针方向传输。
6-1
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统
维护手册故障处理分册
第6章复用段保护倒换故障处理
当节点B、C间两根光纤同时被切断,图(b)所示,节点B与节点C的倒换开关将S1/P2光纤与S2/P1光纤沟通。
在节点B将从节点A进环沿S1/P2光纤送来的业务信号时隙转移到S2/P1光纤的保护时隙,传送到节点C。
在节点C将从本节点进环沿S2/P1光纤送出的业务信号时隙倒换至S1/P2光纤的保护时隙,传送到节点A。
因为二纤双向环中每个方向的业务时隙和保护时隙在同一条光纤上传输,即在一条光纤上既传输业务信号又传输保护信号。
这时,无论是接收机、发送机、光缆或节点发生故障,总是会同时影响工作通道和保护通道。
2.二纤双向复用段共享保护环的特点
环上最大可保护的业务容量为K×STM-N/2,K为环上节点数。
对于节点之间业务分布均匀的情况可以大大提高传输容量,而对于集中型的业务分布则体现不出它的优越性。
对于STM-4级别的二纤双向复用段共享保护环,第一、二个VC-4是工作信道,第三、四个VC-4是保护信道。
对于STM-16级别的二纤双向复用段共享保护环,第1#—-8#个VC-4是工作信道,第9#—16#个VC-4是保护信道。
由于K1、K2字节中分别用四个bit表示节点号,所以环上最大节点数为16个。
中继站(REG)不需占用节点号。
不带额外业务的环,在没有先前的桥接请求以及短于1200km光纤的情况下,倒换完成时间应少于50ms。
3.倒换过程
二纤双向复用段保护是利用光纤容量的一半作为工作信道,另一半作为保护信道,对于两根光纤来说,一根光纤的保护信道用于保护另一根光纤的工作信道。
还可以用来传送额外业务,在发生倒换时,额外业务将被抛弃。
它的保护倒换属于双端倒换,即故障两侧的节点要同时倒换,所以需要协议来完成。
我们用的是复用段开销中的K1、K2字节来传送APS协议。
由于需要协议,所以倒换时间比通道倒换要长,而且对设备的软硬件要求都很高。
在工作信道恢复正常后,倒换并不马上恢复,而是要等待一段时间,这段时间称为WTR(等待恢复时间),这是为了避免线路不稳定而引起频繁倒换,WTR一般为5~12分钟。
6-2
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统维护手册故障处理分册
第6章复用段保护倒换故障处理
6.1.2OptiX2500+设备复用段倒换的实现
1.复用段保护遵循的标准
OptiX2500+遵循ITU-T关于SDH保护倒换的标准建议:
G.803/G.782/G.783/G.8412.复用段倒换的实现
OptiX系统的复用段保护倒换是由复用段模块实现,该模块的结构和接口关系如图6-2所示。
图6-2复用段模块
复用段倒换算法和网元侧/电路板侧的关系如图6-3所示。
6-3
图6-3复用段倒换算法和网元侧/电路板侧的关系
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统
维护手册故障处理分册
第6章复用段保护倒换故障处理
在线路上出现故障时,由线路板检测到SD(信号劣化)或SF(信号失效)条件,然后上报到主控板,主控板根据APS(自动保护倒换)协议产生K字节并通过线路板发送出去,其它节点的线路板收到K字节后上报主控板,由主控板完成APS协议。
最后主控板根据协议确定各节点的倒换状态,然后下发命令到交叉板进行业务的倒换。
SF包括R_LOS、R_LOF、MS_AIS、AU_LOP;SD包括B2SD和B2OVER。
线路板用B2_OVER和B2_SD两个告警来监测线路的误码,出现B2_OVER的条件为误码率超过10-3,出现B2_SD的条件为误码率超过10-6。
主机软件缺省状态下,SD启动复用段倒换的功能为关闭状态。
复用段倒换控制器(APSC)可以通过网管进行启动、停止。
配置完成后(2分钟后)自动启动复用段倒换控制器。
3.复用段控制器的状态迁移
复用段协议控制器共有6种状态,如表6-1所示。
表6-1复用段协议控制器的状态状态表示
协议停止态(0)
协议正常态(
1)
暂倒换态
(2)
倒换态
S(4)
等待恢复态(5)
穿通态(6)
协议的作用就是根据线路板检测到的通信质量信息、接收到的K字节或外部命令,控制这些状态之间的转移。
APS状态迁移的过程如图6-4所示。
S
PASS
图6-4APS状态迁移的过程图
6-4
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统维护手册故障处理分册
表6-2APS状态迁移的过程
过程编号
转移条件
常见情况
事件
第6章复用段保护倒换故障处理
过程
①
接收到协议启动命令。
主控复位;重新下发配置数据;由网管下发协议启动命令。
各站在协议正常的情况下,复位其中一个站的协议的启动过程。
协议停止过程。
略
②
接收到协议停止命令接收到短径来的无请求码。
下发协议停止命令,交叉、时钟板不在位。
故障恢复。
略
③断纤恢复过程。
接收到短径来的无请求码;取消K字节穿通;向两侧发送无请求码;协议恢复到正常状态。
收到其它站点间的桥接倒换请求后,执行K字节穿通;收到其它站点间的桥接倒换确认后,执行业务穿通。
检测到SF或SD消失,向长径和短径发送桥接倒换恢复请求;收到短径来的桥接倒换恢复请求,进入等待恢复态WTR。
等待设定的时长后,进入IDLE状态。
检测到SF或SD后,进入倒
接收到长径来的换暂态SA;
桥接倒换请求或桥接倒换确认后,进入倒换态。
略
④
收到其它站点间的桥接倒换确认命令
其他站点间出现故障。
断纤倒换过程。
⑤
接收到短径来的桥接恢复请求。
故障恢复。
断纤恢复过程。
⑥
接收到长径来的桥接倒换请求或桥接倒换确认。
当前倒换侧接收到非本节点的长径桥接倒换请求。
接收到长径来的桥接倒换请求或桥接倒换确认。
检测到SF或SD;接收到外部强制倒换命令。
断纤倒换过程。
⑦
整环依次启动协议过程。
倒换侧节点协议启动过程。
⑧
穿通站点一侧检测到SF信号。
再断掉已处于倒换状态站点的另一侧光纤,其光纤相连站点由PASS状态转移到S状态。
检测到SF信号,发送短径、长径倒换请求,启动T1定时器,进入倒换暂态SA;接收到长径来的桥接倒换请求或桥接倒换确认后,进入倒换态,命令交叉板进行页面切换。
4.复用段倒换的方式
通过网管和命令行可以实现强制倒换、人工倒换、锁定倒换等功能。
强制倒换是指强制使业务从工作信道倒换到保护信道,不管保护信道的状态是否正常;另外强制倒换之后,无论工作信道是否正常,系统将不会倒换回工组信道,也就是说执行了强制倒换后,系统将一直处于倒换状态下,不会自动恢复,除非再人为解除这一倒换操作。
6-5
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统
维护手册故障处理分册第6章复用段保护倒换故障处理
6.1.3K字节人工倒换是指用命令将业务从工作信道倒换到保护信道,如果保护信道处于正常状态,则倒换将发生,若保护信道处于失效或正在满足一个更高级别的倒换,则倒换不会发生;如果工作信道是好的,那么这次倒换动作将在恢复时间到了之后又自动回到最初的正常状态;这一操作主要是设备维护时用来测试网络目前是否还具有保护能力。
锁定倒换只是对相邻两点之间链路进行设定。
如果原系统都处于正常状态,那么锁定倒换的作用将是,让这两点之间发生的断纤、坏板故障不再引起倒换动作,通过这段路径传送的业务将会中断,但不影响不通过这段路径传的业务;但是如果正常时,发生的断纤不是这段被锁定的链路,还是能实现全环的保护。
如果已经断纤并倒换后,下发锁定倒换命令,然后恢复断纤,到达恢复时间后,倒换会恢复(如果不恢复断纤,倒换不会恢复)。
故锁定倒换只是在应倒换时锁定不让发生倒换,但是允许恢复。
以下关于K1、K2字节的解释只涉及在复用段维护中所需要的内容,其详细解释可参见G.841建议。
K1、K2字节位于复用段开销字节中,主要完成复用段倒换时信息的传递。
1.K1字节
K1字节的1~4比特位用来传送桥接请求码,5~8比特位用作桥接请求码的目的节点ID的传送。
K1字节的比特安排如图6-5所示:
桥接请求码目的结点标示码
图6-5K1字节的比特安排
目的节点标示码(5~8比特位):
由于只有四个比特位,因此一个复用段保护环上的网元数最多不能超过16个。
2.K2字节
K2字节的比特安排如图6-6所示。
6-6
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统维护手册故障处理分册
第6章复用段保护倒换故障处理
状态标示码长路径/
短路径
标示码
图6-6K2字节的比特安排
6-7
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统
维护手册故障处理分册
第6章复用段保护倒换故障处理
6.2常见故障现象及原因
保护倒换故障,是指在全网正常状态下突然发生不明原因的倒换,或者在应该发生保护倒换时,全网未进入保护倒换状态,或进入保护倒换后,全网或部分业务发生中断的情况。
复用段保护倒换的常见故障现象是如表6-3所示,可分为外部原因、数据配置原因以及设备故障原因三大类。
复用段保护倒换故障可能是其中的某一故障引起的,也可能是由于其中某些故障共同引起的。
所以要根据具体的情况,采用基本的故障定位方法逐个分析。
表6-3复用段保护倒换故障的常见原因故障类别故障原因
光纤连接错误
外部原因倒换协议异常
人为插入了MS_AIS、MS_RDI告警
全网业务配置不正确
数据配置
复用段参数配置不正确
线路板故障
交叉板故障
设备原因
SCC板故障
母板故障
6-8
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统维护手册故障处理分册
第6章复用段保护倒换故障处理
6.3故障定位方法与步骤
6.3.1常用定位方法
z
z环回法配置数据分析法
6.3.2故障定位步骤
复用段故障定位流程如图6-7所示。
6-9
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统维护手册故障处理分册
第6章复用段保护倒换故障处理
图6-7复用段故障定位流程
6-10
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统
维护手册故障处理分册
第6章复用段保护倒换故障处理
1.检查复用段参数、状态
对复用段保护环,业务异常时应先检查各个节点的复用段状态是否正常;并检查线路质量、确认引起复用段倒换的原因。
对复用段保护环,日常维护时应注意检查环上各个网元的节点参数设置是否正确,节点号是否按主环方向递增,协议是否已启动,各个网元的协议状态是否为正常状态。
2.按照链型网,逐段环回定位故障
如果APS协议的状态正常,但业务仍然不通,可以通过分析业务中断时的业务流向,将复用段环当作一条环型的链来进行故障定位。
这种方法定位故障起来比较简单,可以迅速定位出故障点。
将复用段环当作一条环型的链之后,可以用逐段环回的方法来定位故障。
这里逐段环回时APS协议仍保持启动状态,逐段环回的手段和前面讲述的所有区别:
因为倒换发生后业务可能不但要经过主用通道,还要经过备用通道,因此我们环回的VC-4可能既有主用通道的VC-4,也有备用通道的VC-4,视业务经过的路径而定。
环回第一个VC-4会影响ECC,要注意。
3.强制倒换,先恢复业务
比如某段光路有大误码,我们可以通过拔纤或下发强制倒换命令,使业务先恢复正常,然后再处理故障。
6-11
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统
维护手册故障处理分册
第6章复用段保护倒换故障处理
6.4分类故障定位与排除
6.4.1检查并分析外部原因
在处理故障时,首先应该检查设备外部的情况,例如是否人为停止了APS协议,错误设置了强制倒换,人为插入了MS_AIS、MS_RDI告警;同时应检查是否供电系统出现了问题,如电源故障,蓄电池故障等。
在排除外部原因后,如果故障仍然存在,可采用其他方法进行故障定位。
6.4.2检查APS协议和复用段参数
1.保护倒换协议正常启动,但保护倒换不成功
检查复用段协议是判断故障时必须进行的步骤。
通过网管对各个网元的当前的状态进行查询,若整个网络中有两个相邻网元的状态为“倒换态”(S),而其他网元均为“穿通态”(P),则说明APS协议正常启动。
若各网元的状态正确,APS正常启动,但业务仍然中断,首先可以考虑通过网管重新启动协议;如果重新启停协议后,业务仍然中断,则须考虑是否是电路板存在问题,这时可以按一般的业务中断故障进行处理。
2.保护倒换协议异常,保护倒换不成功
APS协议异常通常有两种现象:
(1)APS协议不能正常启动/停止;
(2)部分/全部网元的站点状态异常;
APS协议异常,会引起K字节的穿通和上报出现问题,从而导致保护倒换不成功。
此时可以先检查各网元的复用段参数是否配置正确,是否有的网元的复用段参数丢失;如果参数设置没有异常,可以检查光板和主控板是否工作正常。
参数设置时需要注意:
(3)线路板要求使用对偶板位/通道
复用段组网对网元的板位有要求,要求光板所用的板位或通道必须对偶。
对偶板位或通道提供的板间通信功能,可以完成K字节的穿通。
进行复用段组网时,应确认所用光口的板位或通道是否对偶。
(4)逆时针方向、主环方向
6-12
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统
维护手册故障处理分册第6章复用段保护倒换故障处理
6.4.3其他逆时针方向为主环方向。
将网元上相邻光板的左边板位称为西向,右边板位称为东向。
逆时针组环要求环上各节点的东向板位光板与下游站西向板位的光板相连,西向板位的光板与上游站网元东向板位的光板相连。
(5)复用段环的数据设定复用段参数包括:
逻辑系统号、复用段节点号、最大节点号、等待恢复时间。
复用段参数设置必须准确,否则可能导致复用段倒换失败。
【逻辑系统号】OptiX设备为多ADM(MADM)设备,可同时支持多个复用段保护环,逻辑系统号用以区分不同的复用段保护环。
【复用段节点号】环上复用段节点号,可任选一个网元从“0”开始,按主环方向逐站递增,最大节点号为15。
属性为REG的网元不需节点号。
【最大节点号】最大节点号:
为复用段节点总数-1。
【等待恢复时间】一般设置为600秒。
K2字节的状态标示码(6~8比特位)是反映APS协议的状态,如果人为的改变这3个比特位,将会影响的网元对K字节的正常判断和处理。
在平时的维护、测试时,可能会人为的对设备插入MS_AIS、MS_RDI告警,这些告警将直接影响到K2字节,因此必须在使用完毕后取消这些告警,否则会影响APS正常工作,全网不能正常倒换。
6-13
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统
维护手册故障处理分册
第6章复用段保护倒换故障处理
6.5常见故障处理案例
6.5.1复用段节点倒换状态不正确的处理
1.系统概述
某传输组网如图6-8所示。
5个站组成的一个STM-16复用段保护环,1号站为网关网元,1号站到其它各个站有业务。
图6-8系统组网图
2.故障现象
环上2号网元与3号网元之间断纤后,环上业务出现中断。
3.故障分析及排除
断纤复用段倒换后业务应能正常保护倒换,出现业务中断的原因可能是复用段倒换失败,各节点的倒换状态不对。
查询3、4、5、1、2号网元的复用段倒换状态,不是S、P、P、P、S态。
倒换状态不正确。
通过网管,将复用段协议控制器停止后重新启动,业务出现正常。
4.结论及建议
在业务中断的情况下,及时恢复业务很重要。
由于复用段协议复杂,受各种因素的影响可能导致倒换失败。
在这种情况下可以重新启停协议,试一下倒换能否恢复正常。
遇到复用段倒换失败,应查明原因。
OptiX提供了复用段倒换事件记录的功能,复用段倒换失败应及时通知华为公司的维护工程师,以便收集数据进行分析。
6-14
OptiX2500+(Metro3000)STM-16MADM/MSTP光传输系统
维护手册故障处理分册
第6章复用段保护倒换故障处理
6.5.2复用段节点参数设置错误导致倒换失败
1.系统概述
某传输组网如图6-9所示。
5个站组成的一个STM-16复用段保护环,1号站为网关网元,1号站到其它各个站有业务。
图6-9系统组网图
2.故障现象
2号和3号网元之