PTN运行维护篇.docx

上传人:b****6 文档编号:16817573 上传时间:2023-07-17 格式:DOCX 页数:15 大小:169.20KB
下载 相关 举报
PTN运行维护篇.docx_第1页
第1页 / 共15页
PTN运行维护篇.docx_第2页
第2页 / 共15页
PTN运行维护篇.docx_第3页
第3页 / 共15页
PTN运行维护篇.docx_第4页
第4页 / 共15页
PTN运行维护篇.docx_第5页
第5页 / 共15页
PTN运行维护篇.docx_第6页
第6页 / 共15页
PTN运行维护篇.docx_第7页
第7页 / 共15页
PTN运行维护篇.docx_第8页
第8页 / 共15页
PTN运行维护篇.docx_第9页
第9页 / 共15页
PTN运行维护篇.docx_第10页
第10页 / 共15页
PTN运行维护篇.docx_第11页
第11页 / 共15页
PTN运行维护篇.docx_第12页
第12页 / 共15页
PTN运行维护篇.docx_第13页
第13页 / 共15页
PTN运行维护篇.docx_第14页
第14页 / 共15页
PTN运行维护篇.docx_第15页
第15页 / 共15页
亲,该文档总共15页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

PTN运行维护篇.docx

《PTN运行维护篇.docx》由会员分享,可在线阅读,更多相关《PTN运行维护篇.docx(15页珍藏版)》请在冰点文库上搜索。

PTN运行维护篇.docx

PTN运行维护篇

PTN运行维护篇

1.1网络故障处理基本思路和方法3

1.1.1PTN与MSTP告警对比3

1.1.2常见告警故障处理方法5

1.1.3以太网业务丢包类故障处理方法7

1.1.4OAM/PING调试法7

1.1.5环回逐段定位法10

1.2PTN网络例行监控1..1.

1.1网络故障处理基本思路和方法

PTN的组网、业务配置愈发复杂,需分组厂商网管尽快做好SDH—Like功能。

为尽快恢复业务,将检

测的故障点最小化,需了解SDH原理、IP网络原理知识、告警信号流及告警产生机理、PTN设备和网管基

本操作、常用仪表的基本操作,了解网络拓扑,业务配置,设备运行状态。

告警、性能分析法

OAM/PING调试法

环回法

PTN对于Tunnel的故障可用MPLSOAM来检测,MPLSOAM包括CV/FFD、Ping和Traceroute。

通过CV(ConnectivityVerification)/FFD(FastFailureDetection)检测可以检测LSP的连通性。

CV检测和FFD检测的过程基本一致,其不同在于CV检测发送CV报文的频率固定为1帧/s并且不可设置,而

FFD检测发送FFD报文的频率是可以自行定义的。

MPLSPing/Traceroute为用户提供了发现LSP错误、

并及时定位失效节点的机制。

MPLSPing/Traceroute使用MPLSEchoRequest和MPLSEchoReply检

测LSP的可用性。

MPLSEchoRequest中携带需要检测的FEC(ForwardingEquivalenceClass)信息,

和其他属于此FEC的报文一样沿LSP发送,从而实现对LSP的检测。

为了更好的理解PTN,我们就把PTN与熟悉的SDH的业务层面告警类比一下,与大家共享。

1.1.1PTN与MSTP告警对比

对应于业务模型,PTN的告警分为物理层、数据链路层、Tunnel层、PW层、仿真业务层五个层次。

对应SDH的物理层、再生段复用段层、服务层、路径层。

上层功能的实现依赖于相邻下层提供的服务。

低层与高层同时有故障产生时,低层故障的消除是处理高层故障的基础,物理层故障引发的告警屏蔽其它层故障引发的告警。

SDH的告警与PTN的最根本的区别在于SDH的告警都是由字节承载上报的,而PTN告警

SDH

图28PTN网络与MSTP告警对比图

业务模型中,PW可类比VC12、Tunnel类比VC4管道,CES即电路仿真业务就是传统的E1;告警可划

分为业务类告警,系列类通用类告警,下面表格按业务告警,与SDH进行类比,各业务层告警对比:

MST告警

SDHPTN类比

结果

PTN告警

业务层(VC12(ETH/CES/IMA/ATM)

TU_AIS

T_ALOS

UP_E1_AIS

DOWN_E1_A等

继承了SDHE1、ATMIMA业务告警的特点

PW_DOWNT_ALOSTU_AIS_VC12

UP_E1_AISDOWNE1A等

PW业务层(ETH/CES/IMA/ATM)

服务层(VC4)

HP_SLMHP_UNEQ

继承了服务

层SDH告警,新增加了

MPLSTunnel

类告警

MPLS_TUNNEL_LOCV

HP_SLM

HP_UNEQ

Tunnel层

(Tunnel/PW/MPLSAPS)

再生段复用段

(开销)

B1、B2误码检测

告警

复用段告警

IMA业务告警

继承了SHD误码类,复用段类告警(线性),增加了多协议标签交换(MPLS)告警,LAG类

告警

B1、B2误码检测线性复用段告警IMA业务告警

LAG_DOWN

MP_DOWNETH_APS_LOST

ETH_APS_PATH_MISMATCETH_APS_SWITCH_FAILETHCFMMISMERGE

数据链路层

(MLPPP/STM/LAG)

;H

物理层(单板/ETH端口/SDH端口/E1口)

R_LOS

ETH_LOS

T_ALOS

LASER_MOD_ERETH_LINK_DOWN

物理层告警与SDH相同,完全继承了

RSDI光口、ETH

1电口、光口的习惯

R_LOS

ETH_LOS

T_ALOSLASER_MOD_ERRETH_LINK_DOWN

物理层(单板

/ETH端/SDH端口/E1口)

1.1.2常见告警故障处理方法

CES业务常见告警故障处理方法:

序号

告警名称

产生原因

处理方法

1

T_ALOS

E1信号丢失,主要上报在支路接口板上;

环回E1

2

UP_E1_AISD0WN_E1_AIS

分别是上行2M言号指示、和下行2M言号指示,产生原因和SDH勺相同

察看对端是否有

TU_LOP_VC12、T_ALOS或

TU_AIS_VC12告警。

或者E1环回方式

3

MPLS_TUNNEL_LO(

;VMPLSTUNNELLOCV为Tunnel连通性丢失告警。

连续3个周期内没有收到希望的CV/FFD报文时出现此告警。

产生g该告警

时,该TUNNE承载的业务已中断,

原因1:

往往是下层网络异常引起,例如物理链路故障等,光模块故障

原因2:

网络出现严重的拥塞。

原因1:

物理链路故障。

1.在网管上检查该链路两端网元是否存在单板或光模块相关的告警。

若存在,消除这些告警,查看告警是否消除。

2.若告警未消除,查看光纤是否故障,更换故障的光纤。

原因2:

网络出现严重拥塞。

1.选择较大的“CC测试发送周期”的参数值,具体操作见本文的创建维护联盟。

2.检查故障Tunnel的带宽占用情况,如发现已满,请增大Tunnel带宽配置或消除非法发送大数据量的根源,查看告警是否消除。

4

TU_AIS_VC12

系统中存在更咼阶的告警,如

RLOSRLOFHPSLMAUAIS

上游站点存在硬件故障告警

交叉板故障

对端站对应通道失效

按照产生原因点,逐步排除;先看疋否有咼级别的R_LOS

R_LOFHP_SLMAU_AIS告警,然后看是否存在硬件故障支路板?

交叉?

取后对端

对应通道?

需要用到经验法、替换法等。

与SDI类似

业务中断类常见告警原因:

光纤、电缆故障、环境温度、误操作设置了光路的环回、误操作更改、保

护业务配置数据有误。

应急处理时优先恢复业务,排除外部设备的问题,将业务倒换到备用通道,复位单板、单站重启、重新下发配置等。

以太网业务常见告警故障处理方法:

序号

告警名称

产生原因

处理方法

1

ETH_LOS

以太网端口连接丢失,可能原因:

以太网端口的电缆或光纤没有连接好;电缆或光纤故障;本端网元接收光功率过低;单板故障。

属于物理层故障类,察看物理连接,端口、单板故障;逐一排除。

2

MAC_FCS_EXC

MAC_FCS_EX(为MAC层检测到误码越限告警。

软件定时检

测MAC芯片接收字节数和误

1:

检测是否链路出现故障,维护光纤或网线,查看告警是否消除。

码字节数,计算误码是否超过门限,超过设置越限门限发出此报警。

2:

若告警仍未消除,检测是否存在DOS攻击等,隔离DOS攻击源,查看告警是否消除。

3.若告警仍未消除,是否出现配置环路或物理等问题,解除环路,查看告警是否消除。

3

ETH_LINK_DOWN

以太网连接错误,端口协商失败;可能原因:

端口模式不一致;电缆光纤连接故障;单板故障。

对应需要察看和排除端口协商问题,主要关注端口模式,端口速率级别。

最后使用替换法检验是否是硬件故障

4

FLOW_OVER

端口接收流量超限告警;可能原因为实际接收的端口流量大于设定的端口流量限值。

增加端口带宽。

丢包类故障常见原因:

光功率问题、环境温度、数据业务端口协商故障、时钟配置错误、业务流控配

置。

可通过查看光功率、RMON、丢包率等性能事件解决。

MPLS保护倒换类告警排除:

倒换告警

告警信息

故障原因

ETH_APS_TYPE_MISMATCH

保护类型信息不致

1、两端配置的1+1或1:

1模式不一致;

2、两端配置的单端或双端倒换的模式不一致;

3、两端配置的恢复式或非恢复式的模式不一致;

ETH_APS_PATH_MISMATCH

APS工作、保护路径不一致

1、保护组两端设备配置的工作路径、保护路径不一致;

2、物理链路上存在有错连;

ETHAPSSWITCHFAIL

保护倒换失败

1、倒换失败;

ETH_APS_LOST

APS帧丢失

1、对方没有配置保护;

2、保护通道业务中断;

1.1.3以太网业务丢包类故障处理方法

业务丢包、错包的可能原因

端口光功率异常或光功率不稳定,这是最常见的丢包原因

时钟未跟踪,或跟踪源不稳定,会导致周期性丢包

Tunnel下一跳端口IP设置错误(如设置为本端端口,扩容或调整业务时)可能会导致丢包

网络侧发生拥塞,由于现网基本是轻载状态,拥塞可能性较小

排查业务丢包、错包的思路:

找出与有问题的业务”走相近链路的业务,看是否有类似问题,以此缩小范围

业务A

如果业务A有丢包,业务B不丢,则问题应该在网元A与网元C之间

1.1.4OAM/PING调试法

常用场景:

数据业务通断判断

维护中,工作难点主要在于如何能够快速有效地排除故障。

在众多的故障中,以“业务不通”最为常

见。

应该如何着手解决呢?

首先我们将PTN专线业务做成下图所示的分段。

PTN网络关于OAM的规划主

要涉及:

MPLSOAM、以太网端口的OAM。

适用于故障定位到单站,主要用于检查网络连接是否可达,以及分析网络什么地方发生了故障。

常用OAM排障步骤1—TunnelOAM

PW配置

1严—

Tunnel配置

PW配置

、1

透传设备

(PTN,波分设备等)

NODEB

接入侧PTNUNI

接入侧PTNNNI

核心侧PTNNNI

核心侧PTNUNI

RNC

~VV-

业务配置业务配置

红色标识部分是维护关键区域,因为这一区域的网元多,外部因素多(光缆,光模块,波分设备等),需考虑业务扩容,业务归属关系调整

排障的主要工具:

TunnelOAM

使用方法:

到两侧(接入侧、核心侧)网元查看TunnelOAM状态

结果分析:

两侧TunnelOAM状态都是远、近端可用”——该区域基本没有问题

TunnelOAM检测有任何缺陷上报-----根据“LS缺陷位置’可锁定故障位置

查MPLS_TUNNEL_LOCV告警:

含义:

Tunnel链路中断解决措施:

需要检查

Tunnel链路的连通性,发起LSPPing确认故障节点/链路,并观察Tunnel链路中其它节点的相关告警信息,需启动OAM功能。

排障步骤2—LSP故障位置分析

H^Tunnel|口册纳

P..

IL£FW吐型

LS镖用

曲门限

副门限

宕节丸三

近希妊皿T可用状态

(JLOCV

655350

1510.10

0

45.12123

4^.1.01Q

运洁可用杭态

]■

-

-

0

皈10.1Q

4&.U123

红框内的LSP缺陷位置指示了问题网元的LSRID(GCPNODEID)

在LSP缺陷位置及相邻网元范围内,进一步排障步骤:

检查光纤原因

检查业务告警

ETH_LINK_DOWN,ETH_LOS,R_LOS等链路异常告警

IN_PWR_ABN等光功率异常告警

HARD_BAD、BUS_ERR、BDSTATUS等硬件异常告警

检查配置

源宿节点是否正确

相邻网元的出入标签是否一致

下一条端口IP是否正确

其它可能原因:

源宿节点是否正确

相邻网元的出入标签是否一致

下一条端口IP是否正确

查看各端口收光功率的当前/历史性能是否过低或过高:

有可能端口收光功率接近但未超过阈值,导致无告警上报,所以需要查性能有可能端口收光功率不稳定,导致当前性能值正常,所以需要查历史性能下一条端口IP是否正确

查看各NNI端口的设置:

耳衣国总|密星控剖.ZEW1-EJEWU|誣厲性

诰口

謡口贷童

諾口複式

封装盍型■-

工蚀式

At知岸赍如曰

用如牖口-口

602.1Q

压EI=G2<2躺口■舟

三尾

B02.1Q

自惋厨

1620

基4■居性■'谕足性制丁二E馬1汀三层居性高够性]

琲口宀

QINQ^gJJit・

TAG^iR

嚴省VLANID

VLAN

6-EFG2-16S;a-1)

FFFF

1

0

6-EFG2-26WQ-2)

FFFF

TaoAware

1

0

性|蛙鱼F鈿」「二层夙性HEK'lI高最凰性

谕口

Turin®檢配技态

鈕賀留械减i阔

TE靈里

它型目

IPtitJ

IF摺玛

6-EFG2-K...

HOOOOHD

10

0

手工皓走

255.255.255.252ll

6^EFG2-2(...

■ft能

loooaoD

1D

0

手工聒走

46.1.58.21

255.255.255.252

ETHOAM的简易操作步骤

A.两端网元发起LB测试,用于命令触发的连通性检查,对以太网业务执行不中断业务环回检测(LB),可以检验业务的连通性情况,以便定位和修复故障。

注:

只须输入对端UNI端口MAC地址就可以启动测试了,其他参数可用默认

OAM功能产生的告警概览:

MELSOAM

MPLS_TUNNEL_LO告警

含义:

Tunnel链路中断

解决措施:

需要检杳Tunnel链路的连通性,发起

LSPPing确认故障节点/链路,并观察Tunnel链路中其它节点的相关告警信息。

MPLS状态

Init(初始)状态

Ingress端没有使能OA或者Tunnel链路中断;

Available(可用)状态

Tunnel状态正常;

Unavailable(不可用)

状态

Tunnel状态不可用,需要检查Tunnel链路的连通性,发起LSPPing确认故障节点/链路,并观察Tunnel链路中其它节点的相关告警信息

ETHOAM

ETH_CFM_LOC警

含义:

ETH业务中断

解决措施:

需要发起ETHLB进行故障确认,发起LT进行故障定位;对于MPL承载的ETH业务,需要观察MPLSTunnel的连通性。

ETH_CFM_R告警

含义:

对端检测到ETH业务的告警后的回告指示解决措施:

需要在对端进行告警确认和排查操作;

ETH_EFM_□告警

含义:

ETH链路发现失败

解决措施:

检查两端的ETHLinkOAM的配置是否一致,检查ETH链路的连通性;

ETH_EFM_EVE告警

含义:

ETH链路存在误码

解决措施:

对端网元检测到端口有误码,需要在对端网兀确认其接收链路是否正常;

1.1.5环回逐段定位法

常用场景:

CES业务、SDH业务出现故障时,在支路或线路环回,定位故障原因到单站,环回操作会

导致业务中断。

仅在SDH类业务使用;注意:

数据类定位的方法,为避免环回造成的网络风暴,使用ETH

OAM功能,维护过程中不使用环回。

SDH接口在维护中使用内环回和外环回。

PDH接口使用内环回和外环回两种环回方式。

网管中环回界面与SDH近似。

1.2PTN网络例行监控

网络维护工程师在维护PTN网络时,比MSTP网络更关注RMON性能等数据

T2000网管上日常维护项目表:

维护责任人

维护地点

维护项目

周期

网管操作员

网管中心

检查网兀和单板状态

每天

浏览全网告警

每天

浏览异常事件

每天

浏览当前性能

每天

浏览RMON统计组性能

每天

检查光接口的光功率

每天

浏览历史性能

每周

浏览RMON历史性能

每周(端口流量统计、端口丢包、业务流统计)

备份T2000的M0数据

每周

备份网元数据库

每周

备份网元数据库:

PTN网络在面对灾难性故障时,单主控板失效、数据库损坏等故障时,快速恢复业务方法是数据库下载恢复。

网管数据库备份工具中,可设置定期任务,自动定期上载网元数据库到网管电脑中。

另外在每次大业务量配置(包括单站配置以及全网配置)修改后,都要进行一次网元数据库的备份操作,保证备份数据库最大限度的与网元一致。

备件单板更换:

SDH设备的备件单板,需定期拿出来,随现网进行升级更新,而PTN的单板,插入到子架中,能够自动向主控软件包申请,更新自身的单板软件,节省了备件单板维护的工作。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 经管营销 > 经济市场

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2