《路测掉话的原因分析及解决》.docx
《《路测掉话的原因分析及解决》.docx》由会员分享,可在线阅读,更多相关《《路测掉话的原因分析及解决》.docx(31页珍藏版)》请在冰点文库上搜索。
《路测掉话的原因分析及解决》
目录
第一章前言1
第二章造成掉话的多种原因2
一、频率干扰2
二、覆盖问题3
三、硬件问题4
四、其它问题4
第三章路测掉话的原因分析及解决4
一、关于掉话的描述4
1)射频掉话5
2)切换掉话5
二、在路测时发现的掉话问题时,我们应从哪些方面进行考虑?
5
三、对掉话现象进行分析以及可能的原因6
1)频率干扰6
2)缺少邻区&目标小区话务信道拥塞严重10
3)覆盖问题(Poorlevel&Overshooting)12
4)有线口的信道释放造成的掉话15
5)硬件故障直接导致的掉话15
6)BSS参数设置不当19
7)切换掉话21
8)手机问题21
9)交换机参数设置问题27
第四章路测中见到的典型的掉话现象30
一、频率干扰30
二、载频误码率高31
三、载频低功32
四、同频负切32
结束语34
第一章前言
在移动通信中,掉话是指在分配了话音信道(TCH)或独立专用控制信道(SDCCH)后,由于某种原因,使呼叫丢失或中断,正常通话无法进行的现象。
掉话对系统接通率等指标虽没有重大影响,但却给用户造成许多不便,是目前用户投诉的热点。
掉话是用户衡量企业运营质量和水平的重要标志,企业必须予以重视。
道路测试(DriverTest)是优化工作中必不可少的一项工作。
测试工程师通过使用测试工具(笔记本电脑、测试软件、测试手机、GPS等)驱车进行通话状态和空闲状态的测试,通过记录下来的各种数据(场强、通话质量、小区参数、手机的瞬时状态等)进行现场或后期的分析,查找并解决网络问题。
随着网络的发展路测的工作方法和工作思路也应该逐步开阔和深入。
一直沿用老的办法和固有的思维定式去分析日益复杂的网络问题是越来越难了。
我们想通过对过去路测工作中所遇到的掉话问题的总结分析,给大家一个日常工作的指导,另外也希望能够使大家开阔思路,逐步分析和解决今后可能遇到的其它的网络深层次问题。
第二章造成掉话的多种原因
一、频率干扰
在网络规模不断扩大的情况下,由于频率资源的限制,频率复用度必然增加;由于规划或地理位置的原因,在多小区的情况下多会产生同频、邻频干扰,使通信质量下降,网络服务性能变差。
干扰是影响通话质量及掉话率、接通率等网络系统指标的重要因素。
由于无线电波传播的特性,决定其在通信过程中必然受到外界多种因素的影响。
但是由于网络内部原因,它还在一定程度上受到网络内部其它因素的影响,如同频干扰、邻道干扰,以及其它因网络某些参数设定不当而造成的干扰。
这些干扰的存在给我们网络的正常运行带来了一定的不良影响。
作为网络优化问题的核心问题,解决无线干扰问题显得越来越重要。
QUALITY(质量)
ERRORBIT(误码率)
0
<0.2%
1
<0.4%
2
<0.8%
3
<1.6%
4
<3.2%
5
<6.4%
6
<12.8%
7
<256%
二、覆盖问题
无线信号覆盖是无线移动通信系统保障通信的最基本的条件。
如果没有好的覆盖作保证,优化工作将很难得到良好的效果。
在路测中所遇到的覆盖问题造成的掉话我们将在下一章具体分析。
在这里我们想先对时间提前量(TimingAdvance)的定义做一下介绍。
TA计算的依据是:
基站发出信号到人手机接收到的响应的延时T,然后将该值除以2,再乘以光速300000000米/秒,及得到基站与手机的相对直线距离。
TA原指的是时间值,但实际上是用距离来代替了时间,即用不同距离的代表值表示TA的大小,具体表示如下:
TA值
距离值
0
550米
1
1100米
2
1650米
所以在谈到手机与基站之间的距离时,我们会用TA值来表示。
三、硬件问题
这里的硬件问题包含了很多方面。
如基站的载频,处理器板子,天馈线等。
不同的硬件发生故障后,会有不同的表象,但肯定会对用户的通话产生影响,严重的就会发生掉话。
关于硬件问题造成的掉话在网络中所占的比例也非常大。
具体的问题我们将在下一章详细的结合实例进行分析。
四、其它问题
我们把直放站产生的带外干扰、交换机和BSS参数设置问题和手机问题等特殊原因都列在这里,这些问题需要日常经验的积累,而且要求分析特殊问题时要拓展思路,采取非常规的办法,例如采用频谱分析仪,信令分析仪,查找不常改动的参数等办法来发现。
这些问题也都将在下一章中结合实例来分析。
第三章路测掉话的原因分析及解决
一、关于掉话的描述
在GSM系统中掉话从统计角度讲分为两大类:
RF_LOSS和HO_LOSS即射频掉话和切换掉话。
考虑到2层信令的接续等问题,我们把掉话作如下描述。
1)射频掉话
●下行原因:
Radio_link_timeout计数器减至0
●上行原因:
BSS在link_fail的设定时间内未能接收到ULSACCH消息,使link_fail计数器减至0。
BSS下行功率停止发射
●在Layer2上:
BSS/MS每T200时间发送N200+1次SABM/DISC消息,但未从接收端收到回应
2)切换掉话
●MS未能成功切换至目标小区,但未能回到源小区
●MS发送HOFAILURE和UL-SABM消息给源小区,但未得到回应
二、在路测时发现的掉话问题时,我们应从哪些方面进行考虑?
在路测中,如果我们发现了掉话,我们应该如何入手?
建议根据不同的现象作出一些初步的判断,可以尽量减少不必要的周折,提高工作效率。
归纳起来初步判断有以下几点:
●带内、外干扰
●无可切换的小区(拥塞、无邻区)
●覆盖问题(overshooting/poorcoverage)
●有线口的信道释放
●基站硬件故障(时钟、CTU低功、信道盘的收发功率不平)
●天线错误(下倾角、方位角等错误)
●由于切换失败造成的掉话
●参数设置不当
●其它特殊原因(手机问题、交换机参数设置问题)
三、对掉话现象进行分析以及可能的原因
在这一节中我们对每种造成掉话的可能原因进行具体的研究。
在每一种原因中,我们尽可能的举出实际例子来进行说明。
1)频率干扰
干扰会导致误码率升高,通信质量下降,是造成掉话的一个重要的原因。
干扰可以分为带内干扰和带外干扰,也可以叫做系统内部干扰和系统外部干扰。
带外干扰:
随着科技的进步,空中的无线电波越来越多,有些系统如TCS系统与GSM系统工作在同一频段,如果频率设置不当,会造成严重的频率干扰。
在发射设备的非线性单元由于载波与通过天线进入的干扰信号产生互调干扰,会引起通话质量下降,产生掉话。
另外一种情况就是人为的加建GSM频段的直放站,对功率以及天线方向不进行控制,对系统会造成上下行的干扰。
一般有这种直放站时,基站会通过对话音信道空闲时的干扰电平测量值(IOI)上有所体现。
带内干扰:
GSM系统内部干扰主要由以下几个方面原因产生:
●频率规划不合理,引起同频、邻频干扰;
●基站或手机功率设置不合理,引起下、上行链路干扰;
●频率复用不合理;
●由于多径效应、建筑物反射等造成干扰;
●码间干扰;
●TA与实际不符造成时隙干扰。
当MS在服务小区收到很强的同频或邻频干扰信号时,会引起误码率恶化,使手机无法准确解调邻近小区的BSIC或不能正确接收MS的测量报告,从而产生掉话。
下面两个例子分别从由于直放站造成的带外干扰、由于频率规划原因造成的带内干扰两个方面对干扰造成的掉话进行了说明。
实例1:
频率规划问题
现象:
从图1我们看到:
从当前显示的信息看,3361基站信号很强,但是质量很差,致使RLT超时掉话。
手机掉话后马上进行小区重选,基站为914,但是BCCH与3361同频,同时我们发现掉话时3361的TA已经为4,且覆盖方向也不应该是掉话地点。
分析:
在我们日常测试中这种情况多是由于干扰或是硬件问题引起的。
通过OMC我们未观察到该基站存在硬件问题,由此我们认为该基站存在干扰情况。
这样我们就初步判断除了掉话原因。
结合小区分布图来判断,我们认定这个掉话是由于同频干扰引起的。
图1掉话时刻情况
又经过分析,发现之所以在该地区占用3361,主要是由于3363基站无法切换到914基站。
3361是3363的邻区但是914不是,由于3361于914同BCCH,手机切到了3361上。
再加上网络规划不好,这就造成了同频干扰,继而掉话。
见图2。
图2干扰基站图
事故原因:
同频干扰造成掉话,通过对规划的调整和修改邻区参数,上述问题得到解决。
实例2:
直放站、阻断器造成的掉话
随着用户的增多,很多宾馆酒店写字楼等建筑物内为了解决电梯、地下室等信号覆盖的盲区就会出现私建直放站,从而产生了强烈的上下行干扰,有时波及周围很多小区的性能,对网络指标的影响非常大。
频率阻断器是一种宽带的干扰器,其安装的目的就是要对移动通信系统产生强烈的干扰,以达到阻断器周围一定范围内手机无法接入系统服务的目的。
一般在路测时我们很难直接从下行的测量发现是否有上行干扰,可以结合统计是否有上行的IOI来分析。
如下图,占上问题小区后下行Rx_Level,Rx_Quality都很好,但是过了十几秒后系统停止发送SystemInfo5/5ter/6,进入了IDLE状态,没有Disconnect以及ChannelRelease等拆线消息。
通过分析发现虽然Level和Quality都很好,但是手机却在逐渐的提升功率,造成功控的原因就是上下行的Level和Quality,因此可以因为问题出现在上行。
查找该小区的统计发现,整个小区的各个载频均有较严重的IOI干扰电平,因此,可以认定当时基站是Link_Fail计时器超时自行拆线,而上行干扰是造成这次掉话的罪魁祸首。
图3下行电平和通话质量很好,但是手机却在提升功率
虽然都是对网络产生了干扰,但是阻断器和直放站的影响有些不同,阻断器会带来话务量下降,并对周围基站的切换影响更大。
因此阻断器的干扰影响比直放站更加严重。
2)缺少邻区&目标小区话务信道拥塞严重
其实缺少邻区的现象和目标小区TCH拥塞严重在DT测试中的现象是极为相似的。
下面仅以缺邻区为例进行分析。
实例:
Cell56缺Cell3703邻区最终导致掉话。
现象:
Cell56(BCCH46)缺Cell3703邻区(BCCH35),但有Cell3266邻区(BCCH34)。
但3703强度高20dbm,但由于无3703邻区,只能切换至3266,造成干扰。
切换时如图4所示,当前服务小区为CELL56(BSIC2-BCCH46),经过判断,向排在邻区第三位的CELL3266(BSIC23-BCCH34)切换,如图所示,源小区56当前的下行电平为-76dbm,目标小区3266当前的下行电平为-65dbm。
图4系统消息5中没有35号频点
切换后,发现服务小区电平依然很强但Quality突然变差,最后致使掉话。
如图5所示,我们看到有频点号为34,35的邻频存在,C/I=-21dbm。
从源小区56的SYSTEMINFORMATIONTYPE5中看到Neighbor的频点list中没有35号频点,即说明56没有3703的邻区,因此在56为服务小区时,手机没有对35号频点进行扫描。
若对35号频点进行扫描,则会切至该小区,同时也避免了邻频的干扰。
加上邻区后,一切恢复正常。
图5切换后发现邻频干扰
一般来说,如果缺少了邻区,将会发生拖带直至掉话的现象。
在整个拖带过程中,很有可能邻区列表中的场强远远大于服务小区电平值,同时其它频点的BSIC也已经解出,但就是没有下行的Handover_Command消息。
出现这种现象说明了以下两点:
1.手机所扫描的邻区频点必定是在当前服务小区下行所发的系统消息5/5ter(SystemInformation5/5ter)的BA_LIST中所包含的,即当前服务小区的邻区中有BCCH为该频点的邻区;
2.排在邻区列表前几位的频点与已解出的BSIC组合之后得出的小区必定不是当前服务小区的邻区。
在实际工作中,如果遇到上述情况,在分析出不是缺邻区的问题后,就应该检查是否目标小区TCH拥塞。
3)覆盖问题(Poorlevel&Overshooting)
A.覆盖场强低(PoorLevel)
在测试中,我们在遇到覆盖场强很低的情况下,通常会导致RxQuality随着场强的下降而恶化,最终由于Radio_link_timeout或Link_fail超时导致掉话。
这种情况一般发生在郊区缺乏基站覆盖或山区信号阻挡较严重的地区,解决这种无信号覆盖的唯一办法就是加站或是直放站扩大覆盖。
图6很差的覆盖造成了掉话
B.过覆盖(Overshooting)
还有一种覆盖问题就是邻区间交叠区过大,甚至出现了过覆盖(Overshooting)的现象。
比较典型的情况是:
一个较高的基站A的天线没有作下倾角或只有很小的下倾角度,与它相邻的一个基站B的天线高度较低,覆盖范围很小,造成B的覆盖范围被A完全包含。
如图7所示。
所以在越过绿色的B小区主控覆盖范围后,手机还会“回切”至A小区,但是由于种种原因,A小区并没有C小区的邻区。
因此,当测试人员继续行驶后,就会因无邻区可切而造成拖带掉话(例如在红色区域)。
解决的办法就是如图中所示,将小区A的覆盖范围控制好(小区A’),就可以解决过覆盖造成掉话的问题。
图7Overshooting现象
同前边一节缺邻区掉话中所提到的类似,Overshooting造成的掉话现象有两种:
1.在邻区列表中有很强的信号,同时BSIC早已解出,但根本没有下行的HO_Command消息,这说明手机所扫描的邻区频点必定是在当前服务小区下行所发的系统消息5/5ter(SystemInformation5/5ter)的BA_LIST中所包含的,即当前服务小区的邻区中有BCCH为该频点的邻区;
2.看不到有比当前服务小区信号更强的信号,说明小区C的频点不在A小区的BA_LIST中,手机没有对该频点进行扫描。
对于后一种情况,测试人员更不容易发现,因此需要测试人员在测试现场结合基站位置图对原因进行判断。
4)有线口的信道释放造成的掉话
●Abis掉话:
这类掉话主要是传输质量引起的,如传输误码、滑码、帧丢失等。
●A接口掉话:
A接口掉话特别容易发生在MSC之间、BSC之间等与A接口有关的切换过程中,MSC、BSC之间的切换除了与无线网络有关外,还与网间信令配合、信号同步等因素有关,局间切换相对较复杂,也较容易引起掉话。
5)硬件故障直接导致的掉话
经验指出在现网中大多数掉话都是由于频率干扰和这样或那样的基站硬件问题所导致的。
在这一节中,我们就介绍以下所遇到过的硬件问题导致的掉话,一般来说,如果硬件有问题的话,从统计结果的掉话次数和掉话率上就能比较明显的发现异常。
但是,对于话务量分布比较特殊的基站,例如:
小区覆盖范围内没有主要道路,用户移动速度较慢等情况,部分天线问题就不容易从统计结果中发现。
这就需要从路测中的每一个起呼,每一个切换过程乃至掉话现象都要从异常现象中发现问题,以专业知识和工作经验为基础,开阔思路,才能找出问题的根本原因。
这点的具体分析可以见后面的《第四章-路测中见到的典型的掉话现象》。
A.由于天馈线原因而导致的掉话
在上行方向,天线是BTS从空中接口接收信号的第一级设备,而在下行方向,它又是最后一级设备。
而且天线包含的参数也有很多,象方位角、机械下倾角、电子下倾角、波瓣宽度、空间分集接收天线距离、馈线驻波比等。
因此,可以说天线某个环节如果出现问题,对于基站性能的影响都是巨大的。
a.由于信道盘和天线接错而产生的掉话
此种情况常发生于大配置站型,由于会牵扯到跨机柜的扩展连接等问题,有时会出现整个基站2个甚至3个小区互相连错天线的情况,还有两个小区间单个载频对调错连天线的情况。
整个小区对调连错的情况比较容易发现,因为在IDLE状态或根据邻区强度仅仅测试BCCH的强度即可,但是,单个载频对接连错的情况就不容易发现了,因为只有手机占到错误信道盘时才会发现,例如场强的突然衰减等。
此时路测现象就是电平衰耗较大,同时Quality变差导致掉话。
具体现象可见§2.4一节。
b.由于两副天线俯仰角不同而产生的掉话
在基站安装过程中定向小区有可能用两副单极化收发天线,当小区的SDCCH和BCCH采用NO-COMBINEDMODE时,该小区的BCCH和SDCCH就有可能分别从两副不同的天线发出。
当两副天线的俯仰角不同时,就会造成两副天线的覆盖范围不同,当用户在某个区域中,能收到BCCH信号,但产生呼叫时却因无法占用SDCCH而掉话。
c.由于天馈线方位角原因而产生的掉话
在基站安装过程中每个定向小区可能会有两副单极化天线,当两副天线的方位角不同时就会形成如图8中A和C所示小区。
在A小区中的用户可以收到控制信号SDCCH,但用户一旦被指定为由另一副天线发射出的TCH时就会造成掉话。
在C小区中的用户将无法收到BCCH信号。
图8同小区天馈线方位角不同
d.由于天馈线自身原因而产生的掉话。
天馈线损伤、进水、打折和接头处接触不良,均会降低发射功率和收信灵敏度,从而产生严重的掉话。
通常我们仅仅从OMC-R的统计中看小区天线的PathBalance是不能完全反映实际天线情况的,这时应该对怀疑有问题的天线进行核查,排除这方面的故障。
e.由于两副天线之间的距离原因而产生的掉话。
采用空间分集的小区两副天线之间应保持一定的水平距离以实现分集接收,否则将会降低收信灵敏度产生掉话。
两副天线之间的水平距离(经验值)应为垂直距离的十分之一,至少应大于3m。
B.由于信道盘故障引起掉话
信道盘故障包括CTU自身数字模块出现故障和各信道盘未作Calibration。
如果在路测中遇到原因不明的通话质量差造成掉话的现象,应该通过OMC-R提出该小区以及该载频的RF_LOSS统计,加以验证是CTU的硬件问题。
如果在路测中发现起呼占上TCH后信号衰减严重造成掉话,应该从各信道盘功率是否未调平入手考虑。
注:
在远端登录,观察基站Calibration
用Telnet等方式接入基站,可以使用disp_cal_data
命令通过offset值来看各个载频功率是否调平。
C.由于时钟失锁引起的掉话
时钟失锁的原因有很多,比如传输2M中的时钟不稳、基站MSI板子出现问题、GCLK出现问题等。
但影响到Um接口路测的现象没有什么不同。
理论上,时钟失锁会影响到起呼和切换的正常进行。
在实际情况中,时钟的漂移对于起呼的影响是微弱的,通常对于切换的影响是巨大的。
往往由于目标小区或服务小区时钟失锁,造成切换失败,严重影响了通话质量和掉话率。
所以,由于时钟问题造成的掉话,也可以归结为切换掉话的范畴,我们在《路测切换失败的分析》部分中有详细介绍。
6)BSS参数设置不当
其实参数设置不当中,有很大一部分是与切换有关的。
如果不处理好切换参数,造成延迟切换或乒乓切换都对通话有很大的影响。
例如PBGTHandover的HO_Margin设置过大,就有可能造成切换较晚,有可能等到邻区强于服务小区很高电平后,才切换,也有可能由于通话质量不佳等原因触发紧急切换,这就造成了掉话隐患。
可以这样说,大多数的BSS参数设置都涉及到起呼和切换,一旦设置不当就会造成掉话隐患,如何在网络中找到最合理的参数配置就是网络优化最核心的工作,不仅是无线参数同时还要考虑有线口的需要,甚至还要考虑长途来话接通率等问题。
在这里我们仅摘出几个影响严重,但又不容易被想到的参数列出来,在一般经常调整的参数为发现异常的时候,就需要我们多深入的检查其他参数的合理性。
A.missingrepot设为enable
手机在DedicateMode下上报的MeasurementReport中所报告的服务小区的RxLev和RxQual以及Neighbor的接收电平值是系统进行平均、筛选、判决和排队过程的基础。
在这个复杂的判决过程中,会涉及到很多参数,例如Hreqave、Hreqt、n值、p值等,在motorola的小区参数里有一个参数missingreport。
简要来说,将设为enable时,系统由于种种原因没有收到手机上报的MeasurementReport的SACCH帧时,RxLev将用-110dBm代替。
这样一般情况下就会降低平均电平值,从而会影响PBGT的切换速度,有可能造成延迟切换或不切换。
从而造成掉话。
一般应把该参数设为disable,即用上一个采样值顶替该丢失帧的采样值。
B.pbgt_ho_type中参数设置过于苛刻
这也是一种延迟切换造成掉话的可能原因。
在motorola系统中可以根据覆盖环境的不同定义几种不同的PBGT算法。
其中有些算法是要设置一些计时器的,如果参数设置不够合理,设置了过长的Timer,如Type5,type6,用户走出了邻区范围还没有切换,就会拖带掉话。
其它参数设置不当也会造成拖带,例如Type3中包括上下行的Rxlev的门限,即当手机和基站对应的接受电平高于设置门限电平时才会考虑切换。
因此,需要根据实际覆盖情况进行优化参数配置,消除不当的配置所带来的负面效果。
C.设置偏大的参数hreqt*hreqave
一般来说,解出邻区的BSIC以后,且该邻区为上报的最好的六个邻区内,系统才会对其是否切换进行判决。
hreqt*hreqave又被称为Warmtime,即系统对该小区进行判决的第一个测量报告开始算起至少经过Warmtime的时长后才会进行切换。
D.没有用OMC-RProxyCell广播externalneighbor信息
此种情况出现在跨OMC的externalneighbor在进行了BSIC或BCCH的改变之后,但未在其他OMC上进行改动,结果数据库不一致,造成无法切换,继而拖带掉话。
E.允许的网络色码(NCCPERMITTED)参数设置不当导致掉话
允许的网络色码参数定义了移动台需测量的小区的NCC码的集合,为手机切换提供可行的目标小区。
我们知道BSIC=8*NCC+BCC,实际上NCC、BCC在帧结构中各为3bit的数据,因此NCC的取值范围为0~7。
在小区里可以设置NCCPERMITTED参数来限制小区的切换目标小区和重选小区。
如果该数据定义错误将引起越区切换不成功和小区重选失败,产生掉话。
7)切换掉话
理论上任何一种切换失败都有可能造成切换掉话,因此可参照切换失败的分析。
图9为Intra_bsshandover为例:
当切换失败后,手机向源小区发送HandoverFailure消息,若由于各种原因造成源小区未收到该消息,从而造成T3103超时,这时BSS的ho_lostms计数器就会加1,记做一次切换掉话。
图9切换掉话示意图
8)手机问题
在日常路测工作中,我们使用的测试设备的手机前端一般都是有别于商业用机的。
这些测试手机功能更强大,软硬件上都有新的设计,使得它们可以满足测试的需求。
但是我们发现测试手机因为装载了测试软件后,要求的处理能力更高,要求在通话的基础上还要进行与测试软件相呼应的动作,如果由于硬件老化等原因,就可能造成死机、解码错误等现象,从而影响测试结果,如果测试人员不能发现手机问题,还会造成对异常现象的错误判断。
下面这个实例就是通过几次异常的掉话情况查找出来的手机故障引起掉话的问题。
实例TEMS888不切换掉话
我们曾在DT测试中发现了几次通话过程