精品剖析VoLTE掉话参数提升用户体验.docx
《精品剖析VoLTE掉话参数提升用户体验.docx》由会员分享,可在线阅读,更多相关《精品剖析VoLTE掉话参数提升用户体验.docx(32页珍藏版)》请在冰点文库上搜索。
精品剖析VoLTE掉话参数提升用户体验
剖析VoLTE掉话参数提升用户体验
剖析VoLTE掉话参数提升用户体验
【摘要】VoLTE具有接续时延低、视听效果高清、频谱利用率高、容量大、业务灵活等特点,但随着用户持续上涨,网络问题也不断显现,用户感知劣化、投诉等问题严重影响了VoLTE的口碑,而相对其它网络问题,VoLTE掉话对用户感知影响更明显的影响。
本文就VoLTE的掉话机制,对不同掉话首拆网元及过程深入分析、针对性从VoLTE掉话机制相关的无线链路失败掉话定时器、切换掉话定时器、CCE容量配置参数、多目标RRC重建功能参数、专载延迟释放功能参数的研究,通过大量试验,进行参数归一化,提升用户感知,以支撑VoLTE业务的蓬勃发展与推广。
【关键字】VoLTE,掉话,参数研究
一、概述
当前正处于互联网迅猛发展的时代,在线视频、文件传输和交互服务的广泛使用,VoLTE业务的蓬勃发展不言而喻,截止目前,江苏电信VoLTE活跃用户430万左右,呼叫总流量达到1041.58GB,用户的不断增长,也导致了用户感知劣化、投诉等问题的严重化,为更好的保障VoLTE的商用推广,提升用户感知质量是优化工作的重要环节,而掉话是直接反应用户感知质量状态的重要指标,减少掉话成为VoLTE研究的重要课题;
研究从本质出发,以VoLTE语音业务中的掉话机制为基础,对终端、基站、EPC域、IMS域不同的掉话首拆网元和过程的细化分析,梳理相关掉话触发机制和条件,针对性的对在掉话触发机制、条件以及增强鲁棒性方面进行深入研究,通过试验对相关无线链路失败掉话定时器、切换掉话定时器、CCE容量配置参数、多目标RRC重建功能参数、专载延迟释放功能参数进行归一化推广,减少掉话几率,提升用户感知。
二、VoLTE掉话机制
VoLTE业务会经过多个网元,每个网元都有通话异常检测机制,当各网元检测到异常的时候,都有可能触发VoLTE掉话。
网元一旦检测到异常并触发VoLTE掉话后,掉话的信令会经过多个网元层层传递下去,以便其他网元去释放为VoLTE通话而预留的资源和相关配置,比如MME和eNB会释放已建立的承载资源。
VoLTE掉话分析的重点是找到第一拆线点,也就是首先检测到通话异常的网元。
1
2
2.1VoLTE掉话场景
2.1.1终端侧触发掉话
终端侧触发的Bye消息流程如下:
参考协议24.229,终端侧触发的Bye消息原因值如下,只有第一种是正常挂断,其它都是异常挂断。
Protocolvalue
Causevalue
Reason-text
RELEASE_CAUSE
1
Userendscall
RELEASE_CAUSE
2
RTP/RTCPtime-out
RELEASE_CAUSE
3
Mediabearerloss
RELEASE_CAUSE
4
SIPtimeout-noACK
RELEASE_CAUSE
5
SIPresponsetime-out
RELEASE_CAUSE
6
Call-setuptime-out
2.1.2基站侧触发掉话流程
基站触发的上下文释放或承载释放流程如下:
基站触发的承载释放流程
2.1.3EPC侧触发掉话流程
上文中的场景③和④都属于EPC侧掉话,包括MME和PCRF触发掉话的信令流程。
MME触发的上下文释放和承载释放流程如下:
MME触发的上下文释放流程
MME触发的承载释放流程
参考协议36.413,上下文释放与承载释放的原因值一共五大类:
RadioNetworkLayercause、TransportLayercause、NAScause、Protocolcause、Miscellaneouscause,每大类都有各自的小类。
常见的大类原因是RadioNetworkLayercause,其中常见的异常小类原因是:
FailureintheRadioInterfaceProcedure、RadioConnectionWithUELost、Radioresourcesnotavailable。
对于RadioConnectionWithUELost原因,一般为无线链路失败;FailureintheRadioInterfaceProcedure可能的原因是RRC配置失败或者切换失败;Radioresourcesnotavailable一般是无线资源不足,包括PRB资源与CCE资源都有可能。
PCRF触发的ASR(AbortSessionRequest)消息流程如下:
参考协议29.214,PCRF触发的ASR(AbortSessionRequest)消息原因值主要是下面4种,其中原因值0和3是正常释放,原因值1和2都是异常释放,异常释放的常见原因是资源不足和承载资源不足。
Abort-Cause
Meaning
BEARER_RELEASED(0)
Thisvalueisusedwhenthebearerhasbeendeactivatedasaresultfromnormalsignallinghandling
INSUFFICIENT_SERVER_RESOURCES
(1)
Thisvalueisusedtoindicatethattheserverisoverloadedandneedstoabortthesession.
INSUFFICIENT_BEARER_RESOURCES
(2)
Thisvalueisusedwhenthebearerhasbeendeactivatedduetoinsufficientbearerresourcesatatransportgateway(e.g.GGSNforGPRS).
PS_TO_CS_HANDOVER(3)
ThisvalueisusedwhenthebearerhasbeendeactivatedduetoPStoCShandover.
2.1.4IMS域触发掉话流程
IMS域网元P-SBC和S-CSCF间发送的Bye消息流程(包含异常原因值)触发掉话的流程如下:
P-SBC发送的Bye消息流程
S-CSCF发送的Bye消息流程
参见协议24.229,P-SBC或者S-CSCF发送的Bye消息常见的异常值是503(ServiceUnavailable)和488(NotAcceptableHere),一般情况下无线资源不足或者承载资源都产生的是503的原因值。
2.2无线侧掉话
终端或基站原因导致基站异常释放VoLTE业务UE的上下文或承载,都称为无线侧掉话,对应上文中的场景①和②。
2.2.1承载异常释放
承载异常释放导致掉话包括QCI1和QCI5的异常释放。
触发QC1异常释放的事件主要有:
“GTP-U错误指示”、“E-RAB抢占”、“GBR拥塞触发的承载释放”,QCI5的异常释放的事件主要有“RLC重传次数达到最大”等。
2.2.2上下文异常释放
基站内部对多种无线链路进行监控,比如:
PUSCH无线链路检测、CQI无线链路检测、HARQ无线链路检测、TA失步以及RLC达到最大重传次数,对于PUSCH无线链路检测、CQI无线链路检测以及HARQ无线链路检测前面三种。
当基站检测到无线链路失败后启动无线链路失败定时器,如果在定时器超时后无线链路没有恢复就会产生掉话。
对于TA失步以及RLC达到最大重传次数这两种情况,基站会发起小区内切换,如果切换失败,就会产生掉话。
基站无线链路检测机制及触发掉话流程示意如下:
满足掉话触发条件后,基站发起UE的上下文释放以及RRC释放,释放的原因值是“RNLCauseRadioConnectionwithUELost”。
导致无线链路失败的常见原因是信号差或者干扰严重。
无线链路释放流程:
2.2.3无线侧相关定时器和常量
2.2.4无线侧相关参数
无线侧和VoLTE掉话相关的主要参数如下:
厂家
参数英文名
参数中文名
功能描述
诺基亚
gtpuPathSupint
GTPECHOREQUESTs发送的间隔
用来检测GPS隧道的状态,间隔的发送GTPECHOREQUESTs
诺基亚
gtpuT3Resp
GTPECHOREQUESTs的等待时长
GTPECHOREQUESTs的等待时长,如果超时等待时间没有收到反馈,则认为该GTP隧道终端,触发承载的释放
诺基亚
maxNrSymPdcch
PDCCH信道最大符号数
定义PDCCH信道最大符号数配置
诺基亚
actLdPdcch
PDCCH信道占用符号数自适应开关
PDCCH占用符号数会根据CCE负荷在最小符号数和maxNrSymPdcch之间自适应,尽量降低控制信道开销。
诺基亚
maxRetxThresh
RLC最大重传次数
DRBRLC重传最大次数,超过最大次数,UE侧触发重建,基站侧触发切换
诺基亚
maxRetxThreshSrbDL
下行SRBRLC最大重传次数
下行SRBRLC重传最大次数,超过最大次数,基站侧触发小区内切换
诺基亚
maxRetxThreshSrbUL
上行SRBRLC最大重传次数
上行SRBRLC重传最大次数,超过最大次数,UE侧触发重建
诺基亚
nCqiDtx
CQIDTX检测次数
如果没有检测到的CQI超过该次数,则触发无线链路
诺基亚
nCqiRec
CQIDTX恢复次数
如果没有检测到的CQI超过该次数,则链路恢复
诺基亚
taTimerMargin
周期性TA发送的间隔
如果达到了TA发送的间隔,则基站给终端发送TA命令
诺基亚
taTimer
Ta超时时长
如果在TA超时后,终端还没有收到TA命令,那么终端就进入失败状态
诺基亚
taMaxOffset
TA允许的最大偏移
如果基站检测到终端的TA超过这个最大的偏移,则立马发送TA命令给终端
诺基亚
tHalfRrcCon
RRC建立保持时长
等待RRC建立完成的时长,超时后释放UE上下文
2.3EPC侧掉话
上文中的场景③和④都属于EPC侧掉话。
如果因专用承载丢失、去激活承载消息未收到、EPC下发DetachRequest,需要跟踪MME、S/PGW、PCRF各网元的信令,查找EPC参数及设备问题原因。
如果SIP消息异常,如BYE/200OK未收到或流程异常,则需要在eNB、EPC、IMS上同步抓取信令和数据包,检查消息在哪些网元之间出现异常,并针对相关网元进行问题排查。
2.4IMS域掉话
IMS域掉话通常有以下两种原因:
•RTP检测定时器超时;当IMS域的SBC设备(P-CSCF)检测到通话中无媒体流的时间大于媒体流中断定时器,向终端和核心网设备发送BYE消息,产生掉话。
现网配置为双向检测,时长60S,即主叫和被叫在60s内均没有向SBC发送没有任何RTP包,SBC设备会向终端和核心网设备发送BYE消息,释放媒体会话资源,产生掉话。
•IMS注册失败;通话过程中,终端重新进行IMS域的注册,如果IMS域回复P-CSCF拒绝了用户的注册信息导致被叫未注册成功,将导致掉话。
2.5VoLTE掉话指标定义
2.5.1网管指标
VoLTE掉线率公式如下:
E-RAB掉线率(QCI1)=E-RAB异常释放次数(QCI1)/(QCI1E-RAB释放总次数(QCI1))×100%=(M8006C176)/(M8006C266+M8006C273+M8006C89+M8006C98+M8006C107+M8006C116+M8006C278)×100%
VoLTE掉线率counter说明:
计数器ID
计数器名称
计数器解释
M8006C107
EPCinitiatedEPSBearerReleaserequestsperQCI1duetoRadioNetworkLayercause
EPC触发的因为无线网络原因引起的释放
M8006C116
EPCinitiatedEPSBearerReleaserequestsforQCI1duetoOthercauses
EPC触发的其它原因引起的QCI1引起的释放
M8006C176
ReleasedactiveERABsQCI1
激活状态的QCI1的异常释放,包含所有原因
M8006C266
TotalnumberofreleasedQCI1E-RABsinitiatedbytheeNB
基站触发的QCI1释放总和
M8006C273
QCI1E-RABsreleasedduetopartialHandover
部分ERAB成功切换但QCI1ERAB被释放的次数
M8006C278
EPCinitiatedQCI1E-RABreleasesduetoPathSwitch
EPC触发的路径切换引起的QCI1释放
M8006C89
EPCinitiatedEPSBearerReleaserequestsforQCI1duetoNormalreleasebyUE
EPC触发QCI1的"NASNormalrelease"
M8006C98
EPCinitiatedEPSBearerReleaserequestsforQCI1duetoDetachprocedurebyUEorMME
EPC触发的因为UE或者MME发起取激活引起的QCI1释放
2.5.2路测指标
DT/CQT语音掉话率指标定义:
掉话次数与呼叫建立成功次数的比值。
主叫或被叫主动挂机但未收到SIP_BYE-OK,均计一次掉话。
如下图通话过程中,由于邻区漏配,导致终端没有触发切换,然后出现无线链路失败,引发重建,重建被拒绝,最后导致了因为无线链路失败引起的掉话,主叫与被叫在掉话前都没有发送SIP_BAY-OK消息(掉话前SIP-BAY也没有发送),记为掉话。
2.5.3感知平台指标
感知掉话着眼于最影响用户感知的实际掉话场景,涵盖率多种掉话场景,更贴近用户通话的真实感知。
感知掉话的数据源有Mw、S1-MME和Rx接口,关联的消息分别是:
•Mw接口BYE消息,携带异常原因值;
•S1-MME接口UEContextRelease和eRABRelease流程消息,携带特殊原因值;
•Rx接口AbortSessionRequest消息,携带特殊原因值。
判断造成通话异常结束的首拆接口和消息,再根据失败消息的原因值分为以下四种掉话类型:
•无线掉话:
S1-MME,消息为UEContextReleaseRequest(特殊cause)
•承载失败:
S1-MME,消息为eRABReleaseCommand(特殊cause)、eRABRELEASEINDICATION
•VoLTE掉话:
Rx接口,消息为ASR(特殊cause)
•异常掉线:
S1-MME,消息为UECONTEXTRELEASECOMMAND(特殊cause)、Mw接口,消息为BYE(特殊cause)
根据以上四种掉话类型,总结出感知掉话的指标定义如下:
VoLTE语音感知掉话率=VoLTE语音掉话次数/(VoLTE语音始呼应答次数+VoLTE语音终呼应答次数)
VoLTE视频感知掉话率=VoLTE视频掉话次数/(VoLTE视频始呼应答次数+VoLTE视频终呼应答次数)VoLTE
VoLTE语音感知掉话次数:
VoLTE语音呼叫无线掉话、承载失败、异常释放和VoLTE掉话次数之和。
VoLTE视频感知掉话次数:
VoLTE视频呼叫无线掉话、承载失败、异常释放和VoLTE掉话次数之和。
另外根据首拆接口网元,可以判断掉话是由本端还是对端造成的,在感知掉话中,由于本端IMS/EPC/无线/终端等问题导致的掉话,记为本端掉话;由于对端网络原因造成的掉话,记为对端掉话。
根据对端号码的类型,对端掉话分为异常释放-电信/移动/联通掉话。
本端掉话:
包含无线掉话、承载失败、VoLTE掉话、异常释放(MME异常释放、无线异常释放)。
对端掉话:
包含MGCF首拆的异常释放。
感知平台“VoLTE感知掉话分析”模块界面
2.5.4各平台VoLTE掉话率统计方式比较
感知掉话和网管VoLTE语音掉话率的指标统计点与指标定义均不相同,相比于网管VoLTE语音掉话率,感知掉话判断掉话的接口、消息和原因值更全面,场景更丰富。
另外,网管VoLTE语音掉话与感知掉话中的“无线掉话”和“承载失败”相比,判定掉话的消息都是基站发送给MME的UEContextReleaseRequest和E-RABReleaseIndication消息,存在重复部分,无线掉话和承载失败的原因值更多,即后者包含前者。
感知掉话与网管掉话统计接口
除了无线掉话和承载失败包含更多的原因值,感知掉话还具有其他的掉话类型其中,“VoLTE掉话”(即ASR消息掉话)反映的是核心网元PCRF首拆的掉话,“异常释放”包含了MME异常释放上下文(即通话过程中MME向基站发送UEContextReleaseCommand)、终端异常释放(终端发送携带异常原因值的BYE消息)、IMS或对端异常释放(IMS网元或MGCF发送携带异常原因值的BYE消息)。
网管掉话/感知掉话共同信令采集点
感知掉话特有信令采集点
2.5.5集团双提升掉话指标说明
集团双提升考核的掉话指标“VoLTE掉话率”和网管指标定义方法一致。
VoLTE掉话率(6分)
指标定义:
VoLTE语音掉话次数占呼叫建立成功总次数的比例。
统计时段内所有LTE小区QCI=1的E-RAB异常释放次数之和与所有LTE小区QCI=1的E-RAB释放总次数之和的比值(取系统忙时数据)。
计算方法:
满分6分。
基准值0.5%,达到基准值得6分。
每高于基准值0.01pp扣0.05分,扣完为止。
数据来源:
集团LTE无线综合网管。
三、VoLTE掉话参数研究
从网络层面来看,在现有无线覆盖条件下,参数优化可以结合上文中分析的VoLTE掉话机制,进行针对性的优化,降低VoLTE掉话的风险,主要的优化参数包括掉话机制相关的无线链路失败掉话定时器、切换掉话定时器、CCE容量配置参数、多目标RRC重建功能参数、专载延迟释放功能参数等。
3
3.1无线链路相关定时器
当基站检测到任何一种无线链路问题导致的上行失步,则会启动定时器T_RLF,如果定时器超时UE仍未能恢复无线链路则基站会发起RRC拆线,记为掉话。
T_RLF定时器所定义的时长包括以下3个部分,分别对应UE从上行失步到掉话的3个过程:
T_RLF=LNCEL:
t310+LNCEL:
t311+tDeltaRLF
过程1:
T310;当UE监测到无线链路有问题,则启动T310定时器。
在接收到n311个同步指示、或触发切换流程/RRC连接重建流程时,停止T310;
过程2:
T311;T310超时后启动T311定时器,T311为UE侧控制RRC连接重建过程中UE选择一个小区过程所需的时间,期间UE执行cell-selection过程,小区选择成功后UE发送RRCConnectionReestabilshmentRequest并停止T311。
如果定时器超时,则UE变为RRC_IDLE状态;
过程3:
T311定时器超时后,eNB继续等待tDeltaRLF时长,如果UE仍然不能恢复无线链路则释放UE的上下文,记为掉话。
增大tDeltaRLF定时器可以延长基站等待无线链路恢复的时间,降低掉话。
厂家
参数英文名
参数中文名
功能描述
取值范围(单位)
缺省值
优化值
诺基亚
tDeltaRLF
false,true
0
10秒
3.2S1、X2、站内切换相关定时器
基站侧通过配置相应的定时器来控制切换过程中的UE资源保留时间,根据切换类型的不同(站内小区间切换、站间X2切换、站间S1切换)对源小区和目标小区(站内切换除外)分别设置定时器。
定时器tHOpverall在基站进行切换判决后启动,在UE向目标小区发送RRCConnectionReconfigurationComplete消息后停止,如果定时器超时,则eNB向MME发送UEContextRelease消息释放UE上下文,记为掉话
参数TX2RELOCoverall用于控制切换失败时源ENB的UE资源保留时间:
ENB主动发起T-X2RELOCoverall原因的UE上下文释放请求,造成掉话。
根据3GPPTS36.423协议,TX2RELOCoverall用于指定源eNB总体切换进程保护的最长时间,从收到目标ENB的HANDOVERREQUESTACKNOWLEDGE消息时开启,在接收到目标ENB的UEContextRelease消息时关闭,若超时则源ENB向MME发送UEContextRelease消息释放UE上下文。
该计时器可控制切换失败时源ENB的UE资源保留时间,避免资源被无效占用。
参数TX2RELOCexec用于控制切换失败时目标ENB的UE资源保留时间:
ENB主动发起TX2RELOCexec原因的UE上下文释放请求,造成掉话。
根据3GPPTS36.423协议,TX2RELOCexec用于指定目标eNB总体切换进程保护的最长时间,目标ENB发送的HANDOVERREQUESTACKNOWLEDGE消息时开启,在接收到UE向目标小区发送RRCConnectionReconfigurationComplete消息后停止,若超时则目标ENB向MME发送UEContextRelease消息释放UE上下文。
该计时器可控制切换失败时目标ENB的UE资源保留时间,~避免资源被无效占用。
厂家
参数英文名
参数中文名
功能描述
取值范围(单位)
缺省值
优化值
诺基亚
tHoOverallD
站内切换掉话定时器Delta值
ENB内切出执行
10~5000ms
20ms
2000ms
诺基亚
tX2RelocExcD
X2切换掉话定时器Delta值
ENB间X2切出执行
30~30000ms
70ms
2000ms
诺基亚
tx2RelODelta
X2切换掉话定时器Delta值
ENB间X2切出执行
30~5000ms
150ms
2000ms
诺基亚
tS1RelExecDeltL
S1切换掉话定时器Delta值
ENB间S1切出执行
50~30000ms
500ms
2000ms
诺基亚
tS1RelOvDeltL
S1切换掉话定时器Delta值
ENB间S1切出执行
50~30000ms
500ms
2000ms
3.3CCE容量配置
在LTE网络中,PDCCH(下行物理控制信道)承载特定UE的调度、资源分配信息-DCI,如下行资源分配、上行授权、PRACH接入响应、上行功率控制命令、信令消息(如系统消息、寻呼消息等)的