CSFB问题排查手册 上册Word文档格式.docx
《CSFB问题排查手册 上册Word文档格式.docx》由会员分享,可在线阅读,更多相关《CSFB问题排查手册 上册Word文档格式.docx(16页珍藏版)》请在冰豆网上搜索。
某市路测时,偶尔有被叫CSFB手机失败现象,从终端LoG发现,被叫失败是由于回落跨MSCPool造成,且呼叫失败前的TAUAccept中的TAList包含了分属不同TAList的TAC。
2.问题分析
测试区域TA、LA规划如下图所示,其中BSC006的LA为22548,BSC103的LA为22552,BSC177的LA为22457;
MME将TAC50配置在TAList1中,TAC51和52配置在TAList3中,且TAList和LA映射关系为TAList1对应LA22552,TAList3对应LA22548。
测试时终端在正确的TAC50小区进行电话拨打,TAC50属于TAList1,映射的LA为22552,终端挂机后需要返回LTE小区,由于无线信号漂移等原因,终端返回LTE时接入的LTE小区属于TAC51/TAC52,这两个TAC均属于TAList2,映射的LA为22548。
从终端侧LoG发现,终端返回LTE时的TAUAccept消息中的TAList不但有TAC51/TAC52,还包含了之前所在的LastVisitedTA,即TAC50。
当终端再次重选回到TAC50下的小区进行拨打测试时,因对于终端而言TAC50在TAList中,因此不会重新执行TAU,此时映射的LA仍为22548,但是在TAC50LTE小区下发的GSM频点对应小区LA为22552,故形成跨MSCPool场景,因此被叫失败。
图测试区域TAC与TAList分布示意图
因此,本案例中CSFB被叫失败,是由于4G网络MME将UE的LastVisitedTA加入到给UE下发的TAList中,导致UE再次移动到LastVisitedTA区域时不会发起TAU请求,也就无法更新终端联合附着/位置更新的LA以及对应的MSC,从而导致跨MSCPool回落,被叫失败。
3.问题分类:
核心网设备实现
4.解决方案
根据3GPP协议,引入CSFB后,TAList尽量不要跨多个LA区域,而MME设备将UELastVisitedTA加入到TAList中的方式,会造成TAList跨多个LA区域,从而可能导致回落跨MSCPool。
因此,通过规范MME实现,即不将UE的LastVisitedTA加入TAList,从而避免本案例问题再次发生。
5.效果评估
升级MME版本,通过软参配置方式关闭LastVisitedTA加入TAList功能。
之后的测试过程中,未发生因TAList跨多个LA导致回落跨MSCPool,导致被叫失败案例发生。
案例8:
回落至GSM后,鉴权失败
现象1:
HZ外场,使用诺西USIM卡,回落2G建立语音业务,会出现第一次鉴权失败,第二次鉴权才成功的现象
现象2:
QD外场,4G网络使用46008网号,主叫回落后,终端不发起CMservicerequest,无法发起CSFB呼叫
HZ外场:
在跨LA场景中,回落过程中需要进行LAU。
测试发现呼叫总是有鉴权失败的场景,经分析发现CSFB主叫侧100%成功,但CSFB被叫侧100%失败。
后分析因呼叫流程不同,导致鉴权的场景不同,最终导致鉴权的失败、之后的重同步过程。
USIM卡可以根据网络侧下发的鉴权参数(RAND、AUTN)计算出网络下发的SQN,其中SQN=SEQ||IND,与终端中存储的SQNMS做比较,验证时以IND做为索引值,即新收到的SEQ只与SEQMS(IND)进行比较,若超出其允许的范围将返回鉴权失败消息。
比较的关键是:
L和Δ。
●L表示USIM允许的可接受序列号的最大寿命,即新接收到的SQN和SQNMS之间的最大允许数值差,要求SEQ>
SEQMS–L。
●Δ表示USIM可接受的序列号跳跃的最大值,即USIM只接受满足条件SEQ-SEQMS≤D的SQN。
怀疑卡商提供的卡和厂家提供的HLR/HSS/AuC中数据不一致,或卡中参数设置有问题,问题交给厂家和卡商共同研究和解决。
QD外场:
QD外场有2个特点:
1)4G网络与2/3G网络广播使用不同的网号:
4G为46008,2/3G为46000。
2)4GHSS/AuC与2/3GHLR/AuC分设,用户的鉴权数据同时存储与2/3GHLR/AuC和4GHSS/AuC中。
终端在4G鉴权成功且联合注册成功,但是主叫回落后,终端无法发起CMservicerequest消息。
经分析UE侧log发现终端在2/3G网络鉴权总是失败,2/3G网络对应的网络46000已经在终端侧为roamingnotallowed网络,但4G网络依然可以接入。
经分析,认为测试用USIM卡的鉴权参数与2/3GHLR/AuC中的设置应该不一致,导致2/3G网络的鉴权失败,在网络侧发起Authenticationreject消息后UE会自动将网络设置为禁止,因为2/3G使用与4G不同的网络号,所以依然可以接入4G网络。
需要卡商、设备厂商和省公司共同检查核对USIM卡和HLR/AuC中的参数设置。
核心网参数设置
卡商认为是旧COS中,Delta和L值设置与HLR/HSS/AuC中不同,造成同步失败无法登录网络。
重新做卡后,问题基本得到解决。
卡商定位为USIM卡中R值与现网HLR/AuC中R值不符,但是与HSS/AuC中R值相符。
为了修改R值,与现网HLR/AuC中一致,需要重新做USIM卡,同时修改HSS/AuC的R值。
新做的USIM卡最终在2/3G网络鉴权通过,证实确为R值问题。
问题基本得到解决。
案例9:
UE在TAU流程中拨打电话导致呼叫失败
某城市外场测试过程中,4GUE拨打4GUE,L2L共拨打了60次,出现8次呼叫不成功,主叫在20s-30s左右的时延后听到“被叫无法接通”的录音通知。
检查终端侧和网络侧MME跟踪和记录的log,发现
(1)在快速拨打的过程中,因TA-LA匹配,终端在呼叫前没有发起LAU流程,因此SGs接口状态在MSC依然保持为associated;
挂机后,终端支持自主快速返回功能,在UE返回LTE网络过程中,被拨打当被叫时,MSC依然会在SGs接口下发寻呼消息
(2)虽然用户在MME状态设置为悬挂,但MME依然在空口下发寻呼
(3)UE返回LTE网络,尚未发起TAU流程,但看到空口的寻呼消息后,会立即发起寻呼响应消息
(4)接收到UE的寻呼响应消息后,MME给MSC返回SGs-ServiceRequest消息。
但MME因UE尚在悬挂状态,立即给UE返回ServiceReject消息,同时给MSC发送SGs-IMSI-detach消息
(5)因为接收到ServiceReject,UE发起Attachrequest消息
(6)接收到Attach消息后,MME在SGs接口发送SGs-LAUrequest消息
(7)MSC因为内部实现的bug,会一直悬挂入呼叫,直至超时(大约20s)释放呼叫
从问题分析中可看出,MME在用户悬挂状态时寻呼了用户,之后又因用户悬挂状态拒绝用户的寻呼响应,并先后给MSC返回SGs-ServiceRequest和SGs-IMSI-detach消息,导致MSC内部的bug被激活,处理异常。
在此场景下,有两种可能的实现方式
方式1)因用户悬挂,MME直接给MSC返回SGsAP-UE-UNREACHABLE消息,这样的话,本次呼叫失败,因为寻呼无响应,但MSC中用户SGs接口和状态都不会被修改,不影响下次呼叫
方式2)MME依然在S1接口寻呼用户,增加LTE网络寻呼量,寻呼后可能失败,也可能寻呼成功。
若用户返回寻呼响应,MME正常处理后续呼叫,呼叫正常。
两种实现方式均可,各有优缺点,需商讨。
后续,建议在外场测试时验证各厂商的实现方式,并商讨决策。
三“CSFB手机挂机返回LTE异常”的原因及案例分析
3.1原因分析
目前,CSFB返回方案采用两种并行的方案:
终端自主返回和2G->
3G->
4G桥接返回方案。
部分城市区域还采用第三种方案:
2G->
4G返回方案。
终端自主返回功能需要芯片支持,具体实现与厂家芯片实现相关,自主返回失败因素与LTE无线信号覆盖、挂机区域频点是否已被终端记忆有关。
当终端自主返回失败后,终端将在2G驻留。
若2G配置4G邻区,则由2G通过小区重选返回4G;
若2G未配置4G邻区,则通过3G桥接返回4G。
4G桥接返回和2G->
4G过程与数据业务互操作流程相同,相关影响因素与数据业务互操作类似,可参见《LTE与TD-SCDMA数据业务互操作性能影响因素分析》案例库;
除此之外,因CSFB流程造成的重选返回失败因素主要为LTE网络侧定时器超时导致隐式detach,导致TAU失败。
部分特殊终端及国漫入终端不支持终端自主返回功能,CSFB通话挂机后将在2G驻留。
若该终端也不支持TD-S模式,且2G又未配置4G邻区,则该终端将不能返回4G驻留;
若终端支持TD-S模式,将根据2G是否配置了4G邻区,选择2G->
4G桥接方式或2G->
4G方式返回方式。
通常情况,回落2G网络,通话过程中不能进行数据业务,挂机后
●若终端通过自主快速返回方式返回4G,可在LTE发起TAU并恢复数据业务
●若终端自主返回失败,将驻留2G网络并尝试恢复数据业务,连接态时:
◇可通过NC0方式返回3G(需终端支持),
◇若3G网络支持到4G连接态重定向,可返回4G继续数据业务
◇若否,终端需待数据业务完成进入空闲态后,通过小区重选2G->
4G方式返回4G(需2G配置4G邻区)
●特殊场景,若终端回落3G网络,通话过程中能够并行进行数据业务,挂机后终端将驻留在3G,返回4G行为与上面相同
3.2案例分析
案例1:
挂机区域LTE弱覆盖,导致终端自主返回失败
LTE弱覆盖区,CSFB手机通话后挂机,不能通过终端自主返回功能返回4G网络。
终端自主返回时,需LTE信号RSRP满足开机驻留门限(一般设置为-120dBm~-124dBm)才能接入4G网络,在LTE弱覆盖区,4G信号低于开机驻留门限,终端自主返回将失败,此后终端将返回2G网络驻留,在信号强度满足条件情况下,可通过3G桥接返回4G网络。
网络覆盖条件
通过网络建设及网络优化,提升4G网络覆盖质量,避免覆盖空洞,提高终端自主返回成功率。
在LTE典型强覆盖区域,终端自主返回成功率较高,用户体验较好。
案例2:
挂机区域频点与起呼区域不同,导致终端自主返回失败
某芯片CSFB手机,在室外D频段起呼,在室内E频段挂机,挂机后不能通过终端自主返回功能返回4G网络。
本案例问题与芯片实现相关,其终端自主返回方案为挂机搜索曾经记忆的LTE频点,如果挂机区域频点未曾记忆,则不能自主返回4G网络,此后UE将永久记忆这一频点,并且关机也不消除。
测试时,UE从未在E频段频点驻留,当在室外起呼室内挂机时,不能搜索室内E频段该LTE频点,导致自主返回失败,定时器超时后(测试时设置为2s),UE驻留2G网络,此后UE记忆此E频段频点,再次在室外起呼室内挂机,终端自主返回成功。
终端实现
终端自主返回功能无需改动GSM无线网络,但存在一定失败概率。
若此芯片终端未记忆挂机区域LTE频点,终端自主返回将失败。
但未来部署LTE频点数量最多5~6个,且终端能够永久记忆曾驻留或读取的频点,该问题对用户体验影响不会太大。
终端能够永久记忆曾驻留或读取的频点,且不随开关机取消,在LTE部署频点数量5~6个前提下,因频点未记忆导致的终端自主返回失败对用户体验有影响,但影响不会太大。
案例3:
SGSN向MME发出的PDPcontextRequest中携带GBR,导致TAU完成后,LTE网络将用户Detach
在2G电话结束后,终端通过重选返回LTE,TAU结束后,网络将用户Detach。
在2G电话结束后,终端在2/3G发起RAU,SGSN收到RAUREQ后,通过SGSNcontextrequest流程从MME侧获取用户的上下文,从消息中可以看到,MME发送给SGSNUE的GBR是0:
图MME发给SGSN的SGSNcontextResponse中UEGBR为0
但是SGSN给P-GW发起的updatePDP消息中,给UE分配的GBR是640:
图SGSN发给P-GW的UpdatePDP消息中UEGBR为640
终端通过重选返回LTETAU时,MME从SGSN获取的用户的上下文,在SGSN回给MME的SGSNContextResponse消息里,GBRUL/DL都是640:
图SGSN发给MME的SGSNContextResponse中UEGBR为640
而对于defaultbearer,GBR应该为0,所以MME检查到用户的上下文不合法,从而发起Detach流程,将UE去附着。
SGSN更新版本,对于默认承载的GBR值不做修改。
SGSN更新版本后,案例中出现问题未复现。
案例4:
SGSN关闭根据UE能力选择锚点功能,导致TAU失败
终端从2G重选返回到4G时,出现概率性TAU失败,需在4G重新Attach后成功接入,导致重选到4G的时延较长。
因BOSS计费改造进度原因,SGSN临时关掉根据UE能力选择功能,所以当用户在SGSN下一旦发起PDP激活,SGSN将会把该用户选择到现网GGSN。
然后当用户重选到4G做TAU时,MME从SGSN获取该用户的上下文,其中包含UE所在的网关IP地址,并发起承载建立,这里获取的IP地址实际是GGSN的地址,而MME发起承载建立时需要向SAE-GW发起。
但是现网GGSN不支持P-GW功能,导致承载建立失败,TAU拒绝;
用户需要在4G重新Attach后成功接入。
如果UE初始接入在4G,由于P-GW支持GGSN功能,用户在系统间来回移动时,网关永远是融合节点,不管TAU还是RAU都不会失败。
网络改造进度
该问题出现时是由于全国BOSS未改造完毕,有计费漏洞,所以部分省份将SGSN根据UE能力选择功能临时关掉。
所以一旦BOSS改造完毕,同时将该功能打开,这个问题将不复存在。
在BOSS改造完成前,有下面几个临时方案:
方案一:
SGSN根据IMSI/MSISDN号段区分出LTE签约用户,并将其锚定到P-GW,其余用户仍锚定到GGSN。
具体实施时:
①SGSN可以根据其中静态配置的号段选择网关;
②也可以通过在DNS中指定不同号段的不同网关地址后,SGSN通过重构APN的方式扩展DNS查询消息,获取合适的网关,将非LTE用户路由到GGSN;
方案二:
对LTE用户增加ARD的签约信息,SGSN根据UE能力和ARD签约信息选择合适的网关,将非LTE用户路由到GGSN。
该方案涉及到HLR的改造,不建议使用。
待核心网改造完毕即可解决。
案例5:
QoS修改时MME第一次Paging无响应,导致网络DetachUE
终端返回4G,TAU流程结束后,网络发起寻呼,一次寻呼失败后网络就发起了detach流程。
终端回落到GSM后,通话结束后快速返回LTE失败,因此在2G/3G网络发起RAU流程,之后返回4G发起TAU流程,因TAUREQ消息中activeflag=0,TAU流程结束后MME立即发起S1释放流程,终端进入空闲态。
之后,MME发现该用户在LTE的QoS签约比该用户在2/3G网络实际使用的QoS高,MME发起QoS更新流程,由于UE已经处于空闲态,所以MME首先发起paging流程。
图为修改Qos,MME发起Paging流程
第一次Paging时,恰好UE此时(同1秒时刻)在同频切换(跨TAlist触发TAU),导致终端无法收到该Paging。
图第一次Paging时,UE同时进行同频切换
MME在一次Paing无响应的情况下,就给S-GW回UpdateBearerResponse,携带UEnotresponding原因,导致网络主动发起detach流程,将UE去激活。
图MME在一次Paging无响应后,发给S-GW的UpdateBearerResponse
3.解决方案:
MME更新实现方式,只有在多次寻呼均失败时,才可以给SAEGW回UpdateBearerResponse。
仅在多次寻呼失败,确实异常时网络才会将用户去附着。
案例6:
SGSN未配置4GEPLMN导致UE无法返回4G
CSFB手机(测试时不支持终端自主返回功能)在2G挂机后通过小区重选返回LTE失败,原因是MSC下发的EPLMNlist(46008)无效
测试区域2GPLMNID为46000,4GPLMNID为46008。
CSFB手机挂机后,因暂不支持终端自主返回功能,驻留2G网络,依次进行LAU和RAU过程,之后通过小区重选返回4G网络。
由于MSC配置了EPLMN,2G网络在LAUAccept消息中下发的EPLMNlist中包含46008,如下图:
--有46008的EPLMN
但SGSN未配置EPLMN,因此在RAUAccept消息中下发的EPLMN中不包含46008,如下图:
--没有携带EPLMN
UE仅能根据最后一次LAU或RAUAccept获得的EPLMN刷新并保存EPLMNlist,因此RAU流程后刷新EPLMNlist,删除了LAUAccept时下发的EPLMNlist,4GPLMNID46008不在UE的EPLMNlist中。
当终端小区重选返回4G时,因4GPLMN与UE的RPLMN不同,且不在UE的EPLMNlist中,重选4G网络失败。
核心网参数配置
SGSN配置4GPLMNID为EPLMN,从而在RAUAccept消息的EPLMNlist中携带4GPLMNID,使得UE能够返回后成功接入4G。
SGSN配置4GPLMNID为EPLMN后,CSFB手机能够正常从2G重选返回4G。
四“CSFB呼叫建立时延异常”的原因及案例分析
4.1原因分析
CSFB呼叫建立时延是CSFB用户体验的重要部分,因CSFB额外引入流程将在GSM现网呼叫建立时延基础上增加时延。
在网络部署成熟时,CSFB呼叫建立时延应趋于稳定,但在部署过程中,CSFB呼叫建立时延可能存在过短或者过长等异常情况。
在网络部署CSFBR8重定向回落方案(终端支持缓读SI13功能)时,通过五城市联合测试摸索到CSFB呼叫建立时延范围如下:
●CSFB单端呼叫(CSFBUE拨打GSMUE或者GSMUE拨打CSFBUE):
◇额外时延:
相比GSM现网基准时延,额外时延约1.7~2.9s,且80%的呼叫增加时延在2.5秒以内
◇总时延:
单端总时延为6.9~12.3s,其中85%在7s和10s之间
●CSFB双端呼叫(CSFBUE拨打CSFBUE):
相比GSM现网基准时延,额外时延约3.5~4.9s,且80%的呼叫增加时延在4.5秒以内
单端总时延为8.3~13.7s,其中90%在9s和12s之间
CSFB呼叫建立时延主要包括三个部分:
UE在LTE侧起呼/接收寻呼到收到重定向命令、UE收到重定向命令后搜索接入GSM小区并读取GSM系统广播、建立GSM通话等,下面将详细介绍每个部分时延的影响因素。
1、UE在LTE侧起呼/接收寻呼到收到重定向命令
本阶段对时延的影响主要因素包括MSC开启EarlyAlerting/ACM功能、eNodeB开启基于测量的重定向功能、LTE侧二次寻呼等。
(1)MSC开启EarlyAlerting/ACM功能
MSC开启EarlyAlerting/ACM功能是指MSC在收到MME的寻呼响应后即给主叫用户放回铃音,将导致主叫呼叫建立时延过短,但会对网管指标统计及主叫用户体验产生影响。
(2)eNodeB开启基于测量的重定向功能
eNodeB开启基于测量重定向功能后,eNodeB需给UE下发测量控制消息,并根据UE测量报告中GSM频点情况下发重定向命令,UE连接态测量异系统频点时延较长,会额外增加CSFB呼叫建立时延。
通常情况下,为保证CSFB时延,eNodeB开启盲重定向即可。
(3)LTE侧二次寻呼
因LTE侧无线信号弱等因素,存在二次寻呼概率,将增加CSFB呼叫建立时延。
2、UE收到重定向命令后搜索接入GSM小区并读取GSM系统广播
本阶段对时延的影响因素包括重定向命令中配置的GSM频点不合理导致UE搜索GSM小区时延过长。
3、建立GSM通话
本阶段对时延的影响因素包括GSM网络索要IMEI、BSC开启UTRANECSC功能等。
针对CSFBUE的通话建立过程,网络可以有优化方案以减小呼叫建立时延。
4.2案例分析
SGsMSC开启earlyAlerting或ACM,导致呼叫建立时延过短
CSFB手机拨打CSFB手机时,呼叫建立时延仅为6~7s,比正常时延11~13s短5~6s。
根据3GPP协议,若被叫用户位于LTE网络,LTE寻呼响应后,若用户为连接态,MSC必须立即给主叫侧返回Alerting或ACM消息,MSC就给主叫用户发送Alerting并放音(如果配置了放音文件的话),因此,主叫侧呼叫建立时延仅为6~7s。
部分厂家根据协议实现了此EarlyAlerting功能,具