PS域互操作双向切换失败问题的分析解决案例Word下载.docx
《PS域互操作双向切换失败问题的分析解决案例Word下载.docx》由会员分享,可在线阅读,更多相关《PS域互操作双向切换失败问题的分析解决案例Word下载.docx(11页珍藏版)》请在冰豆网上搜索。
TD网建设是一种创新性的工作、一种革命性的工作,是运营商帮助整个产业逐渐完善、逐渐成熟的过程。
TD还存在很多需要不断完善的地方,整体网络质量还达不到2G水平,仍然有待提高。
TD/2G实现互操作对TD发展非常重要,一来可以用2G的资源和经验来建设和维护TD网路,二来可以实现“三不”(不换卡,不换号,不登记)从而大幅降低TD用户的门槛。
在TD网络的建网初期,网络不可避免地存在一定的覆盖盲区。
TD网络与GSM网络是共存互补的关系,开通2/3G互操作,利用GSM网络比较完善的网络覆盖,在TD的弱覆盖区用GSM作为过渡,是保证3G用户能够正常使用业务的重要手段。
在TD成熟期,则可以引导更多用户使用TD网络。
2/3G互操作可以让用户始终使用最好的网络。
根据集团公司的指示,广州的TD网络近期开通了2/3G互操作,并开展专项性能优化工作。
在测试中发现存在PS域双向切换完全失败的问题,这是PS域2/3G互操作中比较经典的问题,本文首次对该问题进行了准确的定位并提供了解决方案。
在各地市即将大规模建设TD网络之际,现网TD网络维护优化经验的总结显得非常重要。
本文只是抛砖引玉,希望能给2/3G互操作优化人员一些参考的价值。
2问题简述
在进行PS业务时,无论是从TD切向G网,还是从G网切向TD,均因为路由更新不成功导致互操作失败。
3问题分析及处理
3.1从无线侧分析,检查网络参数
以PS域TD切到GSM为例,切换流程如下图:
1)当UE与RNC建立连接后,RNC会向UE发送测量控制,告诉UE需要测试哪些内容,且测量数据达到怎样的门限后UE需上报测量报告。
若RNC侧打开了异系统间的切换开关,则会包括异系统间测量控制信息。
查看RNC的配置可见,已经打开了异系统间的切换开关。
2)UE在按照测量控制的要求进行测量的同时,对测量的数据进行计算,若达到门限则上报测量报告。
系统间PS域切换的门限是:
当前TD信号测量值低于绝对门限并且GSM信号测量值高于绝对门限,且这种情况持续一段时间UE上报测量报告。
3)根据广州现网的配置策略,只要UE向RNC发送测量报告,那么RNC就判决可以进行测量。
以下是现网PS域切换参数的配置情况:
当TD的信号弱于(-90-5)=-95dBm且GSM的信号强于(-95+5)=-90dBm,并且持续2560ms时,UE开始从TD网络切换到GSM网络。
这些参数是经过多次测试,对比了切换前后的无线环境,信号强度、BLER等指标,较为合理。
故不存在参数设置不当而导致弱信号切换失败的情况。
3.2结合UU口信令,进行深入分析。
以下是在测试软件Outum上抓到的UU口信令流程,如下图1、图2所示:
图1:
PS域TD向GSM切换
图2:
PS域GSM向TD切换失败
从上面的信令过程可以看出,无论是TD切到GSM,还是GSM切到TD,UE都在目标小区成功地完成了位置更新过程,并且按照规范,发起路由更新请求。
也就是说,UE成功地接入了目标小区,切换在无线上的过程是完全成功的。
对于TD向GSM切换,UE在GSM发起位置更新和路由更新,位置更新成功,但路由更新无响应,UE在T3330计时器超时后,再次发起路由更新请求,最终得到网络下发的路由更新拒绝的消息,UE进行ATTACH,在网络重新注册。
对于GSM向TD切换,UE在GSM发起位置更新和路由更新,位置更新成功,但路由更新无响应,UE再次发起路由更新请求,并最终成功,但业务中断。
对比两个过程,失败的现象是不同的。
作GSM向TD的切换做进一步分析,对比两次路由更新请求的内容,如图3、4所示:
图3:
第一次申请的详细内容
图4:
第二次申请的详细内容
对比两次申请的详细内容,可以发现,第一次有携带一条消息:
VERSIONRELEASE99,而第二次则没有。
对比TD系统内部的路由更新请求,也没有这条消息,也就是说,第二次请求与普通的TD系统内的路由更新请求的格式是一样的,再加上业务中断这一现象,说明第二次请求是UE在TD网络重新进行登记的路由更新。
也就是说,其实从TD切换到GSM,跟从GSM切换到TD是一样的,都是路由更新失败,UE在新的网络重新登记。
因此,问题定位在核心网上,路由更新失败是切换失败的原因。
3.3直击核心网,小心求证
以下是3GPP规范中PS域3G向2G切换的正常流程:
上图是3GPP协议中3G到2G的路由更新流程图,具体解释如下:
1.MS(MS处于Idle状态)或UTRAN(MS处于Cell-DCH状态或者Cell-FACH状态)决定发起分组域的系统间切换。
2.MS向新2-SGSN发起路由区更新请求(包括旧的RAI、旧的P-TMSI签名、MS的网络能力等信息),BSS在将消息送到SGSN之前将收到消息中加入新小区的CGI(包括LAC和RAC)。
3.新2-SGSN向老3-SGSN发送SGSNContextRequest消息获取MS的MM和PDP上下文。
老3-SGSN对MS的P-TMSI签名进行验证,如果SGSN不认识该MS,则会回应一个适当的错误原因。
4.如果切换之前MS处在CONNECTED状态(即正在进行数据业务时),老3-SGSN向SRNS发送SRNSContextRequest消息,SRNS收到此消息后停止向MS发送数据PDU,并将数据进行缓存,同时向老3-SGSN返回SRNSContextResponse。
5.老3-SGSN向新2-SGSN发送SGSNContextResponse,其中包含MS的MM和PDP上下文。
6.若在第3步中老3-SGSN通过P-TMSI检验出MS无效,则在这步执行安全流程,通过HLR来检验MS是否有效;
若第3步已经检验出MS有效,那么这一步不被执行。
7.新2-SGSN向老3-SGSN发送SGSNContextAcknowledge消息,通知老3-SGSN现在2-SGSN可以接受激活的PDPcontexts的相关数据PDU。
8.如果手机处于CONNECTED状态,则老3-SGSN向SRNS发送数据转发命令(DataForwardCommand)。
SRNS在收到该命令后启动数据转发定时器,SRNS发送已缓存的数据PDU到老3-SGSN。
9.老3-SGSN将GTPPDU按隧道方式传送给新2-SGSN,GTP头中的序列号不改变。
10.新2-SGSN向GGSN发送UpdatePDPContextRequest。
GGSN更新PDPcontext后返回应答UpdatePDPContextResponse。
11.新2-SGSN发送UpdateGPRSLocation消息通知HLR修改MS所在的SGSN号和地址信息。
12.HLR发送CancelLocation通知老3-SGSN删除该MS的MM和PDPContext信息。
删除后,老3-SGSN以CancelLocationAck消息应答。
13.如果MS处于CONNECTED时,老3-SGSN将向SRNC发出IuReleaseCommand消息,在第8步的数据转发定时器超时后SRNS通过IuReleaseComplete消息回应。
14.HLR发送InsertSubscriberData消息给新2-SGSN,2-SGSN将用户签约数据插入MM上下文和PDP上下文并且回应InsertSubscriberDataAck消息。
15.HLR确认修改完成,发送UpdateGPRSLocationACK消息到新2-SGSN。
16-18&
21.如果路由更新请求的类型是RA/LA时才被执行。
一般RA与LA是分开独立进行的。
19.新2-SGSN验证MS在新路由区的合法性,如果所有检查成功,新2-SGSN给用户组建MM和PDP上下文,并向MS回应一个RoutingAreaUpdateAccept消息(包括给MS分配的新P-TMSI签名)。
20.MS通过发送RoutingAreaUpdateComplete消息确认新分配的P-TMSI,并将在路由区更新发起之前所有成功发送给MS的PDU数发给新2-SGSN,从而告诉新2-SGSN要向MSForward哪些PDU数据。
22.新2-SGSN和BSS执行BSSPacketFlowContextprocedure。
以上就是3GPP协议中3G到2G路由更新的详细流程,可以看出,整个过程主要分成三部分:
1、OLDSGSN根据NEWSGSN的请求,向NEWSGSN发送用户数据;
2、ODLSGSN在收到NEWSGSN发来的SGSNCONTEXTACKNOWLEDGE消息后,将缓冲区的数据包FORWARD到新的SGSN;
3、OLDSGSN、OLDGGSN、NEWSGSN及NEWGGSN之间的UPDATEPDPCONTEXT过程。
这三个主要过程都有可能是路由更新失败的原因。
刚好TD切到GSM有routingareaupdatereject的消息,将该信令展开,可以看到拒绝的原因是网络无法获取UE的身份,如下图所示:
因此,路由更新失败的原因定位为NEWSGSN无法从OLDSGSN获取用户数据。
造成这种情况的可能原因有多种:
NEWSGSN没有发请求,发出的请求对方收不到,对方收到后无响应,对方发回的数据无法识别等等都有可能,但不管怎样,故障可以定位在SGSN之间的接口上。
通过检查核心网的数据,发现是SGSN防火墙的数据定漏。
具体情况如下:
现网中每个SGSNGn接口处都有Gn防火墙,TDSGSN在Gn改造之后也增加了防火墙。
在防火墙上必须定义规则,允许来自哪些IP地址段(每个SGSN对应一个IP地址段)的数据包通过。
以广州为例,GSM网络有多个SGSN,而TD网络只有一个SGSN,因此,打开2/3G互操作的功能后,TD网络的唯一一个SGSN将有可能与所有GSM网络的SGSN产生信令交互,所有GSM网络的SGSN防火墙都必须定义:
允许来自TD网络SGSN对应IP地址段的数据包通过,而TD网络的SGSN防火墙则必须定义:
允许来自GSM网络所有SGSN对应IP地址段的数据包通过。
这样,UE在PS域从TD切换到GSM后,GSM的SGSN所发出的SGSNCONTEXTREQUEST信令才能送达TD的SGSN,而TD的SGSN所发出的SGSNCONTEXTRESPONSE才能送达GSM的SGSN,接下来的一系列信令交互才能完成。
UE从GSM切换TD也是同样的道理。
3.4修改防火墙,大功告成
根据上面的分析,我们首先将每个GSM的SGSN都添加到TD的SGSN防火墙允许的IP段;
同样的,将TD的SGSN添加到GSM的SGSN防火墙允许的IP段。
经过各SGSN防火墙的数据修改后,PS域的2/3G切换功能正常,路由更新成功,且业务不中断,问题解决。
另外要注意的是,当2/3G任一网络的SGSN配置有改变时,一定要在另一网络做相应的修改,否则必将影响两个网络的互操作性能!
正确的信令过程如下:
4总结
5作者简介
苏燕,佛山公司,广州TD网络能力提升项目组成员
马于飞,汕头公司,广州TD网络能力提升项目组成员
孔令兴:
中山公司,广州TD网络能力提升项目组成员