CDL掉话分析方法.docx
《CDL掉话分析方法.docx》由会员分享,可在线阅读,更多相关《CDL掉话分析方法.docx(9页珍藏版)》请在冰豆网上搜索。
CDL掉话分析方法
CDL掉话分析方法
仅限大唐内部员工使用
前言
CDL中虽然提供了RNC掉话分析功能,但由于掉话原因过于复杂,只能大体上对掉话原因进行了分类,只是保证了大部分掉话分析的原因是正确的,如果要具体分析某个过程中掉话的具体原因,则需要结合码流和RNC内部定时器进行仔细分析。
掉话分析规则如下:
1、如果IuReleaseRequest的前一个消息是RABAssignmentFailure,如果该消息之前是RLReconfigFailure,则显示为RL重配失败引起的掉话;否则显示结果改为RB建立UE无响应
2、如果IuReleaseRequest的前一个消息是RBSetup,如果该消息之前是RLReconfigFailure,则显示为RL重配失败引起的掉话;否则显示结果改为RB建立UE无响应
3、如果IuReleaseRequest的前一个消息是RadioLinkFailureIndication,如果该消息之前是CellupdateConfirm,进一步判断RLFailure和IuReleaseRequest消息的8K时钟差值如果小于3秒,则显示为CellUpdateConfirm超时,否则显示为RLFailure引起的掉话;
4、如果IuReleaseRequest的前一个消息是PhysicalChannelReconfig,如果该消息之前是CellupdateConfirm,进一步判断RLFailure和IuReleaseRequest消息时钟差值如果小于6秒,则显示为切换过程中发生RL失败引起的掉话。
5、如果IuReleaseRequest的前一个消息是RadiolinkDeletionRequest,判断RLFailure和IuReleaseRequest消息的8K时钟差值,如果小于等于6秒,显示RLFailure引起的掉话(长时间发生RLFailure),否则为未知掉话原因
上面5种,除此之外则显示为RLFailure引起的掉话
6、如果IuReleaseRequest的前一个消息是CommonID,RABSetupSuccess则显示结果为RNC内部原因引起的掉话
7、如果IuReleaseRequest的前一个消息是CellupdateConfirm,则显示结果为则显示为CellUpdateConfirm超时。
8、如果IuReleaseRequest的前一个消息是PhysicalChannelReconfig,则显示结果为切换超时UE无响应。
9、如果IuReleaseRequest的前一个消息是GTP-UErrorIndication,则显示为业务面GTP-U错误引起的掉话。
10、如果IuReleaseRequest的前一个消息是RRCConnectRelease0、IuReleaseCommand、IuReleaseComplete,则不算作掉话,归类为网络优化。
常用系统定时器:
无线链路失败定时器6s
移动性管理定时器3s
系统切换定时器10s
重定位切换定时器8s
目前常见掉话原因:
1、并发流程引起的掉话:
ØRB建立过程中发生小区更新不支持,V2目前的设计就是进行释放RRC。
Ø切换过程并发小区更新不支持,V2目前的设计就是进行释放RRC。
Ø安全模式控制并发小区更新不支持,V2目前的设计就是进行释放RRC。
2、无线链路失败引起的掉话:
RadiolinkFailureindication和IuReleaseRequest之间没有该无线链路的恢复,且RadiolinkFailureindication和IuReleaseRequest之间的时间差大于等于6s|目前,系统配置的无线链路失败定时器为6.4s|,则为无线链路失败引起的掉话。
(这种情况在目前比较普遍,问题是上行失步后NodeB关闭发射,使UE下行失步,但是UE没有CellUpdate。
)
3、小区更新引起的掉话:
下行无线链路失败,CELLUpdate携带的Event_PARA=5,|Radiolinkfailure|.RNC侧下发CellUpdataConfirm后时刻与IuReleaseRequest时刻时间差大于等于3m,IuReleaseRequest中携带内部原因为26,则为CellUpdateConfirm超时。
(现在的小区更新最多发3次)
4、RB建立无响应:
终端上报RBSetupFailure,且和RBSetup之间时间差大于等于10s,则为RB建立过程UE无响应,定时器超时释放。
(也是很常见的现象,可能是UE同步失败造成的。
)
内部掉话分析依据:
CDL掉话分析是基于RNC发起的IuReleaseRequest而来,即认为所有由RNC发起的用户释放过程都是异常释放过程。
当然该异常的直接发生有可能是终端问题、也可能是基站问题以及也可能是RNC问题。
CDL工具为了减少消息量,减少对系统的冲击,尽量缩减码流长度,目前,系统上报的CDL码流基本为15字节左右;为了解码的统一,解码结构也大致相同。
结构如下:
第一部分占用一个字节:
CDL定义的接口类型
第二部分占用4个字节:
EVENT_TYPE
第三部分占用4个字节:
EVENT_PARA
后面几个字节一般就是时间、CELL_ID、UE_ID等,与我们现在要分析的原因关系不大,不一一赘述。
CDL设计时,在IuReleaseRequest消息中携带了系统定义的一些通用释放原因和内部释放原因,用于定位系统发生的异常释放。
通用释放原因占用EVENT_PARA的前两个字节
内部释放原因占用EVENT_PARA的后两个字节
常见内部掉话原因:
以下原因都为IuReleaseRequest中所携带的释放原因,取自EVENT_PARA的前一个字节(Universal_Cause),或者后一个字节(Local_Cause)|CDL解码中都明确进行了解析|.
1、携带原因为:
ReleaseduetoUEgeneratedsignallingconnection
|原因|:
终端发送信令连接释放指示要求释放
|注释|:
可能为终端问题,请获取终端LOG进行协同分析
2、携带原因为:
IUSP_REL_REQ_LOCAL_CAUSE_RECV_CN_ERROR_IND
|原因|:
收到CN的ERR_IND后进行释放
|注释|:
该问题可能涉及到两方面问题:
1、RNC问题,因为RNC发起超出协议范围内的约定,导致该消息
不能被CN所识可,CN发起ERR_IND。
例如:
数据包头错误
2、CN问题,CN错误发送ERR_IND导致
3、携带原因为:
HSPS_RAC_SRB_AC_CELL_BLOCK,
|原因|:
小区被闭锁时引起的RRC释放
|注释|:
检查小区状态
4、携带原因为:
HSPS_RAC_SRB_AC_PSDU_FAILURE
|原因|:
PSDU单板故障
|注释|:
检查告警和事件指示消息
5、携带原因为:
HSPS_RAC_SRB_AC_DSDU_FAILURE
|原因|:
DSDU单板故障
|注释|:
检查告警和事件指示消息
6、携带原因为:
HSPS_RAC_SRB_AC_CSDU_FAILURE
|原因|:
CSDU单板故障
|注释|:
检查告警和事件指示消息
7、携带原因为:
HSPS_RAC_SRB_AC_CN_INACCESSIBLE
|原因|:
CN和RNC连接中断引起的释放
|注释|:
检查IU口链路状态,以及CN状态
8、携带原因为:
HSPS_RAC_SRB_AC_IU_RESET
|原因|:
CN发起的resetResource或者操作维护发起的resetResource引起的RRC释放
|注释|:
为了确认问题,可以查询操作日志
9、携带原因为:
HSPS_RAC_SRB_AC_IUBC_RESET
|原因|:
IUB口故障产生resetresource从而引起RRC释放
|注释|:
查看Iub口链路状态
10、携带原因为:
HSPS_RAC_SRB_AC_CELL_DEL_IND
|原因|:
小区删除引起的RRC释放
|注释|:
检查小区状态
11、携带原因为:
HSPS_RAC_SRB_AC_RNC_RESET
|原因|:
RNC复位引起的释放
|注释|:
12、携带原因为:
HSPS_RAC_SRB_RB_RL_FAIL
|原因|:
无线链路失败引起的释放
|注释|:
13、携带原因为:
HSPS_RAC_SRB_RB_RL_FAIL_RSP
|原因|:
无线链路失败响应
|注释|:
14、携带原因为:
HSPS_RAC_SRB_RB_CPSS_FAIL_RSP
|原因|:
RB过程中CPSS配置失败响应
|注释|:
15、携带原因为:
HSPS_RAC_SRB_RB_TPSS_FAIL_RSP
|原因|:
RB过程TPSS失败响应
|注释|:
a:
L2配置失败、
b:
L2配置超时、
c:
收到RLC不可恢复错误
d:
PhysicalChannelReconfigurationFailure导致
16、携带原因为:
HSPS_RAC_SRB_RB_UE_FAIL_RSP
|原因|:
RB建立过程中UE响应失败
|注释|:
a:
可能为超时无响应
b:
UE返回失败指示
17、携带原因为:
HSPS_RAC_SRB_RAB_IU_FAIL_IND
|原因|:
Iu口故障引发释放
|注释|:
18、携带原因为:
HSPS_RAC_SRB_RAB_PROCESS_FAIL_IND
|原因|:
RAB过程失败引发释放
|注释|:
20、携带原因为:
HSPS_RAC_SRB_SMC_NO_ALGO_SUPPORT
|原因|:
安全模式算法不支持导致失败
|注释|:
UE或者CN
21、携带原因为:
HSPS_RAC_SRB_MM_CELL_RESEL
|原因|:
小区重选
|注释|:
22、携带原因为:
HSPS_RAC_SRB_MM_DL_RL_FAILURE
|原因|:
下行无线链路失败
|注释|:
24、携带原因为:
HSPS_RAC_SRB_MM_URAUPDATE_FAIL
|原因|:
小区更新失败
|注释|:
a:
小区更新终端无响应;察看CellUpdate后CellConfirm与IuReleaseRequset之间的时间间隔,如果大于等于3s,则怀疑为移动性管理定时器超时,即小区更新终端无响应;具体分析需要结合终端LOG共同分析
b:
RB建立过程中发生小区更新,V2目前的设计就是释放RRC。
25、携带原因为:
HSPS_RAC_SRB_UL_RL_FAILURE
|原因|:
上行无线链路失败
|注释|:
26、携带原因为:
HSPS_RAC_SRB_HAND_OVER_FAILUR
|原因|:
切换失败
|注释|:
a:
切换终端无响应,切换定时器10s超时
b:
切换过程中,终端响应失败
27、携带原因为:
HSPS_RAC_SRB_RLC_UNRECOVERABLE_ERROR
|原因|:
RLC不可恢复性错误
|注释|:
28、携带原因为:
HSPS_RAC_SRB_AC_ATM_FAIL,
|原因|:
ATM故障
|注释|:
RNC问题
29、携带原因为:
HSPS_RAC_SRB_AC_PSDU_LINK_FAILURE,
|原因|:
PSDU和高层之间的信令链路故障
|注释|:
RNC问题
30、携带原因为:
HSPS_RAC_SRB_AC_CSDU_LINK_FAILURE,
|原因|:
CSDU和高层之间的信令链路故障
|注释|:
RNC问题
31、携带原因为:
HSPS_RAC_SRB_RELEASE_CCSS_FAIL,
|原因|:
CCSS单板故障
|注释|:
RNC问题
32、携带原因为:
HSPS_RAC_SRB_RELEASE_IUSP_FAIL,
|原因|:
IUSP单板故障
|注释|:
RNC问题
33、携带原因为:
HSPS_RAC_SRB_RELEASE_INTERCCSS_RL_DEL_IND,
|原因|:
跨板无线链路删除指示
|注释|:
34、携带原因为:
HSPS_RAC_SRB_RELEASE_INTERCCSS_
HANDOVER_COMPLETED,
|原因|:
跨板切换完成
|注释|:
35、携带原因为:
HSPS_RAC_SRB_RELEASE_INTERCCSS_RL_SETUP_FAIL,
|原因|:
跨板无线链路建立失败
|注释|:
36、携带原因为:
HSPS_RAC_SRB_RELEASE_INTERCCSS_
RESTORE_TABLE_FAIL,
|原因|:
跨板导表失败
|注释|:
RNC在跨CCSS单板进行切换时,需要将该UE的信息导换到目标CCS单板上,该原因阐述的就是导表失败。
RNC问题
37、携带原因为:
HSPS_RAC_SRB_RELEASE_INTERCCSS_PHYCHRECONFIG_EXP,
|原因|:
跨板切换超时释放
|注释|:
RNC问题
38、携带原因为:
HSPS_RAC_SRB_MM_PERIOD_CELLUPDATE_EXP,
|原因|:
周期性小区更新超时
|注释|:
39、携带原因为:
HSPS_RAC_SRB_RB_DTP_L2FAIL,
|原因|:
D-to-P过程中,L2层失败
|注释|:
40、携带原因为:
HSPS_RAC_SRB_RRCReAccess_RELEASE,
|原因|:
RRC重接入释放
|注释|:
41、携带原因为:
HSPS_RAC_SMC_INTEGRITY_CHECK_FAILURE,
|原因|:
完整性保护失败
|注释|:
这种情况多为CN下发配置错误,RNC校验后直接返回失败
42、携带原因为:
HSPS_RAC_MM_INTERCCSS_CELLUPDATE_UNSUPPORTED,
|原因|:
板间小区更新不支持,即RNC收到了小区更新,但是这个小区更新
上来的小区属于另一块CCSS单板上。
|注释|:
V2的处理策略就是RRC释放
43、携带原因为:
HSPS_RAC_MM_CELLUPDATE_HAPPEN_WITH_OTHERPROC_
UNSUPPORTED,
|原因|:
小区更新和其他过程并发不支持
|注释|:
44、携带原因为:
HSPS_RAC_MM_INTERRATHO_UE_FAIL,
|原因|:
系统间切换UE失败
|注释|:
45、携带原因为:
IUSP_REL_REQ_LOCAL_CAUSE_RECV_GTPU_ERROR_IND,
|原因|:
RNC接收到ErrorInd指示,发起释放过程
|注释|:
a:
SGSN的问题,SGSN侧PDP上下文不存在了,或出现错误,导致SGSN发送errorind消息。
b:
RNC的问题,RNC发出的GTP-U数据中携带的TEID不对,这个问题的概率比较小,最好有详细的log,可以确定。
46、携带原因为:
IUSP_REL_REQ_LOCAL_CAUSE_SRNS_CS_RELOC_CANCEL_
TIMER_EXPIRE,
|原因|:
定时器超时,CS重定位Cancel.
|注释|:
47、携带原因为:
IUSP_REL_REQ_LOCAL_CAUSE_SRNS_PS_RELOC_CANCEL_
TIMER_EXPIRE,
|原因|:
定时器超时,PS重定位Cancel
|注释|: