TD高端用户感知提升专题I9008系列问题研究报告V2Word文件下载.docx
《TD高端用户感知提升专题I9008系列问题研究报告V2Word文件下载.docx》由会员分享,可在线阅读,更多相关《TD高端用户感知提升专题I9008系列问题研究报告V2Word文件下载.docx(16页珍藏版)》请在冰豆网上搜索。
2.4.3解决方案19
三、结论及后续工作19
3.1结论19
3.2后续工作20
一、概述
1.1专题背景
自3月份以来,重庆移动收到连续收到TD高端用户投诉在使用过程中出现“双不通”、“单通”、“脱网掉话”、“不能正常驻留TD网络”等投诉,终端类型以三星I9008为主。
经过大量的测试、分析,基本排除了因网络原因造成此类问题,终端自身存在问题的可能性较大。
同时,北京(中兴设备)、湖南长沙(中兴设备)、新疆乌鲁木齐(中兴设备)、山东威海(华为设备)、江西南昌(诺西设备),海南海口(诺西设备)等省市公司,均反映I9008手机容易发生“脱网”、“单通”等问题。
基于此背景,在集团公司的大力推动下,重庆公司无线中心联合三星总部研发人员、STE芯片研发人员、华为TD网络专家在重庆移动组成了“三星I9008异常事件分析”专项小组。
小组制定了详细的测试抓包分析计划,并针对出现的每一起终端异常事件进行详细分析和问题定位。
1.2测试情况
1.2.1测试规模
终端数量:
共计6部三星I9008终端,2部老版本(ZMJJ4)I9008终端+4部新版本I9008终端(ZMKD1)。
测试时间:
本期测试自5月24日至6月10日,每日测试8小时,6部终端共计测试720小时,共计呼叫4320次。
测试地点:
重庆移动公司综合楼/枢纽楼会议室内。
无线环境:
无线环境良好,稳定占用室内覆盖小区。
1.2.2测试方式
选择信号稳定、无干扰、配置充裕、话务统计指标良好、无告警、无故障的TD小区进行反复拨打测试。
为定位发生问题的版本,采取老版本手机与老版本手机之间对拨,新版本手机与新版本手机之间对拨,每2个小时主被叫对调的方式。
为模拟用户行为,拨打时长分为5分钟/10分钟/15分钟/20分钟四种。
网络侧采用CDT,TPCWIN,NASTAR等手段进行数据跟踪。
终端侧采用SpyTracer进行LOG抓取。
1.3异常事件分析结论
异常事件类型
问题定位
问题原因
影响范围
是否解决
解决方案
老版本脱网掉话
是
终端底层系统BD后重启
所有老版本I9008(ZMJJ4)终端
是,patch解决(已发布)
新版本双不通
终端APAudioDSP故障
所有I9008终端
否
否,patch解决(未发布)
新版本单通
终端APAudioDSP故障
新版本不能正常驻留TD网络
终端射频校准差异
部分I9008终端
重新校准
新版本异常掉话
目前抓取的数据无法准确定位是网络还是终端原因
I9008新版本终端
在6月7日至17日的后续测试中未再复现,继续关注
二、异常事件分析
2.1终端APAudioDSP故障导致“双不通”和“单通”
2.1.1问题现象
5月28日,两个新版本手机之间在拨通后出现“双不通”现象,即主叫听不到被叫,被叫也听不到主叫,此现象直至挂机时仍未恢复。
2.1.2原因分析
2.1.2.1网络侧分析
发生双不通的终端主叫imsi=460026*********,被叫imsi=460026*********,测试时分别播放音乐,让对端收听。
1、MO侧分析
主叫用户10:
34:
11接入,10:
48:
44正常释放,为主叫挂断。
现场反馈大约在10:
40分左右主叫端听不到对方的声音,并出现杂音。
通过CDT的录音上回放,上行(MO至RNC)基本都能听到音乐,而下行(CN至RNC)开始可以听到音乐,但在10:
39分后,听不到音乐了,且一直持续到本次通话结束,证实主叫端出现单通。
Ø
CDT分析
查看10:
39分时的CDT,发现DL数据出现问题,有时下行吞吐降为0。
同时UL数据基本正常,只有少量错块产生。
进一步就需要对对端发送的数据进行分析。
2、MT侧分析
查看被叫侧CDT,发现被叫在10:
15做系统间切换,从T网切换到G网。
因此,从T网的CDT上目前看不到被叫的上下行发包情况。
需要从终端侧抓取的文件来进行佐证。
2.1.2.2终端侧分析
1、从终端LOG还原音频文件分析
①通话时声音数据流程如下:
②MO.bin和MTbin是CP的log,可以解析出来4个CP的通话时的音频文件,分别如下:
a.MT’sCPTX:
MT_2G_TX.wav
b.MT’sCPRX:
MT_2G_RX.wav
c.MO’sCPTX:
MO_3G_TX.wav
d.MO’sCPRX:
MO_3G_RX.wav
③MO到MT方向:
MO‘sCPtx(MO_3G_Tx.wav)和MT’sCPrx(MT_2G_Rx.wav)一直都有声音,并却两端声音一致,所以在MO和MT的CP之间MO到MT方向的数据没有问题。
④MT到MO方向:
MT‘sCPtx(MT_2G_Tx.wav)从7:
56秒(与MO的开始对应)开始一直都是静音,间夹杂着少量”Zizi”的声音,MO’sCPrx(MO_3G_Rx.wav)从头到尾MT_2G_Tx.wav保持一样,所以说明在MT和MO的BP之间MT到MO方向的数据也没有问题,MT发出的声音就是静音(带有杂音)。
MO/MT双方发送的声音都能从对端CPlog中正确还原,证实了从通话两端CP经过网络再到对端CP未出现问题。
2、AP分析
虽然这次未抓到APlog,但经过分析对比,发现i9008之前在其他城市出现过一种mute问题,现象与此次类似。
对比两次问题的CPlog发现情况一致:
MO/MT双方的声音都能从对端CPlog中正确还原。
当时AP侧Log的分析结果表明:
APAudioDSP内存被覆盖,指针被置空,因此AP无法从CP侧正常读取/写入语音数据,从而导致MO/MT双方都听不到对端声音。
2.1.2.3问题定位
综合网络侧和终端侧的分析,三星I9008“双不通”现象,是由于终端APAudioDSP故障导致。
同时,STE工程师证实,I9008“单通“现象也是此原因。
2.2.3解决方案
终端厂家表示针对此问题已有patch,并进行了大量测试验证,计划下次发布新版本时解决该问题。
2.2终端底层系统BD重启导致“脱网掉话”
2.2.1问题现象
5月30日,老版本三星I9008终端在TD网络上进行语音业务,通话过程中突然掉话。
掉话后,测试人员发现终端出现短暂脱网现象。
2.2.2原因分析
2.2.2.1网络侧分析
1、UE掉话过程分析
根据NodeB侧log,在2011-05-3010:
21:
44(720)帧号:
0x22BF6A7E处用户34的接收功率瞬间掉到-118附近,接近底噪信号,相当于没有接收到任何信号,之前网络侧并没有让UE降功率;
此时iscp并没有抬升保持在-108左右,用户snr降低到-5,用户上行由于无法解对数据出现out_sync,用户34在2011-05-3010:
22:
05(900)帧号22BF7B08上报RL_FAIL_INDs给RNC,RNC在2011-05-3010:
37(980)发起释放链路流程。
用户34的rscp瞬间掉落到-118
在同一时间点用户的snr掉落到-5左右,由于此时bler的提升触发外环功率控制将snrtarget由5db提升到最大值16db,内环也一直让ue抬升功率。
用户的iscp并没有明显变化,可见与干扰无关
该终端业务掉话,出现脱网,之后重新注册:
注:
rnccdt时间比nbtpcwinlog的时间滞后7s,根据通信上下文确认为同一用户。
2、结论
由于终端异常导致终端突然不发送数据给网络,导致掉话并随后重新注册网络,网络侧未见异常。
2.2.2.2终端侧分析
1、LOG分析
从终端抓取的LOG来看,终端在2011-05-3010:
21的通话过程中发生了发生BD(程序异常中断)。
2、BD原因分析
①根据log中保存的数据分析,由硬件寄存器锁存的2G帧中断与3G帧中断的距离连续两次相同。
即下图中的a与b相等,2G_FN(M)帧与3G_FN(N)的距离为a,2G_FN(M+1)帧与3G_FN(N+1)帧的距离为b,。
但是由于TD-SDMA的子帧长为5ms,GSM帧长约为4.615ms,连续两帧的相对位置不可能相等,即a与b在正常情况下不可能相等。
由此推断由硬件寄存器锁存的b值错误。
②硬件寄存器锁存的b值错误的原因:
硬件寄存器在读写时遇到偶发的电平毛刺干扰,导致寄存器读写失败。
③当终端以“TD优先”模式驻留在TD网络进行通话时,由于网络配置了异系统测量,终端会按照测量控制配置对GSM邻区信号强度测量。
④2G帧中断与3G帧中断的距离用来进行2G与3G的时间同步计算。
2G与3G时间同步计算错误,从而使2G小区测量的执行时间计算错误,进而导致两个2G小区测量的执行时间重叠,其中一个测量命令得不到响应,这样就引起了异常中断。
⑤异常中断导致终端在通话过程中死机重启协议栈,引起终端掉话并脱网,随后重新注册网络。
2.2.2.3问题定位
综合网络侧与终端侧的分析情况,三星I9008老版本(ZMJJ4)“脱网掉话”现象,是由于终端侧发生BD(程序异常中断)造成。
从软件上增加保护措施,当检测到前后两次2、3G帧中断时间差相同时,对后一次的2、3G时间映射计算进行校正,从而使2G测量命令的执行时间不会重叠。
该BD只出现在老版本上,新版本上已经合并了patch解决了该问题。
2.3终端RF校准差异导致部分终端“不能正常驻留TD网络”
2.3.1问题现象
在I9008终端压力测试中,共6次发现个别终端在TD网络覆盖良好的情况下,于通话过程中切换至GSM网络。
2.3.2原因分析
2.3.2.1网络侧分析
根据集团要求,语音业务只能从TD网络切向GSM网络,不能从GSM网络切回TD网络,而目前采用的是基于覆盖的切换判决机制,即本小区的质量(PCCPCHRSCP)低于一定门限值,同时异系统小区的质量(GSMRSSI)评估高于一定门限,且满足一定的时间时触发3A事件,切向GSM小区。
1、排除互操作参数设置异常原因
测试所在的地点为枢纽楼的7楼大会议室,占用的小区为<
城二移动枢纽及住宅楼微T_1>
小区,频点为10055,扰码为10。
经过查询该小区的3A本系统门限设置为-92dBm,异系统门限为-84dBm,切换时间为5秒。
即TD小区的PCCPCHRSCP电平值低于-92dBm,邻GSM小区电平值高于-84dBm,满足5秒时触发3A事件,切向GSM小区。
2、排除无线环境恶化原因
用联芯8142终端对I9008测试地点(移动枢纽楼7楼大会议室)TD信号测试显示,会议室的电平值最弱点为-75dBm左右,平均值在-65dBm,GSM网络信号最弱点为-65dBm左右,TD电平值如下图所示:
图:
7楼定点测试会议室内电平值
同时对会议室所在的7楼也进行了测试,平均电平值保持在-75dBm以上,覆盖效果良好。
7楼PCCPCHRSCP
7楼PCCPCHC/I
通过以上测试,在相对固定的环境下,终端由于网络覆盖不佳原因切换到GSM网络的可能性可以排除。
2.3.2.2终端侧分析
1、网络下发的参数读取情况
以下为从问题终端LOG上解析出的3A事件相关参数:
问题终端解析出的参数与网络侧配置的参数是一致的。
所以在TD服务小区RSCP低于-92,GSM邻区RSSI高于-84,且满足该条件5秒钟的情况下,会上报3A事件测量报告。
2、终端接收到的信号强度分析
在复现“不能正常驻留TD网络”问题时,我们在问题终端旁放置了一个对比终端,并采用问题终端与对比终端互拨的测试方式。
①通过两部终端抓取的LOG分析,发现问题终端接收的信号强度很不稳定,某些时候和对比终端基本相同,某些时候和对比终端存在很大的差距。
两部终端接收信号强度对比图
②再对切换前的测量结果进行进一步分析:
A.正常终端切换前测量结果:
TDScellRSCP44(-72dbm),GSMcellRSSI58(-52dbm),UETxpower66
正常终端测量值始终较稳定,无论TD还是GSM小区,测量到的信号强度波动不大,始终未满足触发3A事件的条件。
B.问题终端切换前测量结果:
TDScellRSCP22(-94dbm),GSMcellRSSI63(-47dbm),UETxpower88
问题终端的TD测量结果波动较大。
在问题终端发生切换前,该终端与正常终端测量结果存在较大差异,且问题终端在切换前对TD服务小区RSCP的测量结果会保持低于-92dbm,而该处GSM小区信号很强,超过5秒后终端发送3A测量报告。
③上报3A测量报告时从测量结果和触发时间看满足协议规定的参数,在满足参数设定的触发条件后才上报,从切换流程看协议栈软件处理正常,但问题终端的异常测量结果导致该终端与其他终端行为不同。
④由于该问题集中在个别终端,其他终端没有此问题,因此终端个体射频校准问题的可能性较大。
2.3.2.3问题定位
综合网络侧与终端侧的分析,三星I9008终端“不能正常驻留TD网络”现象,是由于终端个体射频校准问题造成。
2.3.3解决方案
在实验室对问题终端射频重新校准,并确认将正确的校准数据完整写入终端Flash中。
2.4新版本终端异常掉话
2.4.1问题现象
6月1日,新版本终端在通话过程中出现1次异常掉话。
前期自主拨测中出现3次,但当时没有终端侧抓包。
2.4.2原因分析
2.4.2.1网络侧分析
1、从信令分析掉话原因:
掉话原因为网络侧检测到UE上行失步,上报NBAP_RL_FAIL_IND,RNC将该用户释放,时间为10:
47:
00。
2、从NodeB侧分析上行失步原因:
从上图我们可以看到,在帧号3521前,网络侧检测的SNR值有小幅降低,所以网络侧给UE发送功控命令字UP,要求UE抬升功率。
UE收到命令后,调整了上行发射功率,从网络侧看上行DPCH信道的接收功率只是短暂抬升到了-92.84db。
同时我们也看到网络侧检测到的SNR也在满足了snr_target。
在帧号3521后网络侧的DPCH信号接收功率突然掉到了-110db以下,同时网络侧检测到的snr突然大幅降低,此时上行信号无法正确解析,出现out_sync。
与此同时,同时隙的其它6个CS用户正常,没有出现上述I9008的异常情况。
3、所占用小区上行干扰情况
提取6月1日掉话时间的数据,本小区6块载波TS1、TS2时隙上行ISCP均小于-100dBm,整个小区干扰无异常。
起始时间
周期
网元名称
载波
ISCP_Ts1
ISCP.Ts2
06/01/201110:
45:
00
15
CQGM161R1
载频索引=PRIMARY
-105.469
-107.68
载频索引=SECONDARY_1
-107.841
-108.199
载频索引=SECONDARY_2
-107.815
-106.925
载频索引=SECONDARY_3
-108.038
-107.858
载频索引=SECONDARY_4
-108.084
-104.131
载频索引=SECONDARY_5
-107.508
-105.825
2.4.2.2终端侧分析
1、主被叫信令流程
主叫侧:
主叫侧log缺少起呼过程,在正常语音通话保持过程中,测量到的服务小区RSCP和终端发射功率都比较稳定,掉话前下行数据无CRC错,然后收到网络下发的RRC链接释放消息,原因为unspecified。
被叫侧:
被叫侧在主叫侧被释放后很快也收到网络下发的DISCONNECT消息,原因同样是unspecified,之后被叫侧正常释放。
2、从UE侧的log来看,在掉话之前,下行无错包,但上行发射功率TX_Power一直保持最大值25dBm来发送,时间提前量(Tadv)在掉话之前也是异常的大,有11chips.但在掉话之后重新RRC建立成功之后Tadv恢复到2chips。
从物理意义上来讲,每个chip映射到空间距离是243米。
掉话之前的时间提前量11×
243米,显然是异常值,并且对于定点测试来讲,显然是不合理的。
在现场在同样地点又抓了一个正常的log来检查,发现时间提前量都是保持在1chip左右,说明终端异常掉话前所采用的时间提前量是异常的。
(时间提前量正常情况下是网络侧根据解析出的终端上行信号到达时间进行增加或减少调整的,并将此调整命令发送给终端)
2.4.2.3问题定位
目前该问题表现为网络侧无法收到终端发送的上行信号,同时终端发送上行的时间提前量异常。
因UE侧LOG并未跟踪到UE上行发射功率和时间提前量的变化过程,仅跟踪到掉话前的一小段过程,此时异常已经发生,所以网络侧接收异常及终端侧上行发送时间提前量异常的根本原因无法定位。
2.4.3后续跟踪
在6月7日至17日进行了6部新版本终端连续测试,该问题未复现。
我们将从网络侧继续保持关注。
三、后续工作
1、对已定位,但目前仍未发布解决方案的3类问题,继续推动终端厂家尽快发布解决方案、重新校准。
2、对新版本I9008终端异常掉话问题仍未最终定位。
因目前新版本终端数量很少,日常工作中无法从网络侧得到足够的数据支持,重庆移动对6部新版本终端进行了为期两周的持续测试,均未复现该问题。
考虑到此问题复现概率较低,我们将持续关注,并积极收集相关数据。