ImageVerifierCode 换一换
格式:DOCX , 页数:16 ,大小:1.38MB ,
资源ID:7121939      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7121939.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(5G优化案例NSA网络scgfailure原因掉话问题分析.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

5G优化案例NSA网络scgfailure原因掉话问题分析.docx

1、5G优化案例NSA网络scgfailure原因掉话问题分析 5G NSA 网络 scg-failure 原因掉话问题分析 XX摘要NSA 组网的一大特点是可以基于现有的 LTE 核心网实现 5G 快速部署,是在5G 初期运营商大规模投资后收益不确定的情况下,既达到快速部署 5G 网络又降低 5G 投资的“一石二鸟”过渡方案,所以 5G 商用初期,运营商都选择了 NSA 组网。但 NSA 网络优化较为复杂,需要 4G、5G 两张网络同步进行,特别发生 5G 用户掉话,如何快速定位问题则非常重要。 本文结合 NSA 网络架构原理和掉话信令流程,分别从 eNodeB 和 gNodeB 两侧进行掉话场

2、景分类,而 4G 侧上报的 ScgFailure 则是主要分析掉话的切入口。本文通过 UE 上报 Scg-Failure 问 题 原 因 值 , 列 举 了 常 见 四 大 类: “SynchReconfigFailureSCG”、“RandomAccessProblem”、“scg-changefailure”、 “rlc-MaxNumRetx” ,并依次进行具体案例举例剖析,总结了一套排查优化手段,形成形成了一套行之有效的处理流程,为 NSA 掉话问题的解决提供了有力指引,为后期 NSA 网络优化提供了借鉴。 【关键词】NSA 5G 网络、掉话、ScgFailure 一、NSA 5G 网络

3、掉话场景 在 5G NSA 组网下,NR 侧的掉话定义为 NR 侧承载的异常释放,其中包含两类主要场景,一种为只有 NR 侧发生异常释放,LTE 侧正常;另一种为 LTE 侧发生了异常释放也会导致 NR 侧的异常释放。针对上述问题,XX电信无线中心对上述 2 类场景分别开展掉话研究,并对 LTE 侧正常,NR 异常释放进行了深入的测试分析,给出了相关的优化解决方案。 1.1eNodeB 触发的释放图 1.1 eNodeB 触发释放图在 eNodeB 场景释放包含两个子场景 a)如果是 eNodeB 直接发起异常释放,那么本次释放是由 LTE 侧的异常事件导致的; b)如果在空口 UE 上报了

4、SCGFailureinfo 消息,那么表示 UE 在 NR 侧检测到了异常,本次异常原因还在 5G 侧。 4G 侧发起释放,无 SCGFailure 上报,如下图: 图 1.2 无 SCGFailure 上报4G 侧 Uu 口收到 RRC_SCG_FAIL_INFO_NR,释放原因FailureType:synchreconfigfailurescg,如下图: 图 1.3 空口 FailureType:synchreconfigfailurescg 图1.2gNodeB 触发的释放图 1.4 gNodeB 触发释放图该场景下的释放是由 gNodeB 触发,如果是异常释放,那么可以肯定是由NR

5、 侧的问题导致的。 5G 侧发起释放,信令中携带异常释放原因值,如下图: 图 1.5 5G 侧触发释放原因值图图 1.6 空口 RRC 重配置信元图 1.7 NR 侧异常释放事件二、NSA 5G 网络掉话分析 如上文所述,NSA 组网分为两大类,其中根据跟踪实例我们可以将 NSA 掉话细分为如下图示: 图 2.1 NSA 组网分类图4G 侧发起的掉话,一般都很常见,但对于 4G 正常,5G 侧掉话的,则不大容易分析,通常是 UE 上报相关原因值,来进行层层信令分析, UE 上报SCGFailure 较为典型,下文将详细介绍这部分内容。 2.1核心网发起释放a)场景一:发起释放命令后,将 4G/

6、5G 一起释放 MME 向 eNB 下发命令后携带原因值 deteach,检查 LTE 侧信令,LTE 给 5G 发 SGNB_REL_REQ 之后 1 秒内,LTE 在 Uu 口发送 RRC_CONN_REL,携带原因值Other,将导致 4G/5G 一起释放。 核查步骤:查看 LTE 侧信令,核心网发卡了释放 LTE 上下文。 优化方法:检查终端是否发了 Detach,或者核心网侧分析释放上下文原因。 b)场景二:在初始添加 5G 辅站后,或 5G 站间切换后,LTE 发起 ERAB 修改流程,核心网反馈承载修改失败,导致 4G 释放 5G 初始添加辅站后 SGNB_ADD_REQ,并收到

7、 SGNB_ADD_REQ_ACK 后,查看 LTE 发起 ERAB 修改流程,当反馈信息携带原因值为查看 LTE 侧信令,是否收到核心网 ERAB_MOD_CONF 消息后马上发起释放,查看 S1AP_ERAB_MOD_CONF 消息中携带Cause 信元,说明 eRAB 修改失败;如果 X2 信令看到 NR 回复 SGNB_ADD_ACK 后收到 LTE 发的 SGNB_REL_REQ,则可能是 LTE 和 NR 配置的 RLC 模式不一致。 核查步骤:查看 LTE 侧信令,是否收到核心网 ERAB_MOD_CONF 消息后马上发起释放,查看 S1AP_ERAB_MOD_CONF 消息中携

8、带 Cause 信元,说明 eRAB 修改失败;如果 X2 信令看到 NR 回复 SGNB_ADD_ACK 后收到 LTE 发的SGNB_REL_REQ,则可能是 LTE 和 NR 配置的 RLC 模式不一致。 优化方法:联系核心网工程师解决 ERAB 承载修改失败问题,修改 NR 侧RLC 模式和 LTE 侧一致。 2.24G 侧重建或掉话当处于 RRC 连接状态时,如果出现切换失败、无线链路失败、完整性保护失败、RRC 重配置失败等情况,将会触发 RRC 连接重建过程。该过程旨在重建RRC 连接,包括 SRB1 操作的恢复,以及安全的重新激活。 处于 RRC_CONNECTED 状态的 U

9、E,安全已被激活,可发起该过程继续 RRC 连接。仅当相关小区是具有 UE 上下文的小区时,连接重建才会成功。假使 E- UTRAN 认可重建,SRB1 的操作会恢复,而其它 RB 将继续保持挂起。如果 AS 安全没有被激活,UE 不会发起该过程,而直接转到 RRC_IDLE 状态。总体信令流程图如下: 核查步骤:图 2.3 重建、掉话流程图当 LTE 侧发起了 RRC 重建时会导致 eNdoeB 触发 gNodeB 释放;LTE 异系统重定向导致 NR 释放,检查 LTE 侧信令,LTE 给 5G 发 SGNB_REL_REQ 之后 1 秒内,LTE 在 Uu 口发送 RRC_CONN_RE

10、L,携带原因值 interrat-redirection。 优化方法: 排查 LTE 侧发起 RRC 重建的原因;检查 LTE 异系统盲重定向门限设置是否合理。比如可以通过减小该门限,降低异系统盲重定向触发概率。 2.3UE 侧上报 SCGFailure 异常释放UE 上报的 SCGFailure 消息里会携带异常原因值,常见的有RLC_MAXNUMRetx(上行 RLC 达到最大重传次数)和收不到 RAR 等。 图 2.4 SCGFailureFailure type of SCG-FailureInformation1t310-ExpiryT310 超时2synchReconfigFail

11、ure-SCGUE 在 SCG 小区同步失败3randomAccessProblem随机接入故障 4rlc-MaxNumRetx超过 RLC 重发次数 5srb3-IntegrityFailureSRB3 加密失败6scg-reconfigFailureSCG 重配置失败由于 NSA 组网下,UE 和基站之间的信令只会在 4G 一侧,所以当 UE 检测到异常时,也是通过 4G 上报,4G 基站在收到 UE 上报的 ScgFailure 消息后会发起释放。这类释放从终端侧 LOG 可以看到 UE 上报的 ScgFailure;其它类型掉话,从终端侧看不到是 4G 发起,还是 5G 发起释放。 图

12、 2.5 SCGFailure 分类SCG failure 信令流程: 图 2.6 SCGFailure 信令流程一般根据上报的原因进行对应的问题分析,例如:切换时随机接入失败, 或者 SR 达到最大重传次数后随机接入失败,需检查空口误码和是否存在外部干扰。终端物理层失步,需要排查外部干扰、邻区干扰、小区状态等是否正常。 三、SCGFailure 应用举例 3.1案例 RandomAccessProblem: RAR 波束信号弱 RAR 失败,NR 小区添加失败问题描述:NSA 5G 站点,NR 小区添加失败。 问题分析:从现场反馈数据分析,在 SCG 添加后,UE 在 NR 小区随发起机接入

13、,UE 发送了 MSG1 消息后,一致未收到网络返回的 MSG2 消息导致 RAR 超时, 尝试多次后(现网设置 10 次)后 T304 超时,NR 接入失败,SCG 添加失败。 图 3.1 问题发现信令图图 3.2 随机接入流程图RAR 失败的原因有三种:1)UE 发送了 MSG1 消息,GNB 未收到;2)GNB 收到后没有处理,即未发送 RAR;3)gNB 处理后发送 RAR,UE 未收到。 通过 CELLDT 数据分析,基站从 17:01:5917:02:41 之间未收到 MSG1 小区(DT 数据上看 MSG1 是在此时间段多次发送),说明 UE 发送了 MSG1 消息,但GNB 未

14、收到。 图 3.3 站点跟踪图图 3.4 DT 信令图测试问题点处于 5G 站点覆盖旁瓣位置,当前基站侧使用为默认波束场景。超出主瓣覆盖范围,网络性能上无法保障,RAR 波束和 SSB 波束不一样,SSB 波峰强信号点位存在 RAR 波束信号处于波谷较弱的场景,从而导致接收信号较好,但无法接入 5G 网络,UE 上报 RAR 超时。解决方案: RAR 波束和 SSB 波束不一样,SSB 波峰强信号点位存在 RAR 波束信号处于波谷较弱的场景,导致接收信号较好,但无法接入 5G 网络,UE 上报 RAR 超时。可以通过修改 RAR 波束为 SSB 波束测试。 修改 RAR 波束,MOD NRDU

15、CELLRSVD: NrDuCellId=1, RsvdParam29=1;(该参数用于控制 NSA 场景下 RAR 使用的波束。 当参数设置为 0 时,表示开关关闭,RAR 使用 PRACH 波束。 当参数设置为 1 时,表示开关打开,RAR 使用 SSB 波束。 当参数设置为大于 1 时,默认开关关闭,RAR 使用 PRACH 波束)。 3.2案例 rlc-MaxNumRetx:SRS 周期配置过小引起 RLC 达到最大重传掉话问题描述: 某小区 PCI=218 频繁出现 RLC 最大重传导致 5G 掉话问题。问题分析: 通过分析基站侧信令跟踪,确认上下行均存在最大重传的问题,初步怀疑是空

16、口数据传输过程存在异常。 图3.5 站点信令图图3.6 空口信令图通过 probe 日志核查,比对掉话小区和正常小区的路测数据发现,掉话小区 PCI218 无相关 SRS 测量配置信息,怀疑存在异常。 掉话用户无 SRS 配置信息,正常用户有 SRS 配置信息。核查基站话统数据确认测试小区存在背景用户,确认存在多用户导致 SRS 资源分配失败问题。 核查当前的 SRS 周期(RsvdParam37)为 10Slot,会导致 SRS 资源分配失败的概率增加。 解决方案: SRS 周期配置过小导致 SRS 资源分配失败影响权值,导致上下行数传过程异常,引起 RLC 达到最大重传掉话。 修改 SRS

17、 周期为 80Slot:MOD NRDUCellRsvd:NrDuCellId=*, RsvdParam37=4; 注:RsvdParam37 配置成 1 代表 SRS 周期是 10 个 slot, 相当于 5ms; 原来配置的 4 是 80 个 slot, 相当于 40ms。 3.3案例 rlc-MaxNumRetx:终端未开性能模式导致 RLC 达到最大重传掉话问题描述: 5G NSA 组网下 DT 测试时,发现正常添加 NR 之后在等待 UE 不活动定时器超时会出现 NR 小区异常释放,上报 NR SCG failure 对应的详细原因为 rlc- maxnumretx。问题如下图所示:

18、 图 3.7 路测图 问题分析: 查看终端上报 SCGFAIL,原因是 RLC MAX RETX。 a)【温控】终端有温控措施,问题超过 43 度后,只要不是做 FTP 下载或者 speedtest 等演示业务(比如视频,微信电话,游戏,导航等),就报SCGfail,携带原因也是 RLC 最大重传。 -可以排除,因为同时间检查过上电信的 5G 载波释放正常。 b)【节能】终端进入省电模式以后(或者超级省电模式)会上报 SCGFAIL(RLC MAX RETX),释放以后终端不回在上报 B1。 (在 SCG 建立的情况下,突然设置为省电模式,上报上行 RLC 最大重传,且不会再上报 B1。现场情

19、况是一直在省电模式下,按照终端的说法是不会上报 B1, 也不会发起添加 SCG) -可以排除,为了提升测试速率,现场的测试终端都是设置的为性能模式, c)【双卡】终端在双卡情况下如果打电话,会出现 SCGfail;主卡是 5GSIM 卡,副卡是电话卡,如果副卡支持 CS 或者 VOLTE 语音,当副卡是打 VOLTE 电话(双卡副卡通话通道数不够),终端会上报 SCGFAIL,携带原因也是 RLC MAX RETX。 -可以排除,因为测试的时候,手机上只安装了一张联通卡 d)【灭屏】非性能模式(默认场景)下,终端在灭屏一定时间(1 分钟)后会发起SCGfail,如果要想灭屏之后业务不释放,需要

20、打开性能模式。 -确认是终端未开性能模式,测但是并没有非性能模式下灭屏超过一分钟,对该路段进行复测,终端开启性能模式,并没有发现 SCGfail 问题。因此定位问题根因是终端未开启性能模式。 e)【断流】终端在 NR UE 不活动定时器为 0 时,如果 24s 内 PDCP 层没有流量,就会主动通过 SCGFailure 信令主动释放,释放原因是 RCL 最大重传。通常网络侧是 20s 的不活动定时器,将 24S 断流机制中断。 -可以排除,不活动定时器为 10。 图 3.8 CQI 承载查询图解决方案: 非性能模式(默认场景)下,终端在灭屏一定时间(1 分钟)后会发起 SCGfail。网络侧

21、开启不活动定时器(通常网络侧是 20s 的不活动定时器),关闭终端的省电模式,后续 DT 测试时先开启性能模式,终端放在空调出风口,测试时不要熄屏。 3.4案例 scg-changefailure:NR 小区频繁故障导致辅站变更过程中 UE 随机接入失败问题描述: NSA 网络测试时,UE 占用到 PCI=24/25 的小区高概率随机接入失败。 图3.9 DT路测图问题分析: UE 在锚点切换后进行辅站变更流程,在辅站变更随机接入失败,NR 小区覆盖电平正常。 图3.10 随机接入失败信令图告警类别 告警次数 gNodeB 分布单元退服 3 gNodeB 退服告警 53 NRCELL 不可用故

22、障 336 NRDUCELL 闭塞故障 144 NR 分布单元小区 TRP 不可用 103 总计 834 查看一键式日志,alarm log 时间和告警告警显示异常,查看本地故障lfltlog,NRCELL 存在频繁不可用告警,统计告警类别和次数: 表 3.1 异常次数表 其中 NR 分布单元小区 TRP 不可用告警,具体问题显示基带单元异常:NR DU 小区 TRP 标识=1 柜号=0 框号=151 槽号=0 硬件能力描述=NULL 具体问题= 基带单元异常。 解决方案: NR 小区频繁故障导致 UE 辅载波变更过程随机接入高概率失败,处理故障后恢复正常。 3.5案例 scg-changef

23、ailure:4-5 邻区漏配导致 NR 掉话问题描述:5G DT 测试发现一个路段数据掉底,时长接近 25 秒。问题分析: 首先检查 probe log 从信令和事件上进行分析。发现这个时间段发生了 2 次 UE 侧发起的 NR 异常释放。而且释放原因都是 SCG-changefailure。 图3.11 路测事件图分析发现两次掉话发生时,都是在 LTE 同一个小区,PCI75 的小区。 2 次SCG-changefailure 都是 NR PCI130 小区。怀疑是 PCI 75 的 LTE 小区没有把130 的 NR 小区添加邻区,导致 LTE 切换到 PCI75 小区后,NR 不能换到

24、 75 上。导致 NR 发生掉话。 核查 LTE 75 的小区,发现确实漏配 PCI 130 的 NR 小区。 图3.12 路测切换事件图问题分析: 4-5 邻区漏配导致 NR 掉话,PIC75 LTE 小区添加 PCI130 NR 邻区后,掉话解决。 3.6案例 SynchReconfigFailureSCG:外部小区配置错误导致 NR接入失败问题描述:NSA 拉网时,每次添加 SgNB 失败,失败原因为重同步失败。问题分析: 路测经过 PCI=48 时,随机接入失败。失败原因是 SCGFailure,重同步失败,从 CHR 日志分析,失败原因是 fail in the radio inte

25、rface procedure。 NR 配置核查: 20A NSA 用户接入时,当 ADD REQ 中携带了 CGI 信息时,选择小区时以 CGI 信息为准,但是观察到按照 CGI 选择的小区 PCI 与 UE 实际请求的值不一致。 图3.13 配置核查图根据 ADD REQ 中的请求信息,看到 PCI = 46, 根据配置,对应的小区实际上是小区 cellID = 3,但是 CGI 中携带的小区是 1(对应的 PCI =48),导致了基站小区选择了 PCI = 48 的小区,出现不一致。 图3.14 ADD REQ中的请求信息图图3.15 CGI请求图锚点侧和 NR 配置核查,4G 邻区关系

26、配置中的 PCI 和 CELLID 的对应关系和5G 的配置不一致。 解决方案: 4G 侧配置的 5G 邻区关系中的 CELLID 和 PCI 对应关系错误,修改 4G 侧的外部小区配置。 四、经验总结在 5G NSA 网络优化过程中,XX全网出现的多种类型的掉话,有核心网侧的掉话,4G 侧的掉话,也有 4G 侧正常,5G 侧异常释放的掉话,其中以上报SCGFailure 问题最多,因此,可以通过总结其分类,快速定位掉话原因,提升了优化效率。另外,通过问题归类,我们发现邻区 X2 优化和参数数据一致性对掉话有较大影响,需在日常工作中重点关注,可从以下两方面着手分析处理: 确保 X2 邻区正确性和完整性需网优包区员对基础工参数据做好准确性, 并进行日常的 X2、邻区、PCI 核查。 关键参数确保无误定期汇总参数,并建立日常参数核查机制。 目前XX电信团队,通过上述优化方法对 5G 网络的掉话类优化进行了流程化分析,效果较好,保证了 5G 性能质量以及 5G NSA 用户感知。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1