EVDO资源拥塞处理心得.docx

资源描述

EVDO资源拥塞处理心得.docx

《EVDO资源拥塞处理心得.docx》由会员分享，可在线阅读，更多相关《EVDO资源拥塞处理心得.docx（13页珍藏版）》请在冰豆网上搜索。

EVDO资源拥塞处理心得.docx

EVDO资源拥塞处理心得

EVDO资源拥塞处理

1DO拥塞机理与说明1

1.1网络构架1

1.2拥塞控制机制2

2BSS资源拥塞的产生2

2.1BTS侧资源3

2.1.1前向业务信道时隙占空比高3

2.1.2MAC_Index拥塞3

2.1.3反向CE拥塞4

2.1.4RoT升高导致反向业务信道拥塞5

2.1.5接入信道资源不足5

2.1.6BTS单板CPU利用率6

2.2Abis资源6

2.3BSC/PCF资源6

2.4RP口资源6

2.5PDSN资源7

3拥塞的发现及预测7

3.1日常监控7

3.2阶段性系统负荷分析8

3.2.1现网负荷分析8

3.2.2用户发展引起的负荷增长及拥塞预测8

4拥塞解决方案8

4.1空口资源不足8

4.2CE资源不足9

4.3Abis传输链路资源不足10

4.4RP传输链路资源不足10

4.5BSC各板件资源不足10

4.6大型集会及活动突发高话务拥塞预测和解决方案11

5总结11

图目录

图11DO网络架构1

图12DO网络负载和吞吐量及响应时间的关系图2

图21DORevAMAC_Index的分配图4

图22请求连接次数和反向CE不足图5

图41BSC内某板件利用率高的解决思路11

1DO拥塞机理与说明

无线网络信号错综复杂，且无线用户存在移动性等特性，使得网络对用户的管理及网络资源的更有效分配与利用存在诸多困难。

整体资源不足或资源分配不合理都可能使网络出现拥塞的情况。

对于资源不足的情况需要采用网络扩容的方式来解决，资源分配不合理导致的网络瓶颈问题，可以采用扩容或优化两种不同方式进行处理。

本指导从EVDO网络产生拥塞的机理进行阐述，分析拥塞出现的原因，给出各不同场景里拥塞的判断发现方法，最终给出规避或处理拥塞问题的思路。

现场可参照该文档进行相关的分析及判断，及时发现并分流热点区域的话务量，减少因话务增长带来的呼吸、远近效应对网络质量的影响，预防及解决网络的拥塞问题，提升用户感知。

对于DO与1X共享资源的拥塞节点，更多详细信息可参考《1X资源拥塞处理指导书》。

1.1网络构架

如下图所示，DO用户进行业务交互时，数据经过如下节点和接口：

PDSN，RP口，设备内部模块及接口，Abis接口，CE，空口。

图11DO网络架构

网络架构中任何一个节点出现资源不足时，都可以导致DO网络的拥塞，影响网络性能和用户感知。

网络拥塞的控制主要是在保证用户速率和效率的情况下，对整个DO网络资源的均衡与控制。

1.2拥塞控制机制

网络资源不足是无线网络系统中常见的问题，是引起网络质量和用户感知下降的重要原因之一。

对于DO用户来说，资源不足对用户感知的影响，主要体现在：

前反向单用户吞吐量的下降、用户接入困难以及容易掉线等。

对应于DO网络，可把这种资源不足统称为拥塞。

从网络负载和吞吐量及响应时间上判断，DO拥塞现象存在二个判定关键点：

Knee点和Cliff点。

其中，当网络负载较小时，吞吐量基本上随着负载的增长而增长，呈线性关系，响应时间增长缓慢。

当负载达到一定网络容量时，到达Knee点，吞吐量呈现出缓慢增长，而响应时间急剧增加。

如果负载继续增加，网络节点开始丢包，当负载超过一定量时，吞吐量开始急剧下降，这一点称为Cliff。

Knee点和Cliff点的情况如下图所示：

图12DO网络负载和吞吐量及响应时间的关系图

根据上图可见，两个关键点也分别对应二种不同的拥塞控制策略：

拥塞避免（congestionavoidance）和拥塞控制（congestioncontrol）。

前者的目的是使网络运行在Knee附近，避免拥塞的发生；而后者则是使得网络运行在Cliff的左侧区域。

前者是一种“预防”措施，维持网络的高吞吐量、低延迟状态，避免进入拥塞；后者是一种“恢复”措施，使网络从拥塞中恢复过来，进入正常的运行状态

当前正处在用户快速增长的时期，网络负荷不断增加，如果不注意进行网络的负荷分析及拥塞处理，会降低网络质量，影响用户感知。

因此，必须采取措施进行拥塞的预防与控制。

2BSS资源拥塞的产生

从上一章节看，DO用户进行数据业务时，涉及的资源如下：

BTS侧：

空口资源（前向业务信道时隙占空比率、MACIndex、CE、接入信道占用率等）；BTS各单板的CPU等。

Abis资源：

用户数据速率越高，占用带宽越大。

BSC/PCF资源：

包括各种信令处理板和业务媒体流板的带宽、CPU利用率等。

RP口资源：

用户数据速率越高，占用带宽越大。

PDSN资源：

PDSN资源不足，引起网络用户速率下降、网络拥塞。

拥塞产生主要为上述资源不足所引起，以下对各种情况作分别阐述。

2.1BTS侧资源

BTS侧拥塞的原因如下：

前向业务信道时隙占空比高、MACIndex拥塞、反向CE拥塞、ROT升高导致反向业务信道拥塞、接入信道资源不足及单板CPU过载运行等。

2.1.1前向业务信道时隙占空比高

在EVDO网络中，前向时隙是时分的，各用户共享。

前向业务信道时隙占空比反映了物理层上前向时隙资源的利用率，是表征前向载波资源不足的重要指标；但在某些时候，比如是单个用户长时间进行高速的FTP下载业务，也会导致该指标处于高位。

因此，对于目前的BE流业务来说，通过该指标考察是否需要扩充载波，还需要关注其它指标，比如单用户前向数据速率，还有呼叫话务量也可反映出用户数的情况。

前向时隙占空比过高，大部分情况下是由于同时激活的用户过多，载波资源不足导致的，这种情况需要通过扩容载波来解决。

但也存在一部分是这些载波下同时仅有少量用户，但这些用户的无线环境较差或这些用户就是一些上层低速率用户（如QQ、MSN等即时通讯工具）。

从表面上看，这个扇区符合前向时隙利用率很高，且平均用户速率很低的条件，但用户数量很少，扩容载波起不到作用。

因此，除了看上述条件以外，还要看扇区下同时传输的用户数，即同时有数据发送的用户数（在微观上，任何一个时隙只有一个用户的数据会被调度发送，但是同一时隙上，会有多个用户有数据需要发送，在参与竞争这个时隙，传输用户数即平均参与调度的用户数；在宏观上，这些传输用户瓜分了即载扇的平均速率）。

当载扇的单用户吞吐量低，且载扇的时隙资源占用率高，且载扇的传输用户数多的时候，则可判断载扇需要扩容。

否则，可能需要做覆盖优化或解决其他问题。

2.1.2MAC_Index拥塞

前向MAC信道是一种逻辑资源，每载扇都有自己的MAC信道。

前向MAC信道由MAC_Index进行区分。

MAC_Index的分配如下图：

图21DORevAMAC_Index的分配图

其中图中黄色高亮部分是EVDORevA相对Rls0修改的内容。

RevA网络支持广播信道的时候不能给Rls0终端分配MAC_Index5。

从MAC_Index的分配可以知道，DO0理论上最多支持59个用户；DOA理论上每个载扇最大支持114个（没有使用广播信道的时候是115）用户。

（DOA最大支持114个时，MAC_Index0、1、2、3、4、5、64、65、66-70、71不可用）

在同一个载扇里面，MAC_Index是DO0、DOA用户共同使用的。

对于DO0系统，如果用户数超过59，将产生因MAC_Index资源不足导致的拥塞。

对于DOA系统，载扇下面的DO0和DOA用户之和如果超过114（没有使用广播信道的时候是115），将产生因MAC_Index资源不足导致的拥塞。

现在的网络中，考虑到用户感知等，网络对载扇的用户数通常作了限制，并且这个限制通常低于MAC_Index所能支持的最大用户数。

故一般情况下，不会出现MAC_Index拥塞。

2.1.3反向CE拥塞

反向CE资源由基站下面所有载扇的用户共用，而反向物理信道资源主要取决于CE的数量。

CE即ChannelElement，用于EVDO系统的反向信道调制解调。

CE的数量决定基站支持的并发用户数（含软切换）。

CE在基站内的小区及载频间共享，对于更软切换的用户，只占用一个CE。

当用户数过多，配置的CE不足时会引起CE拥塞。

CE的数量又可分为物理单板支持的CE数和Licence授权的CE数两种情况。

比如下面情况：

请求连接次数为0，但统计却出现了17次的反向CE不足的拥塞情况。

图22请求连接次数和反向CE不足图

该情况的出现主要是因为这个基站属于新开基站，还没放CElicense。

2.1.4RoT升高导致反向业务信道拥塞

EV-DO反向业务信道采用码分方式，扇区反向容量受限于用户之间的互干扰。

RoT（Rise-over-Thermal）反映了反向干扰水平，它取决于本小区终端的发射功率以及邻区干扰。

为保证系统正常稳定运行，扇区的RoT必须控制在一定阈值下，否则各用户将由于干扰严重而无法正常通信。

EVDO反向速率决定了终端的发射功率T2P（反向业务信道功率和反向导频功率之比）的大小，速率越高，所需的T2P越大，发射功率越大，RoT越高。

终端不能随意提高发送率，要根据反向干扰水平，也就是扇区的忙闲程度来决定。

当RoT超过阈值时，系统设置RAB为1，表示扇区忙（拥塞），终端降低反向速率，影响用户感知度。

2.1.5接入信道资源不足

接入信道用于用户随机接入系统，存在接入碰撞的可能，所谓接入碰撞指的是在同一个接入时隙有多个终端同时发送接入消息的情况。

在接入碰撞的情况下，系统无法解调接入信道消息，导致接入失败。

现在DO网络比较少存在这种情况。

但如果用户数比较多，且用户同时连接网络，可能会导致接入信道占用率上升，接入碰撞频繁发生，导致接入信道拥塞。

2.1.6BTS单板CPU利用率

当呼叫数过多或数据流量太大，超过了BTS各单板CPU的处理能力，导致单板CPU长期高位运行，会导致网络整体性能恶化，用户体验下降。

一般是统计单板连续一周忙时CPU平均利用率情况，若超过70%，则表明该基站一直处于高负荷运行状态。

2.2Abis资源

Abis为连接BTS与BSC之间的传输链路，两者之间所有交互的信令流和业务流都需要通过此链路进行传输。

在1X网络，数据流量低，Abis链路一般都不会存在拥塞，但EVDO单载扇数据流量大，各载扇流量叠加在一起，容易引起Abis口拥塞。

在这种情况下，将对载扇的吞吐量形成限制。

如果基站的Abis带宽小于基站的空口峰值速率（载扇数*3.1M），容易发生载扇吞吐量高峰时的Abis拥塞。

推荐在单载频下3扇区EVDO站，至少配置4条以上的E1传输链路。

2.3BSC/PCF资源

每个用户，都需要消耗BSC/PCF中一定的信令和业务资源。

随着用户的增加，BSC/PCF各种单板CPU处理数据增加，CPU利用率升高。

当呼叫数过多或数据流量太大，超过了CPU的处理能力，将导致CPU长期在高位运行，网络性能将恶化。

BSC/PCF内各种信令和业务媒体流处理板的带宽不足、CPU利用率过高等因素，都会带来BSC/PCF的拥塞。

2.4RP口资源

RP口为BSC与PDSN之间的接口，承载整个BSC与PDSN之间的数据收发传送。

RP链路涉及BSC、PDSN，以及它们之间数据传输链路的交换机、路由器等设备。

RP口的带宽取决各组成部分的最小带宽。

类似于Abis，如果RP口的带宽不足，也会导致拥塞，引起用户吞吐量下降。

2.5PDSN资源

信令流和数据流都需要消耗PDSN资源，如果PDSN资源不足，在建立A10链路时，PDSN返回失败代码为0x82链路建立失败消息。

PDSN资源不足，将直接导致新用户不能接入网络。

所以，也需要关注PDSN资源是否发生拥塞。

统计MP单板的CPU利用率，包括OMP、SPCF、DOCMP、DSMP、RMP、1XCMP、V5CMP和BCTMP单板的平均利用率和峰值利用率。

3拥塞的发现及预测

严重拥塞状况出现前，网络总会出现各种异常的情况。

网络拥塞存在可控制性，但需要人为的及时发现和积极预防。

现的预防思路主要为下面二方面：

一是做好日常监控；二是阶段性地对系统负荷进行分析，及时预警网络问题。

3.1日常监控

日常应建立有效的拥塞监控机制，通过网管指标分析、监察设备告警及日志等手段，及时发现及预防拥塞。

主要关注的空口资源指标包括但不限于：

∙前向时隙占空比；

∙呼叫话务量；

∙单用户前向数据速率；

∙MAC_Index利用率；

∙CE利用率；

∙载扇RAB指标；

∙接入信道占用率等。

通过对这些指标的监控与综合考虑，及时发现这些指标是否已经达到预警阀值。

3.2阶段性系统负荷分析

应建立有效的系统负荷定期分析制度，周期性对空口资源、Abis口负荷、网络各种设备的CPU利用率、RP口负荷等进行分析，并结合用户发展规模预期，评估现网容量，提前做好网络扩容准备工作。

空口资源的关注点与上节基本类似，其他如下：

3.2.1现网负荷分析

可以通过传输吞吐量峰值负荷及平均值负荷分析是否出现Abis、RP口传输链路资源不足；另外，通过CPU负荷、BSC/PCF/BTS各板件利用率来分析是否出现BSC/PCF/BTS资源不足情况。

3.2.2用户发展引起的负荷增长及拥塞预测

根据近期用户数增长趋势、市场部门放号计划及促销活动、增长用户的地理分布，结合现网的配置容量和网络运行性能情况，来预测网络未来负荷增长及拥塞情况，提前做好网络扩容准备工作。

4拥塞解决方案

4.1空口资源不足

场景一：

单用户前向速率低，同时并发的用户数较多，导致平均每用户所分配的时隙较少。

解决方案1：

增加载频或者新站点，同时可以根据实际情况，采用小区分裂方式。

对于基站密度较高的区域，可以通过新建独立信源加室内分布系统的方式吸收话务，解决网络拥塞问题。

场景二：

某载扇下的存在较多QOS用户，使得其他用户未能公平的使用前向时隙资源

解决方案：

载波扩容，或者降低QOS用户的等级。

场景三：

单用户前向速率低，且RSSI高，且平均传输用户数少

解决方案：

这种现象大都是由于外界干扰导致的，应进行干扰源的查找与清除。

场景四：

单用户前向速率低，且RSSI高，且平均传输用户数多

解决方案：

此场景下，可能是载扇下过多的用户导致该现象，可以参考场景1的方案。

4.2CE资源不足

DO的基本机制，不管反向速率的高低，一个激活用户只占用一个反向CE资源。

一块DORevA单芯片信道板（6800）可支持最多192个反向CE，但从成本考虑，中国电信的网络通常没有开满。

根据成都现网的不完全统计，三扇区基站每载波的配置多数电信总部指导意见，每载扇的反向CE数通常配置为32个，则三扇区基站每载频为96个反向CE。

如果需要增加CE数量的话，无需更换信道板，只需根据License在后台增加设置即可。

反向CE资源还要考虑软切换占用的影响，与软切换比例有关。

假设33%的软切换比例，则剔除软切换冗余后，每基站载波净承载CE数量为：

96/（1+33%）=72

多数基站为三扇区定向站，则平均每个载扇24个。

当低流量M2M业务大量开展时，这种CE配置显然不能满足要求，容易造成瓶颈。

下述场景默认后台LicenseCE已经开启到物理单板所有支持的最大反向CE数。

场景一：

反向CE平均占用率达到或者接近阀值（80%），邻近基站负荷也较高

解决方案：

增加CE资源或者增加站点。

在网络覆盖不足的情况下，通过新加站点，可以在解决拥塞的同时，改善覆盖；在网络覆盖足够的情况下，增加CE资源即可。

对于基站密度较高且具有扇区覆盖内有高话务量大楼的区域，可以在这些大楼新建独立信源加室内分布系统的方式吸收话务，解决原扇区网络拥塞问题同时改善大楼内的覆盖效果。

场景二：

反向CE平均占用率达到或者接近阀值（80%），邻近基站负荷不高

解决方案1：

基本思路是通过话务分担，让邻近基站承担部分拥塞基站话务，解决原基站的拥塞问题。

手段包括调整天线的高度、下倾角、方位角等天线调整方式和调整发射功率、切换参数等参数调整方式，收缩拥塞基站的覆盖范围，并根据实际情况扩大相邻空闲基站的覆盖范围。

4.3Abis传输链路资源不足

计算Abis利用率时，包括前向与反向传输资源不足，在判定时，应选取分析前向与反向资源占用率较大者为准。

对于DO数据业务，Abis链路的所有承载开销大致是14%左右，再考虑一定的裕量，建议扩容指标设为平均带宽利用率大于75%。

如果已经达到或者接近此门限，进行Abis链路扩容。

一般商用满配置下，单载频下3扇区EVDO站需要4条E1的传输资源连接至BSC。

4.4RP传输链路资源不足

RP传输链路利用率的计算应关注链路上上带宽最小的结点，同时取此结点在前反向中占用率较大的指标为准。

另外需要注意的一点，交换机、路由器、PDSN等设备都可以在逻辑上对链路流量进行限制，不能单纯查看物理链路带宽。

一般情况下，如果带宽利用率超过80%，则需要考虑RP口扩容。

4.5BSC各板件资源不足

场景：

当BSC里某类单板的CPU利用率过高时，CPU会长期在高位运行，势必会影响网络性能，影响用户感知。

该情况的解决思路如下：

图41BSC内某板件利用率高的解决思路

4.6大型集会及活动突发高话务拥塞预测和解决方案

大型集会及活动，如歌唱会、体育比赛等，该活动对网络的容量需求存在高话务量突发性，若不对网络进行调整或扩容，原有网络通常无法完全满足高话务量突发需求。

该情况首先得对话务需求进行预测，通过预测区域的忙时峰值人数、忙时峰值人数中DO用户所占比例以及忙时DO用户人均话务量，可预测活动区域的突发话务量，然后与设备当前容量进行对比，分析是否存在资源不足的情况。

与日常拥塞的解决思路不一样，可预见性的大型活动的拥塞问题存在临时性和紧急性，一般主要通过临时调整天线覆盖方向、增加板件、载频等方式来解决。

同时，通信应急车也是较有效的解决方案之一。

5总结

通过对前面章节的分析，发现DO拥塞可以导致网络性能运行下降，影响用户感知。

出现拥塞的原因，主要是各节点资源或板件处理能力不足所引起的，拥塞处理的方法主要为拥塞避免和拥塞控制二种。

可以通过日常监控和阶段性的网络负荷分析及时预测和发现拥塞问题，并及时提出相关的解决方案，保障网络的稳定，提高用户感知度。

展开阅读全文