网络营销降低移动互联网微信业务时延移动互联网部.docx
《网络营销降低移动互联网微信业务时延移动互联网部.docx》由会员分享,可在线阅读,更多相关《网络营销降低移动互联网微信业务时延移动互联网部.docx(41页珍藏版)》请在冰豆网上搜索。
网络营销降低移动互联网微信业务时延移动互联网部
(网络营销)降低移动互联网微信业务时延移动互联网部
降低移动互联网微信业务时延
中国电信上海公司
移动互联网部移动网络优化中心
“优翼青春”QC小组
2014年12月10日
1概况3
1.1小组简介3
1.2术语解释5
2选题理由6
2.1课题背景6
2.2选题理由6
3选题理由9
4可行性分析10
4.1关键要素分析10
4.2可行性分析14
5原因分析16
6要因确认17
6.1要因确认表17
6.2要因确认18
7制定对策29
8对策实施30
9效果检查41
9.1目标检查41
9.2效益分析42
9.3无形成果43
10措施巩固44
10.1指标跟踪44
10.2标准化44
11下一步计划45
1概况
1.1小组简介
课题名称:
降低移动互联网微信业务时延
QC小组名称:
“优翼青春”QC活动小组
课题类型:
攻关型
注册日期
2014.3.1
出勤率:
100%
QC培训
市级
小组活动次数
12
实际完成日期
2014.10.31
成员名称
年龄
职称
文化程度
成员分工
宋晨杰
29
工程师
硕士
小组组长
李波
34
室主任
本科
技术顾问
姚坚
35
室主任
本科
技术顾问
陈晓芳
34
高级工程师
本科
技术攻关、系统性技术难题
曹逸文
32
工程师
本科
技术攻关、系统性技术难题
皇甫俊伟
27
工程师
硕士
侧重现场调查
张儒申
28
工程师
硕士
侧重现场调查
詹黎
30
工程师
硕士
侧重数据分析
张天韵
27
工程师
硕士
侧重数据分析
赵佳融
26
工程师
硕士
侧重数据收集、方案实施
周佳俊
30
工程师
本科
侧重数据收集、方案实施
陈喆
30
工程师
本科
侧重数据收集、方案实施
王丽娟
33
工程师
硕士
侧重数据收集、方案实施
沈璐旸
26
工程师
硕士
侧重数据收集、方案实施
表1-1小组简介(数据采集及制表人:
陈晓芳2014-3-15)
本QC小组的名称为“优翼青春”质量管理小组,即挥洒青春,打造优质天翼网络。
小组成员均有信心通过本次QC项目开展,改善中国电信CDMA网络质量,提升“天翼”品牌形象。
本小组的特点是:
专业化、年轻化、分析能力强。
本小组曾获得2013、2014年全国优秀质量管理小组。
图1-1小组获奖情况(陈晓芳2014-8-15)
1.2
术语解释
Ø3G——第三代移动通信技术(3RD-Generation),主要为移动终端用户提供高速数据传输的蜂窝移动通讯技术。
目前中国电信现行运用的3G标准为EVDO,峰值下载速率为3.1Mbps,上传速率为1.8Mbps。
Ø4G——第四代移动通信技术(4nd-Generation),即LTE,数据传输速度更快,最高上行可达150Mbps,下行50Mbps。
目前上海电信LTE已覆盖中心城区。
Ø时延——用户发起业务到服务器响应所需要的时间,或服务器发起寻呼到用户终端反馈所需时间。
2
选题理由
2.1课题背景
自09年中国电信3GEVDO网络投入商用以来,依托CDMA-1X网络为基础,大力发展移动业务。
无论从移动用户规模及网络规模都得到了迅猛的发展。
伴随着近年来各地网络建设及优化工作的不断深入展开,中国电信移动网络质量也获得了大幅提升。
但是随着近年来流量经营的理念在全公司的逐步加深、苹果三星等智能操作系统终端在用户中的逐渐普及以及以微信、微博为代表的OverTheTop业务的快速扩张,移动网络业务形态与热点区域也与建网初期发生了巨大的变化!
这给无线网络优化提出了新问题和新的挑战!
为此,中国电信集团公司于2013年初组织各地开展“三重”3G网络优化专项活动,“三重”包含重点业务,重点区域,重点用户。
2012年,2013在中国电信集团公司展开三重优化活动的背景下,本小组通过QC活动,成功对重点区域中徐家汇商圈进行优化,有效改善了重点区域的网络性能质量。
2014年,集团公司在前期重点关注网络性能质量的基础上,进一步关注用户业务实际使用感受,即用户感知,并开展了相关网络优化劳动竞赛,以确保电信移动网络比较优势!
综合而言,本课题的主要意义如下:
公司战略要求
推广意义:
品牌价值:
落实(中国电信〔2013〕225号)《开展2013年移动网络优化劳动竞赛》中的要求,确保电信移动业务比较优势!
上海作为本次“改善用户感知”网络优化专项工作的牵头试点城市,在各省公司具有推广意义!
随着4G牌照下发,保障重点业务质量,成为推广“天翼”品牌的很好契机
表2-1课题主要意义(制表人:
李波2014-4-10)
2.2选题理由
在用户感知中,业务时延是重要指标。
在关于“改善用户感知”的网络优化专项活动,中国电信集团公司要求重点关注重点业务的时延,集团公司要求为:
重点业务时延<1.3s
从移动互联网业务形态分类,可以将目前现有的应用分为多连接少流量业务和少连接多流量业务,多连接少流量业务主要以即时通讯类业务为主,例如微信、微博等等,少连接多流量业务主要以视频音频类业务为主,例如优酷视频、QQ音乐等。
集团公司定义,各省两类业务用户使用量排名TOP5的业务为该省重要业务。
通过端到端平台,对2014年3月至5月每日实际忙时样本分析,发现电信用户少连接多流量业务TOP5为微信、新浪微博、QQ、XX搜索和淘宝。
而多连接少流量业务TOP5为优酷视频、XX音乐、酷我音乐、虾米音乐和奇艺视频,统计这些业务占比及时延如下所示:
图2-1多连接少流量业务占比图(陈喆2013-6-10)
多连接少流量业务
样本量
占比
每连接时延
微信
176727987
7.61%
1695.56
新浪微博
43752594
1.89%
481.26
淘宝
30522367
1.32%
518.9
XX地图
10537760
0.45%
651.18
QQ
4317232
0.19%
1173.78
合计
265857940
1310.76
表2-3少连接多流量业务TOP5业务时延对比
(数据采集及制表人:
陈喆2014-6-10)
少连接多流量业务
样本量
占比
每连接时延
优酷视频
73897708
3.18%
912
XX音乐
63690899
2.74%
667
酷我音乐
29305157
1.26%
587
虾米音乐
4783922
0.21%
776
奇艺视频
40798190
1.76%
711
合计
212475876
752
表2-3少连接多流量业务TOP5业务时延对比
(数据采集及制表人:
陈喆2014-6-10)
从上图可以看出,少连接多流量业务平均时延为752ms,达到集团指标要求,而多连接少流量业务时延为1310.76ms,未达标。
因此,多连接少流量业务优化迫在眉睫,一定要解决。
对多连接少流量业务进一步分析发现,微信样本量远大于其它业务,且时延最大,因此,小组认为可以以微信作为切入点,对其展开优化,以降低微信业务时延,这样便可以大幅改善多连接少流量业务的总体时延。
图2-3选题理由示意图(赵佳融2013-6-10)
综上,结合公司战略及指标要求,经小组讨论,我们最终选定“降低移动互联网微信业务时延”这一课题。
3选题理由
公司要求重点业务时延<1.3s。
为了达到公司的指标要求,我们小组设定这次活动的目标为:
将移动互联网微信业务时延降低至1.3s以下。
图3-1目标设定(数据采集及制表人:
周佳俊2014-6-11)
4可行性分析
4.1关键要素分析
微信业务主叫流程如下:
图4-1微信业务主叫流程图(制图人:
张天韵2014-6-2)
A阶段加C阶段为空口接入时延,B阶段为核心网到微信服务器主叫三次握手时延。
微信业务被叫流程如下:
图4-1微信业务被叫流程图(制图人:
张天韵2014-6-2)
D阶段为被叫三次握手时延,E阶段加F阶段为空口寻呼时延。
通过以上分析,微信业务时延主要是空口时延,包括接入、寻呼时延和核心网到服务器三次握手时延。
选取2014年3月-5月中的一周7*24小时总共168个数据进行直方图分析如下:
图4-2空口时延直方图(制图人:
张天韵2014-6-2)
图4-3三次握手时延直方图(制图人:
张天韵2014-6-2)
空口时延直方图呈离岛型,标准差较大,过程能力明显不足,而三次握手时延则比较正常。
空口时延是无线传输,而三次握手者是有线传输,一般情况下,三次握手时延波动较小,从以上样本统计也可以看出,三次握手时延各样本比较接近,而空口时延差别较大,因此,影响微信业务时延长主要是空口时延长所致。
针对2014年3月-5月中的92天中忙时用户微信连接样本,总计176727987次微信连接中,其中合格样本,即时延小于1.3s的样本分别为82851045次,不合格样本量为93876942,小组将这合格不合格样本拿出,分别统计不同阶段的时延如下:
样本量
平均空口时延
三次握手时延
合格样本
82851045
525.42
447.58
不合格样本
93876942
1678.57
466.43
表4-1合格不合格样本各阶段时延
(数据采集及制表人:
张天韵2014-6-11)
因此,我们对不合格样本93876942次微信连接进行了进一步的分类统计和原因汇总,得到
项目
不合格样本数
占比
接入时长过长
42432377
45.20%
寻呼时长过长
36236500
38.60%
RLP层重传次数多
6909341
7.36%
会话协商时间长
5172619
5.51%
网络异常终端
1239176
1.32%
软件错误
1079588
1.15%
其它
807341
0.86%
表4-22014年3月-5月用户空闲态下切样本统计
(数据采集及制表人:
张天韵2014-6-11)
根据以上空口时延长项目分类,我们进行了柏拉图的绘制:
图4-4空口时延长各项目样本统计柏拉图(数据采集及制表人:
张天韵2014-6-11)
通过柏拉图的排列我们可以看到,在所有空口时延长的样本中,接入时常长过长与寻呼时长过长分别占据了45.2%与38.6%,问题严重。
由此,我们判断导致微信业务时延过长的主要原因在于接入时常长过长与寻呼时长过长,如果要降低微信业务时延达到合格的1.3s内,减少接入时常长过长与寻呼时长过长比例是关键因素!
4.2可行性分析
4.2.1去年同时段类比
提取2013年3-5月间微信业务时延,去年总微信样本为89894429个,统计微信平均时延为611ms,进一步统计接入时长过长样本和寻呼时长过长样本,如下:
项目
样本量
占比
接入时长过长
13484164
15%
寻呼时长过长
11686276
13%
表4-32013年微信样本中接入时长过长与寻呼时长过长的样本
(数据采集及制表人:
陈喆2014-6-11)
统计微信样本分阶段时延如下:
总时延
空口时延
三次握手时延
611
161
450
表4-42013年微信样本中分阶段时延
(数据采集及制表人:
陈喆2014-6-11)
从去年指标分析,微信业务时延曾优于集团指标。
今年微信样本为176727987,去年样本为89894429,一年微信增长了一倍。
当时微信接入时长过长样本和寻呼时长过长样本仅为15%与13%,相比今年,有很大的提升及优化空间,通过QC活动,若能将微信这两项问题解决,必能使微信时延大幅度的改善。
4.2.2数据理论分析
我们对之前得到的全量统计样本进行分析,得到,
总样本数
合格样本数
不合格样本总数
接入时长过长样本
寻呼时长过长样本
176727987
82851045
93876942
42432377
36236500
表4-5样本数分析(数据采集及制表人:
张儒申2014-6-11)
如果可以将接入时长过长与寻呼时长过长问题全部解决,通过计算可以得出,微信时延将会优化到:
微信时延=(其余不合格样本*不合样本时延值+(合格样本+接入时长过长样本+寻呼时长过长样本)*合格样本平均时延)/总样本数=743ms
如果可以将微信接入时长过长样本和寻呼时长过长优化至去年平均水平,即15%与13%,通过计算就可以得出,微信时延为:
微信时延=(不合格样本-(接入时长过长样本*(45.2%-15%)+寻呼时长过长样本*(38.6%-13%))*不合样本时延值+(合格样本+(接入时长过长样本*(45.2%-15%)+寻呼时长过长样本*(38.6%-13%))*合格样本平均时延)/总样本数=1234ms
综合所述,降低微信业务时延至1.3s%的目标在理论上是完全有可能实现的。
5原因分析
针对现网的分析结果,QC小组根据全面质量管理的理论和方法,结合目前存在的问题,从人员与方法、空口与无线环境、硬件设备与资源等多方面将造成微信时延长的原因进行了分析,共总结出8个末端原因(绿色框内原因),如图所示:
图5-1原因分析关联图(曹逸文2013-6-12)
根据如上原因分析图可知,导致网络寻呼时长过长与接入时长过长的末端原因共有8个,主要包括缺乏培训机制、缺失统计工具、传输负荷过高、接入信道负荷过高、异常连接占比过高、导频污染、设备硬件故障以及控制信道负荷过高。
6要因确认
6.1要因确认表
我们根据原因分析中所确定的8个末端原因,逐一进行要因确认。
序号
末端原因
确认方法
确认内容
确认标准
确认人
确认时间
1
缺乏培训机制
调查分析
检查小组成员优化及网络维护培训情况,小组成员培训及工作资质
1.年参加培训次数超过20课时、5个科目
2.小组成员通过中国电信集团认证的网络优化资格考试。
宋晨杰
2014/6/20前
2
缺失统计工具
调查分析
是否存在准确的指标统计体系
有规范的指标统计体系,完善的统计工具
曹逸文
2014/6/21前
3
传输负荷过高
调查分析
现网基站3G传输配置情况能否满足需求
确认现网基站传输资源配置情况,传输资源利用率≤70%
陈晓芳
2014/6/22前
4
接入信道负荷过高
调查分析
现网基站3G接入信道现状能否满足需求
接入信道负荷>40%时,全网业务信道建立成功率明显下降
张天韵
2014/6/24前
5
异常连接占比过高
调查分析
是否存在异常连接且及占比情况
确认现网存在异常连接,且异常连接次数占比超过10%
张儒申
2014/6/26前
6
导频污染
调查分析
现网覆盖导频情况
确认现网区域无明显导频污染情况,呼叫记录中导频集数量大于3个的占比小于5%
周佳俊
2014/6/29前
7
设备硬件故障
现场测试
调查分析
是否存在设备硬件告警
存在设备硬件告警信息
陈喆
2014/6/22前
8
控制信道负荷过高
调查分析
现网控制信道负荷情况
控制信道负荷超过20%
皇甫俊伟
2014/6/27前
表6-1要因确认表(詹黎2014-6-18)
6.2要因确认
末端原因一:
缺乏培训机制
末端原因
确认方法
确认时间
确认人
缺乏培训机制
调查分析
2014年6月20日
宋晨杰
评判标准:
2014年参加网络优化及维护培训次数超过20课时、5科目,同时通过中国电信集团认证的网络优化资格考试。
对小组9名成员2014年的培训、考核进行统计分析,如下表:
姓名
培训课时
科目
通过考核等级
陈晓芳
60
12
2级通过
曹逸文
60
12
2级通过
周佳俊
45
10
3级通过
宋晨杰
45
10
3级通过
张天韵
35
9
3级通过
张儒申
40
7
3级通过
陈喆
45
6
3级通过
皇甫俊伟
45
6
3级通过
赵佳融
45
6
3级通过
参考要求
20
5
5级通过
表6-2小组成员培训考核成绩表(陈晓芳2014-6-20)
从上表可以看出每个小组成员都有符合要求的培训经历,并且都通过了考核要求。
小组大部分组员具有多年CDMA网络优化分析工作经验,组员曹逸文曾获得“中央企业技术能手”称号,中国电信集团网优技能竞赛二等奖等成绩。
图6-1小组成员荣誉情况(陈晓芳2014-6-20)
结论:
缺乏培训机制为非要因。
末端原因二:
缺失统计工具
末端原因
确认方法
确认时间
确认人
缺失统计方法
调查分析
2014年6月21日
曹逸文
评判标准:
有规范的指标统计体系,完善的统计工具。
中国电信在2009年运行EVDO网络开始之初,即建立了EVDO指标统计体系,供各省市使用;同时,各省市公司根据集团规范,进行了网络优化平台的开发,供优化人员进行网络性能分析。
前期,在多维感知项目中,开发了端到端分析系统,即无线业务分析平台,可以进行业务级统计。
图6-2集团无线网络统计指标、网优平台与无线业务分析平台界面(陈晓芳2014-6-21)
结论:
缺失统计工具为非要因。
末端原因三:
传输负荷过高
末端原因
确认方法
确认时间
确认人
传输负荷过高
调查分析
2014年6月22日
陈晓芳
评判标准:
确认现网基站传输资源利用率≤70%
根据《中国电信集团关于基站EVDO扩容标准指导手册》,传输负荷扩容标准,传输负荷超过70%的基站属于传输高负荷基站。
通过对于全网在3月至5月的传输负荷情况进行统计分析,得到下图:
图6-3基站A-Bis口平均带宽利用率(数据采集及制表人:
赵佳融2014-6-22)
可以看到,该基站在3-5月中平均传输利用率仅53.21%,低于70%的传输扩容门限。
结论:
基站传输负荷过高为非要因。
末端原因四:
接入信道负荷过高
末端原因
确认方法
确认时间
确认人
接入信道负荷过高
调查分析
2014年6月24日
张天韵
在EVDO系统中,反向接入信道负荷是EVDO基站反向接入信道业务情况的主要指标。
根据集团下发的3G业务规模发展优化操作手册,当EVDO载扇在实际忙时的接入信道负荷超过40%时,说明该载扇接入信道负荷过高,这将导致从用户侧发起的接入探针产生碰撞,导致接入时间过长。
图6-43G业务规模发展优化操作手册(赵佳融2014-6-24)
为了验证手册内容的准确性,我们对网络忙时接入信道负荷以及微信空口时延的76个样本提取出来,并统计得到了接入信道负荷与接入时长的关系调查表如下:
接入信道负荷
空口时延
接入信道负荷
空口时延
接入信道负荷
空口时延
1
40%
500
27
62%
2020
52
55%
1300
2
48%
460
28
64%
2590
53
57%
2250
3
55%
980
29
64%
1990
54
61%
2350
4
56%
1190
30
56%
1110
55
63%
1470
5
57%
1580
31
41%
370
56
62%
2450
6
44%
500
32
45%
900
57
68%
2620
7
40%
580
33
51%
1150
58
56%
1190
8
63%
2370
34
62%
2360
59
59%
1800
9
48%
700
35
61%
1570
60
55%
1180
10
45%
590
36
60%
1790
61
63%
2140
11
48%
1050
37
47%
480
62
58%
1130
12
69%
2460
38
64%
2020
63
54%
1020
13
57%
1410
39
42%
380
64
62%
1970
14
59%
1980
40
41%
390
65
58%
1530
15
53%
1250
41
58%
1080
66
45%
410
16
49%
530
42
53%
1580
67
52%
1180
17
49%
1010
43
56%
2130
68
49%
1130
18
48%
1040
44
46%
610
69
47%
580
19
47%
940
45
68%
2260
70
55%
1210
20
49%
640
46
68%
2540
71
53%
1140
21
52%
920
47
49%
1150
72
67%
2340
22
68%
2470
48
42%
470
73
52%
1380
23
63%
1620
49
53%
1290
74
60%
2200
24
50%
1330
50
66%
1840
75
57%
1640
25
41%
400
51
47%
710
76
48%
700
26
59%
1130
表6-3接入信道负荷与空口时延关系调查表(皇甫俊伟2014-6-25)
根据上表,得到散点图如下:
图6-5接入信道负荷与业务信道建立失败关系散点图(皇甫俊伟2014-6-25)
用相关系数判断法判断相关性:
X为接入信道负荷,Y为业务信道建立失败次数。
计算相关系数得到:
通过查询“相关系数γ的临界值”表,按照N-2=73,α=0.01,则γα在0.217到0.283之间,|γ|>γα
所以认为接入信道负荷超过40%时,接入信道负荷与空口时延存在强正相关。
结论:
接入信道负荷过高是要因。
末端原因五:
异常连接占比过高
末端原因
确认方法
确认时间
确认人
异常连接
调查分析
2014年6月25日
张天韵
评判标准:
现网存在异常连接,且异常连接次数占比超过10%
我们选取Iphone4s(ios系统、还原出厂设置)、iphone4(ios系统、已破解)以及华为C8500(Android系统)进行业务测试,发现iphone4和华为C8500两部终端在打开数据连接后,经常会收到来自互联网的业务请求,由于产生了TCP的交互过程,所以此时如果空口已经被释放,则空口会被重新配置资源。
AT侧被请求连接的部分端口有共同特征,初步判断是由于部分互联网上的端口扫描