ImageVerifierCode 换一换
格式:DOCX , 页数:10 ,大小:327.79KB ,
资源ID:142496      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/142496.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(【原创】r语言逻辑回归移动通信客户流失规律分析附代码数据.docx)为本站会员(b****9)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

【原创】r语言逻辑回归移动通信客户流失规律分析附代码数据.docx

1、有问题到淘宝找“大数据部落”就可以了移动通信客户流失规律分析1. 研究问题通过对某移动通信公司客户的流失数据分析,了解客户流失规律,建立流失预警系统,为客户关系管理服务。2. 数据来源某年度随机抽取的 1000 个移动通信客户。因变量是他们来年的流失行为(0=未流失,1=流失)。为了能够预测客户的未来行为,我们采集了下面这些来自当年的指标:客户等级(区分 VIP 客户等级):1,2,3,4;主叫次数(%):7 日内日均主叫次数/90 日内日均主叫次数;被叫次数(%):7 日内日均被叫次数/90 日内日均通话时长;费用(%):7 日内日均通话费用/90 日内日均通话费用。该数据存放在 csv 文

2、件 mobile.csv 中。移动通信行业的现有企业中,一般情况下客户月流失率在 3%左右,如果静态计算,则所有客户会在2 3 年内全部流失。 在降低客户流失率方面,哪怕仅仅降低1 就意味着你至少可以有百万元的收入增长!客户是一个公司最宝贵的财富, 因此保持客户并增长客户就是头等重要的事情,同是又是很困难的一项任务。在2011 年底,中国的人口已达1347350000,同时手机量达到 1006923000,也就是说中国的手机普及率差不多达到了 75%,现有的用户数几乎已经接近人口总数。在一个如此成熟和饱和的市场中,开拓新用户的难度可想而知。根据美国市场营销学会顾客满意手册的统计数据表明,吸引一

3、个新顾客所耗费的成本大概相当于保持一个现有客户的 5 倍,而且从传统意义上来讲,移动通信行业保留旧客户利润率为开发一位新客户之 16 倍,尤其对于剩余客户市场日渐稀疏的移动通信市场来说,减少客户流失就意味着用更少的成本减少利润的流失,这点已经为运营商所广为接受。由此可见客户保持的重要性,也就是说保留旧客户比开发、吸收新客户更重要。 在成熟期的产品市场中,要开拓新客户很不容易。客户的忠诚度应该是一个企业能够生存发展的最大资产之一,拥有忠诚度的客户,会因客户有学习的效果,而使企业可以花费较少的成本来服务客户,降低了公司在服务成本上的支出,而且忠诚的客户也会宣传正面的口碑效应以作为他人的参考,进而替

4、企业创造新的交易。因此本文试图通过逻辑回归模型来对某移动通信公司客户的流失数据分析,了解客户流失规律,建立流失预警系统,为客户关系管理服务。3. 读取数据,并且查看数据概况4. 绘制变量之间的散点图attach(data)从上面的图中,我们可以看到各个变量之间的相关关系,其中主叫次数和被叫次数呈正相关关系,通话时长和费用也成正相关关系。然后绘制各个自变量和因变量(流失)的关系散点图,可以看到他们之间关系不是十分明显,从次数和流失的散点图来看,可能有正相关的关系,因此进行逻辑回归模型的分析。5. 建立逻辑回归模型levels(data$流失) 1 01split -sample(1:nrow(d

5、ata),nrow(data)*(2/3)训练集data_train -datasplit,测试集data_test |z|)(Intercept) 2.31780.3137 7.389 1.47e-13 *客户等级-0.43110.1613-2.6720.00753 *主叫次数-0.65790.2393-2.7490.00597 *被叫次数-2.49360.3065-8.1364.07e-16 *通话时长0.15020.35420.4240.67159费用0.25790.18931.3620.17312-Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1

6、 1 (Dispersion parameter for binomial family taken to be 1)Null deviance: 895.30 on 665 degrees of freedom Residual deviance: 672.74 on 660 degrees of freedom AIC: 684.74Number of Fisher Scoring iterations: 57. 优势比解释则客户等级每增加 1 个单位,客户流失的估计值变为 exp(-0.4311)=0.6497939,因此,客户等级越高,客户流失越低则主叫次数 每增加1 个单位,客户流失

7、的估计值变为 exp( -0.6579)= 0.517937 9,因此,主叫次数越高,客户流失越低则被叫次数 每增加1 个单位,客户流失的估计值变为exp(-2.4936)=0.08261203,因此,被叫次数 越高,客户流失越低8. Logistics 回归拟合的解释从输出结果可以看出 ,回归方程为流失=2.7885 -0.5801 客户等级-0.6756 主叫次数 -2.6843 被叫次数-0.5125 通话时长+0.7565 费用,变量和的统计量的估计值分别为-0.5801,-0.6756, -2.6843, -0.5125 和 0.7565,除了通话时长以外由对应的值都比显著性水平 0

8、.05 小,可得 4 个偏回归系 p 数在显著性水平 0.05 下均显著不为零。因此,可以认为客户等级、主叫次数、被叫次数和费用对客户流失具有显著的影响。进一步地剩余方差的估计值,deviance 统计量的估计值为 898.52 ,说明,回归方程效果较好。9. 效应的置信区间置信区间是给定自变量值后,由回归方程得到的的流失预测值(实 0y 际上是的平均值)的置信区间;预测区间是实际值的置信区间,在这里称为预测区间。0y0y 预测区间要比置信区间稍大,命令与显示结果如下10. 拟合优度与偏差混淆矩阵predict real bad good0 17722134101残差分析:残差分析可以对回归模

9、型的假设条件即随机误差项是否独立同分布进行检验,同时还可以找出离群点。命令语句为 plot(lm.1),显示结果如下11. Logistics 模型的残差:皮尔逊残差与标准化残差左上图是拟合值与残差的散点图,从图上可以发现,除去第 3 个离群点外,所有点基本上是随机地分散在纵坐标值为-1 和+1 的两条平行线之间,这说明随机误差项具有同方差性;左下图是拟合值与残差的标准差的散点图,其意义与上面类似;右上图表明随机误差项是服从正态分布的,其原因是正态Q-Q 图近似地可以看成一条直线;右下图的 CooK 距离图进一步证实第 3 个观测值是一个离群点,它对回归方程的影响是比较大的,要根据具体问题,讨

10、论出现这一观测值的实际背景。12. 联表的 Cochran-Mantel-Haenszel 检验CMH 统计量=1926.2, df=1815, P-value=0.034.由于 p 值小于 0.05,因此可以认为不同的客户等级客户流失和主叫次数之间不是相互独立的。13. 总结本文首先通过绘制客户流失与诸影响因素(客户等级主叫次数被叫次数通话时长费用)之间的散点图和计算它们之间的相关系数,可知客户流失与诸因素之间存在比较明显的非线性关系,因此,为简化问题,通过 R 软件,建立了逻辑回归模型.利用所得模型可对客户流失的因素进行探讨.研究表明,客户流失和货币供应量与人民币短期存款利率并不存在长期的

11、稳定关系.因此,这里只使用此模型对我国移动通信市场作出粗略的线性估计.我们猜测只是由于影响客户流失的因素复杂,如通信公司的经营状况、客户心理等等,并最终反映在客户流失行为上来 ,表现在客户流失的高低.此外,移动通信市场是一个动态的过程,客户作为通信产品的需求者与供应者,通过流失率来表达对价格水平的意见. 当然,值得注意的是,客户流失并不是由上述因素来决定,还有其他的影响因素。通过回归分析可以发现,客户流失与主叫次数、通话时长息息相关。由于移动通信市场是通信呼叫的场所。通信市场分析方法包括技术分析、基本分析和演化分析,在此仅从技术分析角度来分析客户流失,比较片面的。更由于在我国目前仍然以实体经济为主的经济模式之下,我国的移动通信市场仍处于青春时期, 虽然非常活跃,但同时受制于国家体制。随着经济的发展,未来的移动通信市场前景将随着经济总量的提升而不断扩大其基本面,但同时必须关注全球经济、政治的发展局势,把握国家宏观调控的尺度,不能单纯从相关影响因素的数据进行预测。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1