ImageVerifierCode 换一换
格式:DOCX , 页数:13 ,大小:642.16KB ,
资源ID:26105680      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/26105680.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(商务智能实验报告.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

商务智能实验报告.docx

1、商务智能实验报告 Revised as of 23 November 2020商务智能实验报告数据挖掘与商务智能实验实 验 报 告实验题目:数据挖掘的基本数据分析 姓名:王俊 学号:0164 指导教师: 张大斌 实验时间: 2016年 11月 10日 实验题纲:一、实验目的1)熟悉基本数据分析的处理流程。2)进一步熟练掌握拍SPSS Modeler工具的操作。二、实验内容内容一:数据的质量探索步骤1 建立数据流1)在“源”中通过拖入“Statistics”文件节点读入数据。2)建立“类型”节点,并说明各个变量角色。这里指定“流失”为目标变量。3)选择“输出”选项卡中“数据审核”节点并将其连接到

2、数据流的恰当位置,点击鼠标右键,在“质量”选项卡下,选择检测方法为平均值的标准差。步骤2 结果输出实验结果输出如图所示。图中蓝色部分表示输出变量取YES,即客户流失的样本数,可以看出,各个变量上流失客户的取值均不同。 内容二:基本描述分析这里分析的目标是对电信客户数据的基本服务、开通月数、免费部分和无线费用之间的相关系数以反映变量之间的相互关系。步骤1 建立数据流选择“输出”选项卡中的“统计量”节点。步骤2 设置相关参数1)双击“统计量”节点,进行相应的设置。在“检查”框中添加开通月数、基本费用、免费部分和无线费用。2)在“相关”框中添加年龄、收入和家庭人数。如图所示。3)在“相关设置”中,勾

3、选“按重要性定义相关强度”。如图所示。计算结果如图所示。可以看出,以“基本费用”为例,它与“年龄”和“收入”都有相关性,它们之间简单相关系数虽然为和,但从统计量的角度来看有95%以上的把握认为它们之间是非0相关。“基本费用”与“家庭人数”呈负弱相关。内容三:绘制散点图数值之间变量的相关性可以采用上一个实验,也可以通过散点图来直接观察,此次主要观察基本费用和年龄之间的相关性。步骤1 构建数据流选择“图形”选项卡中的“图”节点。步骤2 设置相关参数1)双击“图”节点,选择编辑菜单,进行参数窗口的设置。2)在“X字段”和“Y”字段框中分别选择“基本费用”和“年龄”。在“交叠字段”下,选择“颜色”-“

4、流失”,不同颜色表示流失量不同取值的样本点。如图所示“图”节点的参数设置窗口。输出的结果如图所示。内容四:两分类变量相关性的研究两分类变量相关性研究可以从图形分析入手,然后采用数值分析的方法。下面采用网状图分析。步骤1 设置相关参数选择图形中的网络节点,进入编辑状态,在“字段”下选择“套餐类型”和“流失”。设置线值为“绝对值”。步骤2 结果输出可以由结果图中得到,其电信客户保持是最好的,结果输出如图所示。内容五:变量中重要性分析步骤1 窗口设置选择“模型”选项卡中的“特征选择”节点,将其连接到数据流的恰当位置,点击鼠标右键,选择弹出菜单中的编辑窗口,将“流失”添加到目标选项中,其他的全部添入输

5、入,具体操作如图所示步骤 2 结果输出由结果输出可以看出,开通月数、基本费用、电子支付、年龄、受教育程度、套餐类型、收入以及各种费用等变量对预测用户是否流失很重要,其他的变量则意义不大,结果输出如图所示3、实验步骤与结果实验步骤和结果见实验内容4、实验分析与扩展练习实验分析:本次实验通过对数据质量、基本描述、散点图、相关性、重要性五个方面进行内容分析,比较全面地了解了该数据的相关信息,并得到了相应的结果。请总结分析以下问题:(1)针对上述案例,分析保存客户与流失客户的基本费用是否存在显着的差异。(2)如何评价数据质量相关性和重要性有何区别答:(1)根据分析客户流失的样本数的比例(灰色为流失)然

6、后分析基本费用和流失之间的关系,通过建立统计量和绘制散点图最后比较重要度可以得出结论:保存客户与流失客户的基本费用存在显着性差异(2)数据质量是保证数据应用的基础,它的评估标准主要包括四个方面,完整性、相关性、一致性、及时性。评估数据是否达到预期设定的质量要求,就可以通过这四个方面来进行判断。相关性:高质量的数据应该是能充分满足用户使用要求的数据,即数据源和要处理的业务具有很强的联系;重要性:数据有很大价值和影响的性质,能为数据处理提供很多方便2.扩展练习(1)针对上述的五个内容,分别更改一些参数,观察是否对结果造成影响答:内容一:更改“数据审核”中的部分参数,结果如下 左边是没有更改,右边是

7、更改后的,该系数更改无明显变化五、结论与讨论(重点) 通过这次实验,我了解到数据分析是数据挖掘中很重要的一部分,数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中和提炼出来,以找出所研究对象的内在规律。数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程。 分析数据的时候不要盲目,首先要确定你要分析的方向,以更直观的方式表现出来,然后从所得的数据了解这些数据背后所代表的是什么,我们可以以其他方式更好的体现出来吗怎么数据说话能更直观表明问题数据分析的步骤:1、探索性数据分析,当数据刚取得时,可能杂乱无章,看不出规律,通过作图、造表、用各种形式的方程拟合,计算某些特征量等手段探索规律性的可能形式,即往什么方向和用何种方式去寻找和揭示隐含在数据中的规律性。2、模型选定分析,在探索性分析的基础上提出一类或几类可能的模型,然后通过进一步的分析从中挑选一定的模型。3、推断分析,通常使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1