ImageVerifierCode 换一换
格式:DOCX , 页数:24 ,大小:79.20KB ,
资源ID:7040559      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7040559.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(数据分析试题.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

数据分析试题.docx

1、数据分析试题上海第二工业大学 (试卷编号: ) 20112012学年第二学期 数据分析 期末考试卷 A卷姓名: 王赞 学号: 094860117 班级: 09计算A1题 号 一 二 三 得 分一、某医院管理工作者希望了解病人对医院工作的满意程度和病人的年龄、病情的严重程度和忧虑程度之间的关系,他们随机选取了23位病人,得到下表所列数据:(本题40分,每小题5分)1234567891011125036404128494245522929435146484443545048625048532.32.32.21.81.82.92.22.42.92.12.42.44857668989364654267

2、789671314151617181920212223383453363329335529444355515449564649515258502.22.32.22.02.51.92.12.42.32.92.34751576679886049775260(1)拟合关于的线性回归模型,写出回归方程;根据所得的回归模型中回归系数给出初步的分析结果; Anovab模型平方和df均方FSig.1回归4472.72531490.90812.072.000a残差2346.57919123.504总计6819.30422a. 预测变量: (常量), Xi3, Xi1, XI2。b. 因变量: Yi 表一系数a

3、模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)177.44527.8396.374.000Xi1-1.069.326-.514-3.284.004XI2-.839.887-.212-.947.356Xi3-13.19313.221-.228-.998.331a. 因变量: Yi 表二由方差分析看出:F统计量的值为12.072,根据p值检验法知F检验的p值显然小于0.0001,因此拒绝原假设,接受对立假设,即因变量与3个自变量之间具有高度显著的线性回归关系。由表二可以看出,如果显著水平为0.05,而t检验的3个p值分别为0.004、0356、0.331显然小于显著水平,因此拒绝原

4、假设,接受对立假设,则说明因变量和XI1存在着高度显著的线性回归关系,与XI2、XI3没有显著的线性关系。并且得到回归方程为:Yi=177.455-1.069Xi1。其意义是在Xi1每增加一个单位,则减少1.069个单位。(2)、设误差项独立同分布于,在=0.01水平上检验回归关系的显著性;(写出原假设、对立假设和检验统计量) 解:由表1可以看出SSR为4472.725,SSE为2346.579,SST为6619.304; 设y与X1,X2,X3的观测值之间满足关系 ( i=1,218)其中( i=1,218)相互独立,均服从正态分布N(0,),利用SPSS可得到下列分析结果。由此表可知,的估

5、计值2=MSE=123.504,MSR=1490.908 检验假设:H0:H1:至少有一个非零的,统计量F=12.072检验值P从表看几乎接近于零0.6)和从变量的相关系数矩阵可以看出,各变量间的相关性很高,因此变量间所表示的信息量有交叉部分,因此可以进行因子分析。(5)取公共因子数为1时,对进行因子分析,并进行解释;对公共因子得分从小到大进行排序,并进行分析解释。公因子方差初始提取qtjm1.000.989ncjm1.000.979czjm1.000.977提取方法:主成份分析。选取一个因子,从上表可以看出因子可以解释qtim,ncjm,czjm,因此本因子的提取效果是理想的(6)取公共因子

6、数为2时,采用方差最大正交旋转进行因子分析,对公共因子得分从小到大进行排序。再对公共因子进行解释。旋转成份矩阵a成份12qtjm.715.692ncjm.798.600czjm.604.796提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。a. 旋转在 3 次迭代后收敛。因子一只要解释qtjm,ncjm,因子二主要解释czjm。(7)根据第(5)(6)小题的结果分析哪种取法更加合理?为什么? 解: (5)的方法更合理,因为一个因子就可以解释所有变量了。(8)简单说明因子分析中采用正交旋转的目的是什么? 解: 为了使一部分变量仅与第一个因子相关,另一部分变量与第二个因子相

7、关。三、各地区历年电力消费量见附件中数据文件dlxf.sav(单位:亿千瓦小时);变量分别代表2000年、20XX年、20XX年、20XX年、20XX年、20XX年的电力消费:(本大题共20分,每小题4分)(1) 选择三种不同的谱系聚类法聚类,并给出这三种方法分3类的结果;1、采用最长距离:群集成员案例3 群集1:北京 12:天津 13:河北 24:山西 15:内蒙古 16:辽宁 27:吉林 18:黑龙江 19:上海 110:江苏 311:浙江 212:安徽 113:福建 114:江西 115:山东 316:河南 217:湖北 118:湖南 119:广东 320:广西 121:海南 122:重

8、庆 123:四川 124:贵州 125:云南 126:陕西 127:甘肃 128:青海 129:宁夏 130:新疆 1分类结果:第1类:1、2、4、5、7、8、9、12、13、14、17、18、20、21、22、23、24、25、26、27、28、29、30.第2类:3、6、11、16。第3类:10、15、19、2、最短距离:群集成员案例3 群集1:北京 12:天津 13:河北 14:山西 15:内蒙古 16:辽宁 17:吉林 18:黑龙江 19:上海 110:江苏 211:浙江 112:安徽 113:福建 114:江西 115:山东 216:河南 117:湖北 118:湖南 119:广东 3

9、20:广西 121:海南 122:重庆 123:四川 124:贵州 125:云南 126:陕西 127:甘肃 128:青海 129:宁夏 130:新疆 1分类结果:第1类:1,2,、3、4、5、6、7、8、9、11、12、13、14、16、17、18、20、21、22、23、24、25、26、27、28、29、30.第2类:10、15。第3类:19。3、质新法:群集成员案例3 群集1:北京 12:天津 13:河北 24:山西 15:内蒙古 16:辽宁 17:吉林 18:黑龙江 19:上海 110:江苏 211:浙江 212:安徽 113:福建 114:江西 115:山东 216:河南 217:

10、湖北 118:湖南 119:广东 320:广西 121:海南 122:重庆 123:四川 124:贵州 125:云南 126:陕西 127:甘肃 128:青海 129:宁夏 130:新疆 1分类结果:第1类:1、2、4、5、6、7、8、9、12、13、14、17、18、20、21、22、23、24、25、26、27、28、29、30.第2类:3、10、11、15、16。第3类:19。(2) 用快速聚类法进行聚类,分别写出分3类和4类的结果;分为3类为:聚类成员案例号地区聚类距离1北京 2227.3732天津 2197.6493河北 1600.1214山西 1532.4525内蒙古 2404.1

11、096辽宁 1192.5677吉林 2180.9358黑龙江 2278.2959上海 1585.09010江苏 3284.50311浙江 1859.27712安徽 2209.79413福建 2568.94714江西 2209.29415山东 3654.84816河南 1307.87117湖北 2669.44118湖南 2436.85919广东 3897.88020广西 281.10721海南 2852.74122重庆 2264.78323四川 1517.95624贵州 267.38025云南 2131.64826陕西 283.84927甘肃 243.45928青海 2585.65729宁夏 2392.51630新疆 2363.615分类结果:第1类:3、4、6、9、11、16、23。第2类:1、2、5、7、8、12、13、14、17、18、20、21、22、24、25、26、27、28、29、30.第3类:10、15、19。 分为四类为:聚类成员案例号地区聚类距离1北京 2292.7

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1