1、统计分析与SPSS的应用第五版课后练习答案第10章教学资料 统 计 分 析 与 SPSS 的应用(第五版)课 后 练 习 答 案 ( 第 1 0 章 )统计分析与SPSS的应用(第五版)(薛薇)课后练习答案第10章SPSS的聚类分析1、根据 高校科研研究.sav数据,利用层次聚类分析对各省市的高校科研情况 进行层次聚类分析。要求:1) 根据凝聚状态表利用碎石图对聚类类数进行研究。2) 绘制聚类树形图,说明哪些省市聚在一起。3) 绘制各类的科研指标的均值对比图。4) 利用方差分析方法分析各类在哪些科研指标上存在显著差异。采用欧氏距离,组间平均链锁法利用凝聚状态表中的组间距离和对应的组数,回归散点
2、图,得到碎石图。大约 聚成4类。步骤:分析分类系统聚类按如下方式设置结果:凝聚计划阶段组合的集群系数首次岀现阶段集群下一个阶段集群1集群2集群1集群212630328.189002 22629638.295107320251053.42300544121209.922001558201505.03503668161760.170509724261831.926021087111929.8910011 19582302.0240622 11024312487.2097022 111272709.88708161222282897.1060019136232916.5510017141019328
3、0.7520025154213491.5854021 116234229.37511021 1176134612.42313020189185377.25300251914225622.41501224206155933.5181702321246827.276161526225247930.76591024236279475.498200262451414959.7042219282591019623.050181427262624042.6692123282791732829.46625029282548360.854262429292991313.5302827303012293834.
4、5030290r.J;.-: r -r+浙江 MJ.-1 士u西 SI 怛i南 wo- 23. NH ls、r-:-lr IGllr. ,;vll 5一蚩 07:-亠 特;r k5;,ii- 勲 2f 31 訴(1 Mlra KJ2 疋, $ J ?击 淄rtI I I I I I I I k I I I I I I k I I k I I I U 1 I I J I k I I k I5-10-1520一30选中数据列,点击“插入”菜单 拆线图11jaa 囲22638那31D53 4234-412A9.922r515C5.WnELJbU.P77iBJl.yMbBH1J29.B9.932502
5、.02+K102437.209I2709.6S712L22997.On1;132916.55114It3280.52R155431J3516164229一切17174612.42JiaLB5307 .JSJ19522.41520ZOSMMiD21216927.276222279JO.T&52323D415JD02414959.W25WS2S0I5皿cu加ruio倔71 Jre nJW 聶壬!;_ kJ alL.Jaw fifeF3曲GBtJi. III Hurtsnfill JGF Mflu旳0/ M LB/hEC I DF11L.2空S344灵瑁廊5別042,聞3&1S2J.C5f7T呷B:
6、B5学I /d均WfiBCTJZTfi /| 1111 /12125k2.4L5再n5W.2MA:HB4删相注童$啤序1515433.J7516L网.幅ITnR5iaIfi3M19192SZ.20爲沁血21212222232S国如.2t2420252626ins皿2Tw.sss曲醱肴n牛3區空,JIT砒宾SL碎石图:由图可知,北京自成一类,江苏、广东、上海、湖南、湖北聚成一类。其 他略。接下来,添加一个变量CLU4_1,其值为类别值。(1、2、3、4),再数 据汇总设置确定。均值对比,依据聚类解,利用分类汇总,计算各个聚类变量的均值CLU *tii ei 样 BIhf 0 r J |TJJ弄说
7、申旳FFFfT-:rl打汁vt诞住f,;,a5站|肌耳|3j得到:(可以看出,分成3类恰当)(2)用K-MEANS聚类方法进行分类,比较分类数为2、3、4时的差别。步骤:分析 分类 K-平均聚类 地区变量导入到标注个案,其他变量全部导 入到变量框中 聚类数填2选项:选中初始聚类中心和 ANOVA 继续 确+-L K 半:-由兴*.侑AMitilVahOvaI m ?羔匕独陰wiWS I0 I刊囲*ft.卜亭叮 Ic FTiW(呼* 日販巫亘得到:ANOVA聚类错误F显著性均方df均方df食品13927902.9671246753.7792956.445.000衣着278718.56513755
8、5.425297.422.011居住667583.436131940.7642920.901.000家庭设备用品及服务411657.258114558.0412928.277.000医疗保健325304.302134400.296299.456.005交通和通信10285607.457157486.40029178.922.000教育文化娱乐服务5226361.465169080.9332975.656.000杂项商品和服务248312.93116496.5502938.222.000仅当岀于描述目的时才应该使用 F检验,因为已选择聚类用于将不同聚类中的个案的差异最大化。 受观察的显著性级别并
9、未因此得到更正,所以无法将这些级别解释为“聚类方法是等同的”假设的检验。每个聚类中的个案数量聚类14.000227.000有效31.000缺失.000将上图中的聚类数修改为3,则得到:ANOVA聚类错误F显著性均方df均方df食品8311754.5092159294.7702852.178.000衣着100878.509241645.317282.422.107居住565811.147216508.6902834.274.000家庭设备用品及服务237257.836212833.0272818.488.000医疗保健198689.996233054.746286.011.007交通和通信470
10、9934.064290458.7482852.067.000教育文化娱乐服务2676015.304267059.9262839.905.000杂项商品和服务150742.66624829.5552831.213.000仅当岀于描述目的时才应该使用 F检验,因为已选择聚类用于将不同聚类中的个案的差异最大化。 受观察的显著性级别并未因此得到更正,所以无法将这些级别解释为“聚类方法是等同的”假设的检验。每个聚类中的个案数量聚类11.000225.00035.000有效31.000缺失.000将上图中的聚类数修改为4,则得到:ANOVA聚类错误F显著性均方df均方df食品6461251.5973629
11、63.25127102.619.000衣着135334.013335623.106273.799.022居住237725.271332618.140277.288.001家庭设备用品及服务142250.914315077.322279.435.000医疗保健111992.289336553.186273.064.045交通和通信3596731.324343056.2632783.536.000教育文化娱乐服务1812882.568366335.5862727.329.000杂项商品和服务97486.29135342.7412718.246.000仅当岀于描述目的时才应该使用 F检验,因为已选择
12、聚类用于将不同聚类中的个案的差异最大化。 受观察的显著性级别并未因此得到更正,所以无法将这些级别解释为“聚类方法是等同的”假设的检验。每个聚类中的个案数量聚类11.00023.000315.000412.000有效31.000缺失.000从3个ANOVA表可以看出,分为2类时,P-值均小于0.05,表明有显著差异;分 为3类时,出现了 “衣着”的P-值为0.107,大于0.05;分为4类时,P-值均小于 0.05,表明有显著差异。表明仅从ANOVA表看,分为3类,不合适。再看F值,F值大表明组间差大,组内差小,即类内相似性大,类间差异性大,经比较可以看出,分类2类时,组间方差和组内方差均较大,而分为 4类时,组 间方差和组内方差相对来说,组内方差缩小得明显一些。故分为4类较为恰当。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1