1、聚类分析实验报告SPSS参考Word一、实验目的及要求:1、目的用SPSS软件实现聚类分析及其应用。2、内容及要求 用SPSS对实验数据运用系统聚类法和K均值聚类法进行分析。二、仪器用具:仪器名称规格/型号数量备注计算机1有网络环境SPSS软件1三、实验方法与步骤:准备工作:把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS数据文件中。分析:由于本实验中要对31个个案进行分类,数量比较大,用系统聚类法当然也可以得出结果,但是相比之下在数据量较大时,K均值聚类法更快速高效,而且准确性更高,因此,在以下的分析过程中,先采用系统聚类法分析,得出相应结果和碎石图(即聚合系数随分类数变
2、化的曲线图),根据碎石图来判定分几类比较合适,然后再用K均值聚类法进行聚类分析得出结果,比较两结果的异同,以得到比较可信的结果。四、实验结果与数据处理:1)用系统聚类法对所有个案进行聚类:采用Z分数对数据进行标准化处理。以下图一为聚类方法为“组间联接”时的冰柱图,图二为聚类方法为“Ward法”时的冰柱图,图三为聚类方法为“质心聚类法”时的冰柱图。不难看出在分五类的情况下,(未标出的所有为一类)图一的分类为:北京;天津;上海、浙江、广东;辽宁、四川、江苏、山东;图二的分类为:北京;天津;上海、海南、浙江、广东;辽宁、四川、江苏、山东;图三的分类为:北京;天津;上海、浙江、广东;辽宁、四川、江苏、
3、山东; 聚类方法为“组间联接”与“质心聚类法”时分五类的情况是一样的,而聚类方法为“Ward法”时与它们两个有些许差别,但总的来说在分五类时,比较可信的结论是北京、天津单独为一类,辽宁、四川、江苏、山东为一类,上海、浙江、广东为一类,在海南省的划分上有些差异,“Ward法”中将其与上海、浙江、广东分为一类,但是其余两个将海南与未列出各省划为一类。图一图二图三2)系统聚类法分析时的碎石图:聚类方法为“组间联接”时的碎石图:聚类方法为“Ward法”时的碎石图:聚类方法为“质心聚类法”时的碎石图:由这三个图可以看出在聚类方法为“Ward法”时的碎石图不如另外两个图落差那么明显,但是综合这三个图来看,
4、分五类还是相对比较合理的,这也是为什么在第一部分的分析中只看了分五类时的情况,而且在下面的K均值聚类分析中,也将指定聚类数为5.3)K均值聚类:在下页表一中显示了样品的分类情况,我们看到,K均值聚类法将所分析的31个省、市、自治区分为这样的五类:1:北京;2:福建、海南;3:辽宁、江苏、山东、四川;4:天津、上海、浙江、广东;5:剩下的20个省、市、自治区。对比之前系统聚类法的分析结果,我们可以明显感觉到二者的聚类结果还是有较大差异的,尽管如此,仍然有相似之处,在两种方法下,都是北京单独为一类,辽宁、四川、江苏、山东为一类,上海、浙江、广东在一类中,所以综合这两种方法得到的这些省、市、自治区的
5、分类应该还是比较可信的。表一 聚类成员案例号省份聚类距离1北京 1.0002天津 44858.5183河北 52437.0694山西 52756.0575内蒙古51259.4286辽宁 31851.9967吉林 52383.7558黑龙江52065.6709上海 44346.78210江苏 32020.99011浙江 42963.42712安徽 51791.58913福建 22648.76514江西 52436.13315山东 31524.88016河南 52522.32017湖北 52225.45918湖南 51700.92919广东 44382.18920广西 51714.00621海南
6、22648.76522重庆 52673.91523四川 32083.99624贵州 52023.43025云南 51628.78126西藏 56160.69327陕西 51786.56128甘肃 53418.50629青海 52981.47930宁夏 52131.25931新疆 51541.829下页表二是方差分析表,这里的F值只能作为描述使用,不能根据该值判断各类均值是否有显著差异。从该表可以看出,所选择的9个变量对分类均有显著贡献。表二 ANOVA聚类误差FSig.均方df均方df房屋平均销售价格34522436.5344261277.01026132.130.000住宅平均销售价格318
7、15585.8584281908.61726112.858.000别墅、高档公寓平均销售价格76657879.13742053147.8852637.337.000经济适用房平均销售价格1967643.2364160745.3562612.241.000办公楼平均销售价格58725137.65542007948.2022629.246.000商业营业用房平均销售价格46733455.7224990173.5372647.197.000其他平均销售价格12044438.36041270360.473269.481.000商品房销售面积9849067.31541066492.321269.235.
8、000住宅销售面积7958587.7134854039.674269.319.000F 检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别。观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。表三 最终聚类中心聚类12345房屋平均销售价格124184914348466062578住宅平均销售价格116484970332463952430别墅、高档公寓平均销售价格1954181967546100354537经济适用房平均销售价格38132000177727231633办公楼平均销售价格1655456095495104594532商业营
9、业用房平均销售价格171486882536382564549其他平均销售价格64163422282358002485商品房销售面积1335.37999.064797.982858.951600.43住宅销售面积1031.43804.364325.202496.011467.77在所分析的9个变量中,前七个为各种房屋的平均销售价格,后两个为商品房和住宅的销售面积。表三为最终聚类中心表,可以看到,第1类地区各种房屋的平均销售价格(前7个变量)最高,其次为第4类,然后是第2类、第3类、第5类。而第3类地区的商品房和住宅销售面积(后2个变量)最大,其次为第4类,然后是第5类、第1类、第2类。4)总结和结论:综上所述,北京地区各种房屋的平均销售价格是最高的,而商品房和住宅的销售面积相对还是比较少的,考虑到该地区的特殊性(为我国的首都),寸土寸金,这样的事实还是可以让人接受的。上海、浙江、广东三个地区各种住房的平均销售价格、商品房和住宅的销售面积都处于第二位,虽然商品房和住宅的销售面积也蛮大,但是人口密度太大,在这种需求大于供给的情况下,房屋价格会高也是必然的。另外,辽宁、江苏、山东、四川四个地区商品房和住宅的销售面积位于五类地区之首,各种住房的平均销售价格排在第四位。 (本资料素材和资料部分来自网络,仅供参考。请预览后才下载,期待您的好评与关注!)
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1