1、主成分分析报告和聚类分析报告建筑工程学院理学院信息与计算科学专业实验报告课程名称数据分析实验名称主成分分析和聚类分析实验地点:基础楼G423日期2016.5.5丽芝 班级 信131 学号 8 指导教师王恒友成 绩【实验目的】(I)熟悉利用主成分分析进行数据分析,能够使用SPSS软件完成数据的主成分分析;(2)熟悉利用聚类分析进行数据分析,能够运用主成分分析的结果,做进一步分析,如聚类分析、回归分析等,能够使用SPSS软件完成该任务。【实验要求】根据各个题目的具体要求,分别运用SPSS软件完成实验任务。【实验容】1、表4.9(数据见exercise4_5.txt)给出了 1991年我国30个省市
2、、城镇居民的月平均消费数据,所考察的八个指标如下:(单位均为元/人)XI:人均粮食支出;X2 :人均副食支出;X3:人均烟酒茶支出;X4:人均其他副食支出;X5:人均衣看商品支出;X6:人均日用品支出;X7:人均燃料支出;X&人均非商品支出。(1)求样本相关系数矩阵Ro(2 )从R出发做主成分分析,求出各主成分的贡献率及前两个主成分的累积贡献率;2、( 1)对题1中的数据,按照原有的八个指标,对30个省份进行聚类,给出分为3类 的聚类结果。(2 )利用题1得到的前2个主成分指标f分别按最短距离法(最近邻居距离最长距 离法(最远邻居距离X类平均距离法(组间平均距离重心距离法;其中距离均采用欧式
3、平方距离,对样本进行谱系聚类分析,并画出谱系聚类图;给出分为3类的聚类结果。并与(1)的结果进行比较【实验步骤】(此部分主要包括实验过程、方法、结果、对结果的分析、结论等)1)相矢矩阵V2V3习V5V6V7V8V9相尖 V21.000.334-.055-.061-.289.199 349 319V3.3341.000-.023 399-.156.711.414.835V4-.055-.0231.000 533.497 033-.139-.258V5-.061.399.5331.000.698.468-.171 313V6-.289-.156.497 6981.000.280-.208-.081
4、V7.199 711.033 468.2801.000.417.702V8.349 414-.139-.171-.208.4171.000.399V9.319.835-.258 313-.081.702.3991.0002)表:方差贡献率和累计贡献率解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方逻的%累积%合计方差的%累积%合计方盪的%累枳%13.09638.70438.7043.09638.70438.7043.07938.48538.48522.36729.59068.2942.36729.59068.2942.38529.80968.2943.92011.50079.794
5、4.7068.82488.6185.4986.23194.8486.2302.87497.7227.1311.63599.3578.051.643100.000解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的%累枳%合计方澄的%累积%合计方渥的%累枳%13.09638.70438.7043.09638.70438.7043.07938.48538.48522.36729.59068.2942.36729.59068.2942.38529.80968.2943.92011.50079.7944.7068.82488.6185.4986.23194.8486.2302.87497.
6、7227.1311.63599.3578.051.643100.000提取方法:主成份分析。由上图可知,只有前两个成分的特征值大于1,所以只选择前两个主成分。第一个主成分的 方差贡献率是38.704%,第二个主成分的方差贡献率是29.590%,前两个主成分的方差占所有 主成分方差的64.294%o前两个主成分的累计贡献率为68.294%,选择前两个主成分即可代表 绝大多数原来的变量。聚类123V28.798.4810.38V347.0531.1470.37V48.827.076.76V512.809.1416.73V616.9616.3117.29V712.8010.2118.56V81.88
7、1.783.09V913.6311.5124.20最终聚类中心聚类110.000218.00032.000有效30.000缺失.000每个聚类中的案例数山上图可知,聚类2包含样本数最多,聚类3包含样本数最少。通过K中心聚类分析,可以对 我国各地区生活中的人均支出类别情况有一个基本的了解。我们可以将不同地区的人均消费 情况分为3类;其中第二类包含的省市最多,有18个,其他两类包含城市较少。通过分析结果 也可知每个地区所属类别。(2)按最短距离法(最近邻居距离)对样本进行谱系聚类分析聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1辞集21123.29900152564.854003357
8、4.9102064896.3140065121310.409001065810.539347751011.73060983412.4690014951115.194701410121417.539501211151618.698001312121819.2641001313121520.778121116143522.7788915151325.4071141816121727.956130191724253374800191811937.4141502019122437.9451617202011238.07018192321212239.765002222212347.4322102523
9、12052.468200242412664.048230252512182.0532422262612782.0662502727128259.4092602828129300.2232702929130396.7752800山聚类表可知聚类的具体过程。以第一步为例,样品1和2合并为一类,距离系数为3.299, 在“首次出现阶段集群”里显示为0,因此合并两项都是第一次出现,合并结果取15,即归 为第15类。群集成员案例3群集1:12:13:14:15:16:17:18:19:110:111:112:113:114:115:116:117:118:119:120:121:122:r 西123:1
10、24:125:126:127:128:129:230:3集群成员表如图,当划分为3个类別时,各个地区所属类別。与上一问所得结论有较大出入。上图直观的反应了样品逐步合并的过程。最长距离法(最远邻居距离)聚类表阶群集组合系数首次出现阶辞集下一阶群集1群集2群集1群集21123.29900152564.8540053896.3140074121310.40900855712.276201663412.4690010781015.29430158121417.55940129151618.69800121031127.077601711171827.956001812121528.8558918132
11、42533.748002214212239.7650021151840.8871716161549.52015517171367.77816102318121768.93112112019262782.066002420121986.81718022212123102.21614027221224160.50320132623120219.10817028242628333.01319026252930396.7750027261226459.195222428272129821.70621252928112846.540232629291213198.12928270群集成员案例3辞集1:2
12、:3:4:5:6:7:8:9:10:11:12:13:14:15:16:17:18:19:20:21:22:r 西23:24:25:26:27:28:29:30:111111111112222222213332222233*zr14161e19a 292122羽丹旳类平均距离法(组间平均距离)聚类表阶群集组合系数首次出现阶辞集下一阶群集1辞集2群集1群集21123.29900172564.8540043896.3140074578.59320145121310.40900863412.4690013781013.51230108121417.54950119151618.69800111081
13、121.704701311121524.981891812171827.9560018133832.35061014143532.6511341715242533.748002016212239.7650021171340.4371142418121747.82411121919121968.6451802220242674.0411502321212374.82416025221220110.18419024232427126.9262002524112134.045172227252124197.455212327262930396.775002927121453.036242528281
14、28489.84727029291291591.22728260群集成员案例3辞集1:12:13:14:15:16:17:18:19:110:111:112:113:114:115:116:117:118:119:120:121:122:r 西123:124:125:126:127:128:229:330:3重心距离法聚类表阶群集组合系数首次出现阶群集下一阶群集1辞集2群集1群集21123.29900142564.8540043896.3140064577.37920135121310.409008681011.93330973412.46900128121414.94750119811800
15、060121015161&698001111121515.25081016123823.0807913133519.93212414141327.5201132315171827.956001616121732.27211151917242533.748002118212239.765002019121953.9451602220212364.8831802521242665.6051702422122091.421190232311294.200142226242427106.72321025252124141.24620242626121346.67423252727128375.15626029282930396.775002929129136&51827280群集成员案例3辞集1:12:13:14:15:16:17:18:19:110:111:112:113:114:115:116:117:118:119:120:121:122:r 西123:124:125:126:127:128:129:230:3使用质心联搖的厨状图
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1