聚类分类.docx
《聚类分类.docx》由会员分享,可在线阅读,更多相关《聚类分类.docx(9页珍藏版)》请在冰豆网上搜索。
聚类分类
聚类分析及其在SPSS中的实现过程
一、实习目的
运用SPSS软件进行层次聚类分析中的系统聚类分析。
二、实习准备
1.SPSS数据统计分析软件;
2.实习数据资料准备。
三、实习内容与步骤(相关名词解释在第五部分里)
1)建立或调用数据文件。
(教材83页表3.4.2)
表1某地区九个农业区的七项经济指标数据
区代号
人均耕地x1hm2/人
劳均耕地x2hm2/个
水田比重x3/%
复种指数x4/%
粮食单产x5/kg·hm-2
人均粮食x6/kg·人-1
稻谷占粮食比重x7/%
G1
0.294
1.093
5.63
113.6
4510.5
1036.4
12.2
G2
0.315
0.971
0.39
95.1
2773.5
683.7
0.85
G3
0.123
0.316
5.28
148.5
6934.5
611.1
6.49
G4
0.179
0.527
0.39
111
4458
632.6
0.92
G5
0.081
0.212
72.04
217.8
12249
791.1
80.38
G6
0.082
0.211
43.78
179.6
8973
636.5
48.17
G7
0.075
0.181
65.15
194.7
10689
634.3
84.17
G8
0.293
0.666
5.35
94.9
3679.5
771.7
7.8
G9
0.167
0.414
2.9
94.8
4213.5
574.6
1.17
2)选择分析变量、选择项,提交运行。
分步骤如下图所示:
。
第一步:
选择分析-分类-系统聚类:
第二步:
添加变量
第三步:
选择项。
在方法选择项中选择聚类和处理数据的方法。
举例:
在SPSS中经过极差标准化处理后,采用欧氏距离(EuclideanDistance)法得到的距离矩阵如表2:
度量标准:
表示距离的计算方法
转换值:
对数据进行标准化的方法。
Z得分:
标准差标准化法
全距从-1到1:
每个值除以全距。
全距从0-1,极差标准化
1的最大量:
极大值标准化
均值为1:
观测值除以均值
标准差为1:
每个值除以标准差
表2九个农业区的七项经济指标数据距离矩阵表
在前述步骤基础上,选用最远距离聚类法,对该地区九个农业区的七项经济指标数据进行聚类。
第四步:
所有选项设定好以后,点OK。
3)输出结果和解释结果。
图1最远距离聚类谱系图
从图1的聚类结果谱系图可知,根据给定的七项经济指标数据,可将该地区分为三种经济类型区,其中G1、G2、G8归为一类,G3、G4、G9归为一类,G5、G7、G6归为一类。
通过这样的聚类分析,在进行农业生产安排时,就可以在同一类型区内采用同一或相近的措施,而在不同类型区之间则应该因地制宜,采用不同的措施来安排生产。
相关术语解释和选项介绍
实验:
下表是15个上市公司2001年的一些主要财务指标,使用系统聚类法这些公司进行聚类,并对结果进行比较分析。