SPSS因子聚类案例分析报告文档格式.docx
《SPSS因子聚类案例分析报告文档格式.docx》由会员分享,可在线阅读,更多相关《SPSS因子聚类案例分析报告文档格式.docx(17页珍藏版)》请在冰豆网上搜索。
16.13%
20.01%
27.69%
浦发银行
1.42%
0.58%
94.29%
12.45%
25.55%
16.01%
15.31%
17.17%
建设银行
1.80%
0.99%
93.20%
14.32%
13.24%
15.64%
13.57%
13.77%
中国银行
1.48%
93.21%
13.63%
12.19%
8.23%
4.04%
7.19%
农业银行
1.33%
94.33%
12.61%
18.42%
14.10%
12.90%
13.40%
工商银行
1.76%
0.85%
93.77%
13.66%
13.30%
13.00%
10.00%
10%
交通银行
1.43%
0.92%
92.77%
14.07%
7.31%
15.05%
13.56%
14.36%
招商银行
1.75%
0.61%
94.12%
12.14%
25.75%
16.05%
21.94%
中信银行
1.41%
0.74%
93.14%
13.44%
-7.04%
15.96%
14.59%
7.02%
民生银行
1.58%
0.76%
94.58%
10.75%
27.62%
3.53%
2.76%
8.44%
(三)实验步骤
1、选择菜单
2、选择参与因子分析的变量到(变量V)框中
3、选择因子分析的样本
4、在所示窗口中点击(描述D)按钮,指定输出结果,输出基本统计量、图形等
5、在所示窗口中点击(抽取E)按钮指定提取因子的方法为:
主成分分析法
6、在所示的窗口中点击(旋转T)按钮选择因子旋转方法
7、在所示窗口中点击(得分S)按钮选择计算因子得分的方法
8、在所示窗口中点击(选项)按钮
(四)实验结果及分析
分析结果如下表所示。
相关性矩阵
相关性
.383
-.144
-.404
-.359
-.207
-.025
-.009
-.086
.563
-.166
.105
.494
-.479
.357
.044
-.392
1.000
-.366
-.345
.159
.922
.551
.738
显著性(单尾)
.137
.346
.124
.154
.283
.472
.490
.407
.045
.323
.386
.073
.081
.155
.452
.131
.149
.164
.330
.000
.049
.007
通过观察原始变量的相关系数矩阵,可以看到,矩阵中存在许多比较高的相关系数,并且大多数变量通过了原假设为相应变量之间的相关系数为0的t假设。
相关系数实际上反映的是公共因子起作用的空间,相关系数越大,表明数据适合做因子分析。
KMO和巴特利特检验
KMO取样适切性量数。
.518
巴特利特球形度检验
近似卡方
50.188
自由度
28
显著性
.006
同时,KMO级Bartlett检验是否适合做因子分析。
以上是KMO级Bartlett检验结果,由表可知:
KMO值为0.518,说明该数据适合做因子分析。
上表中的巴特利特球体检验的X统计值的显著性概率是O.000,小于1%,因此拒绝原假设,说明数据具有相关性,适宜做因子分析。
反映像矩阵
反映像协方差矩阵
-.075
.025
-.005
.038
.031
-.012
-.031
-.064
-.001
-.007
.027
-.002
-.021
.011
.015
.207
-.026
.034
-.107
.018
.020
-.032
.175
反映像相关性矩阵
-.277
-.273
.306
-.019
.113
.266
-.114
-.101
-.464
-.158
.214
-.018
-.524
.307
.146
.496a
-.358
.533
-.560
-.932
.269
.503a
-.542
.651a
a.取样适切性量数(MSA)
反映像矩阵在其对角线上的数字若大于0.05(出口合同为0.406)则适合因子分析,小于0.05则不适合因子分析。
从表中得知,适合做因子分析。
公因子方差
初始
提取
.818
.519
.912
.928
.786
.953
.979
.865
提取方法:
主成分分析法。
变量共同度,它刻划了全部公共因子对各个变量的总方差所作的贡献,也称为公因子方差,从上表中可以得到变量共同度大部分都接近1,说明该变量的几乎全部原始信息都被所选取的公共因子说明了,也就是说,由原始变量空间转为因子空间转化的性质较好,保留原来信息量多,因此,
是
方差的重要组成部分。
检验可以做因子分析后,我们通过因子分析得到相应的特征值和对应因子的贡献率,如下表所示
成分
初始特征值
提取载荷平方和
旋转载荷平方和
总计
方差百分比
累积%
方差的%
1
2.800
34.998
2.664
33.302
2
2.671
33.383
68.381
2.646
33.070
66.372
3
1.288
16.104
84.485
1.449
18.113
4
10.225
94.710
5
.221
2.757
97.466
6
1.922
99.389
7
.478
99.867
8
.133
100.000
综合因子F,,F2,F3的特征值大于1,且对原始数据的累积贡献率达到了84.485%,其中F1的贡献率最强,达到了34.998%,F2的贡献率达到了33.383%,F3的贡献率也达到了16.104%。
这三个因子的贡献率都远远大于其它因子的贡献率,因此,F1,F2,F3是决定商业银行竞争力强弱的关键因子。
从碎石图中得到,第1个因子的特征值高于其他项,对解释原有变量的贡献最大;
第5个因子之后的特征值都小,对解释原有变量的贡献较小;
因此我们可以取3个或4个因子较为合适。
成分矩阵a
.897
-.157
.187
.892
.400
.150
.685
.607
.339
-.367
.873
.475
-.822
-.104
-.789
.391
-.596
-.006
.680
-.040
.239
-.678
a
a.提取了3个成分。
表中给出旋转前的因子载荷阵,从中可以看出,每个因子在不同原始变量上的载荷没有明显的差别,3个因子的实际含义比较模糊。
为了避免初始因子综合性太强,难以找出因子的实际意义的问题,需要通过旋转坐标轴,使负载尽可能向正负0或1的方向靠近,从而降低因子的综合性,使其真实意义凸现出来。
下面使用的因子旋转方法为方差最大正交旋转法,目的是使旋转后的因子载荷矩阵的结构简化,便于对各个公共因子进行合理的解释,同时保证每一个公共因子反映的信息量尽量最大。
旋转后的成分矩阵a
-.962
.051
.951
.084
.602
-.267
.593
.977
-.153
-.302
.016
.493
.788
.023
-.347
-.322
.771
-.131
-.151
-.692
旋转方法:
凯撒正态化最大方差法。
a.旋转在4次迭代后已收敛。
表中给出旋转后的因子载荷阵,从表中可以看出,经过旋转后的载荷系数已经明显的两极分化了。
第一个公共因子在指标X2每股收益增长率、X3资产负债率、X4资本充足率上有较大载荷,说明这3个指标有较强的关联性,可以归为一类,因此可以把第一个因子命名为“流动因子”;
第二个公共因子在指标X6贷款增长率、X7存款增长率、X8总资产增长率上有较大载荷,同样可以归为一类,第二个因子可以命名为“发展因子”;
同理,X1资产利润率、X5不良贷款率归到第3类,将其命名为“安全和盈利因子”。
在三维空间组件图中,各因子更接近于组价几,接近组件几对应的是‘旋转后的成分矩阵’的成分几。
成分得分系数矩阵
-.165
-.029
.544
-.138
-.516
.359
.012
-.034
-.368
.046
.072
.203
-.051
.370
.378
-.016
.371
.003
.167
.304
.083
组件得分。
表中给出了因子得分系数矩阵,根据表中的因子得分系数和原始变量的标准化值就可以计算出每个观测值的各因子的得分。
旋转后的因子得分表达式可以写成:
F1=-0.165x1+0.203x2+0.359x3-0.368x4-0.009x5-0.138x6-0.016x7+0.167x8
F2=-0.029x1-0.051x2+0.012x3+0.046x4-0.138x5+0.378x6+0.371x7+0.304x8
F3=0.544x1+0.370x2-0.034x3+0.072x4-0.516x5+0.137x6+0.003x7+0.083x8
五、结论
本文通过采用多元统计分析中的因子分析法对国有商业银行的经营绩效加以评价,从盈利能力、安全能力和发展能力三方面来具体分析我国上市商业银行竞争力,对上市银行及非上市银行具有一定的指导作用。
商厦评分
(一)实验目的:
本实验目的利用SPSS层次聚类对商厦评分进行分类分析,以了解了解各商厦之间的相互关系。
(2)实验资料:
编号
购物环境
服务质量
A商厦
73
68
B商厦
66
64
C商厦
84
82
D商厦
91
88
E商厦
94
90
(三)实验步骤:
表一
聚类成员
个案
3个聚类
2个聚类
1:
2:
3:
4:
5:
表一可知,当聚成3类时,A,B俩个商厦为一类,C商厦自成一类,D,E两个商厦为一类;
当聚成两类时,A,B俩个商厦为一类,C,D,E三个商厦为一类,SPSS的层次聚类能够产生任意类数的分类结果。
图一
图一,可知,D商厦与E商厦的距离最近,首先合并成一类,其次,合并的是A,B俩个商厦它们的距离比D商厦与E商厦大,最后是合并C商厦。
最后聚城一体。
图二:
图二,可知,当聚成4类时,D,E两个商厦为一类;
其他各商厦自成一类,聚成3类时,A,B俩个商厦为一类,C商厦自成一类,D,E两个商厦为一类;
当聚成两类时,A,B俩个商厦为一类,C,D,E三个商厦为一类。
表二
初始聚类中心
聚类
94.00
66.00
84.00
90.00
64.00
82.00
表二,可知,3个初始类中心点的数据,分别为(94,90)(66,64)(84,82)可见第一类最优,第三类次之,第二类最差。
表三
迭代历史记录a
迭代
聚类中心中的变动
1.803
4.031
a.由于聚类中心中不存在变动或者仅有小幅变动,因此实现了收敛。
任何中心的最大绝对坐标变动为.000。
当前迭代为2。
初始中心之间的最小距离为12.806。
表三,可知,第一次迭代后,3个类中心点分别偏移了1.803,4.013.0.000,第2类中心点的偏移最大,在第3类和第二次迭代时中心点偏移均小于判定标准(0.02),聚类分析结束。
表四
最终聚类中心
92.50
69.50
89.00
表四,可知,最终类中心点的情况,分别为(92.5,89)(69.5,66)(84,82)仍然可见第一类为最优,第三类第二,第二类效果最差。
表五
ANOVA
误差
F
均方
268.100
14.500
18.490
272.600
5.000
54.520
由于已选择聚类以使不同聚类中个案之间的差异最大化,因此F检验只应该用于描述目的。
实测显著性水平并未因此进行修正,所以无法解释为针对“聚类平均值相等”这一假设的检验。
由表五,展现了各指标在不同的均值比较情况,各数据项的含义依次为组间均方、组间自由度、组内均方、组内自由度、F统计量的观察值以及对应的概率P-值。
仍然看出第二类的差异最大。
(三)实验结论:
因此,在总数为五,有效数值为五的情况下的聚类分析可得,E商厦属最优类;
C,D商厦属良好类;
A,B商厦属合格类。