SPSS因子聚类案例分析报告.docx
《SPSS因子聚类案例分析报告.docx》由会员分享,可在线阅读,更多相关《SPSS因子聚类案例分析报告.docx(17页珍藏版)》请在冰豆网上搜索。
SPSS因子聚类案例分析报告
喀什大学实验报告
《多元统计分析SPSS》
实验报告
实验课程:
基于SPSS的数据分析
实验地点:
现代商贸实训中心实验室名称:
经济统计实验室
学院:
xxx学院年级专业班:
xxx班
学生姓名:
xxx学号:
20131808015
完成时间:
2016年x月x日
开课时间:
2016至2017学年第1学期
成绩
教师签名
批阅日期
实验项目:
中国上市银行竞争力分析
(一)实验目的
本实验目的围绕上市商业银行竞争力这一主线,遵循一般理论、具体分析到对策建议的研究思路,以我国国内上市的十家商业银行为研究对象,采用其2012年度财务报告的数据,从盈利能力、安全能力和发展能力三方面共选取了8个重要指标,试图通过这些指标量化影响竞争力的因素,构建我国上市商业银行的竞争力评价指标体系,并运用因子分析方法,对我国上市商业银行的竞争力状况进行了分析评价。
最后针对分析的结果,通过对我国上市银行竞争力进行优劣势比较,提出了提升我国上市商业银行竞争力的一些建议。
(二)实验资料
通过对资产利润率、不良贷款率、资产负债率、资本充足率、每股收益增长率、贷款增长率、存款增长率、总资产增长率等指标的选择分析不同指标在进行因子分析时所考虑的因素是否存在差异,影响我国上市商业银行的竞争力状况的因素与上述指标是否有关。
具体数据如下所示:
十家同类型上市商业银行2012年指标
盈利能力
安全能力
发展能力
资产利润率
不良贷款率
资产负债率
资本充足率
每股收益增长率
贷款增长率
存款增长率
总资产增长率
平安银行
1.09%
0.95%
94.72%
11.37%
6.07%
16.13%
20.01%
27.69%
浦发银行
1.42%
0.58%
94.29%
12.45%
25.55%
16.01%
15.31%
17.17%
建设银行
1.80%
0.99%
93.20%
14.32%
13.24%
15.64%
13.57%
13.77%
中国银行
1.48%
0.95%
93.21%
13.63%
12.19%
8.23%
4.04%
7.19%
农业银行
1.42%
1.33%
94.33%
12.61%
18.42%
14.10%
12.90%
13.40%
工商银行
1.76%
0.85%
93.77%
13.66%
13.30%
13.00%
10.00%
10%
交通银行
1.43%
0.92%
92.77%
14.07%
7.31%
15.05%
13.56%
14.36%
招商银行
1.75%
0.61%
94.12%
12.14%
25.75%
16.05%
14.07%
21.94%
中信银行
1.41%
0.74%
93.14%
13.44%
-7.04%
15.96%
14.59%
7.02%
民生银行
1.58%
0.76%
94.58%
10.75%
27.62%
3.53%
2.76%
8.44%
(三)实验步骤
1、选择菜单
2、选择参与因子分析的变量到(变量V)框中
3、选择因子分析的样本
4、在所示窗口中点击(描述D)按钮,指定输出结果,输出基本统计量、图形等
5、在所示窗口中点击(抽取E)按钮指定提取因子的方法为:
主成分分析法
6、在所示的窗口中点击(旋转T)按钮选择因子旋转方法
7、在所示窗口中点击(得分S)按钮选择计算因子得分的方法
8、在所示窗口中点击(选项)按钮
(四)实验结果及分析
分析结果如下表所示。
相关性矩阵
每股收益增长率
贷款增长率
存款增长率
总资产增长率
相关性
资产利润率
.383
-.144
-.404
-.359
不良贷款率
-.207
-.025
-.009
-.086
资产负债率
.563
-.166
.105
.494
资本充足率
-.479
.357
.044
-.392
每股收益增长率
1.000
-.366
-.345
.159
贷款增长率
-.366
1.000
.922
.551
存款增长率
-.345
.922
1.000
.738
总资产增长率
.159
.551
.738
1.000
显著性(单尾)
资产利润率
.137
.346
.124
.154
不良贷款率
.283
.472
.490
.407
资产负债率
.045
.323
.386
.073
资本充足率
.081
.155
.452
.131
每股收益增长率
.149
.164
.330
贷款增长率
.149
.000
.049
存款增长率
.164
.000
.007
总资产增长率
.330
.049
.007
通过观察原始变量的相关系数矩阵,可以看到,矩阵中存在许多比较高的相关系数,并且大多数变量通过了原假设为相应变量之间的相关系数为0的t假设。
相关系数实际上反映的是公共因子起作用的空间,相关系数越大,表明数据适合做因子分析。
KMO和巴特利特检验
KMO取样适切性量数。
.518
巴特利特球形度检验
近似卡方
50.188
自由度
28
显著性
.006
同时,KMO级Bartlett检验是否适合做因子分析。
以上是KMO级Bartlett检验结果,由表可知:
KMO值为0.518,说明该数据适合做因子分析。
上表中的巴特利特球体检验的X统计值的显著性概率是O.000,小于1%,因此拒绝原假设,说明数据具有相关性,适宜做因子分析。
反映像矩阵
每股收益增长率
贷款增长率
存款增长率
总资产增长率
反映像协方差矩阵
资产利润率
-.075
-.025
.025
-.005
不良贷款率
.038
.031
-.012
-.031
资产负债率
-.064
-.001
-.007
.027
资本充足率
-.002
-.021
.011
.015
每股收益增长率
.207
-.026
.034
-.107
贷款增长率
-.026
.025
-.021
.018
存款增长率
.034
-.021
.020
-.032
总资产增长率
-.107
.018
-.032
.175
反映像相关性矩阵
资产利润率
-.277
-.273
.306
-.019
不良贷款率
.113
.266
-.114
-.101
资产负债率
-.464
-.031
-.158
.214
资本充足率
-.018
-.524
.307
.146
每股收益增长率
.496a
-.358
.533
-.560
贷款增长率
-.358
.496a
-.932
.269
存款增长率
.533
-.932
.503a
-.542
总资产增长率
-.560
.269
-.542
.651a
a.取样适切性量数(MSA)
反映像矩阵在其对角线上的数字若大于0.05(出口合同为0.406)则适合因子分析,小于0.05则不适合因子分析。
从表中得知,适合做因子分析。
公因子方差
初始
提取
资产利润率
1.000
.818
不良贷款率
1.000
.519
资产负债率
1.000
.912
资本充足率
1.000
.928
每股收益增长率
1.000
.786
贷款增长率
1.000
.953
存款增长率
1.000
.979
总资产增长率
1.000
.865
提取方法:
主成分分析法。
变量共同度,它刻划了全部公共因子对各个变量的总方差所作的贡献,也称为公因子方差,从上表中可以得到变量共同度大部分都接近1,说明该变量的几乎全部原始信息都被所选取的公共因子说明了,也就是说,由原始变量空间转为因子空间转化的性质较好,保留原来信息量多,因此,
是
方差的重要组成部分。
检验可以做因子分析后,我们通过因子分析得到相应的特征值和对应因子的贡献率,如下表所示
成分
初始特征值
提取载荷平方和
旋转载荷平方和
总计
方差百分比
累积%
总计
方差百分比
累积%
总计
方差的%
累积%
1
2.800
34.998
34.998
2.800
34.998
34.998
2.664
33.302
33.302
2
2.671
33.383
68.381
2.671
33.383
68.381
2.646
33.070
66.372
3
1.288
16.104
84.485
1.288
16.104
84.485
1.449
18.113
84.485
4
.818
10.225
94.710
5
.221
2.757
97.466
6
.154
1.922
99.389
7
.038
.478
99.867
8
.011
.133
100.000
综合因子F,,F2,F3的特征值大于1,且对原始数据的累积贡献率达到了84.485%,其中F1的贡献率最强,达到了34.998%,F2的贡献率达到了33.383%,F3的贡献率也达到了16.104%。
这三个因子的贡献率都远远大于其它因子的贡献率,因此,F1,F2,F3是决定商业银行竞争力强弱的关键因子。
从碎石图中得到,第1个因子的特征值高于其他项,对解释原有变量的贡献最大;第5个因子之后的特征值都小,对解释原有变量的贡献较小;因此我们可以取3个或4个因子较为合适。
成分矩阵a
成分
1
2
3
总资产增长率
.897
-.157
.187
存款增长率
.892
.400
.150
贷款增长率
.685
.607
.339
资本充足率
-.367
.873
.175
资产负债率
.475
-.822
-.104
每股收益增长率
-.107
-.789
.391
资产利润率
-.596
-.006
.680
不良贷款率
-.040
.239
-.678
提取方法:
主成分分析法。
a
a.提取了3个成分。
表中给出旋转前的因子载荷阵,从中可以看出,每个因子在不同原始变量上的载荷没有明显的差别,3个因子的实际含义比较模糊。
为了避免初始因子综合性太强,难以找出因子的实际意义的问题,需要通过旋转坐标轴,使负载尽可能向正负0或1的方向靠近,从而降低因子的综合性,使其真实意义凸现出来。
下面使用的因子旋转方法为方差最大正交旋转法,目的是使旋转后的因子载荷矩阵的结构简化,便于对各个公共因子进行合理的解释,同时保证每一个公共因子反映的信息量尽量最大。
旋转后的成分矩阵a
成分
1
2
3
资本充足率
-.962
.051
.020
资产负债率
.951
.084
.011
每股收益增长率
.602
-.267
.593
存款增长率
-.001
.977
-.153
贷款增长率
-.302
.928
.016
总资产增长率
.493
.788
.023
资产利润率
-.347
-.322
.771
不良贷款率
-.131
-.151
-.692
提取方法:
主成分分析法。
旋转方法:
凯撒正态化最大方差法。
a
a.旋转在4次迭代后已收敛。
表中给出旋转后的因子载荷阵,从表中可以看出,经过旋转后的载荷系数已经明显的两极分化了。
第一个公共因子在指标X2每股收益增长率、X3资产负债率、X4资本充足率上有较大载荷,说明这3个指标有较强的关联性,可以归为一类,因此可以把第一个因子命名为“流动因子”;第二个公共因子在指标X6贷款增长率、X7存款增长率、X8总资产增长率上有较大载荷,同样可以归为一类,第二个因子可以命名为“发展因子”;同理,X1资产利润率、X5不良贷款率归到第3类,将其命名为“安全和盈利因子”。
在三维空间组件图中,各因子更接近于组价几,接近组件几对应的是‘旋转后的成分矩阵’的成分几。
成分得分系数矩阵
成分
1
2
3
资产利润率
-.165
-.029
.544
不良贷款率
-.009
-.138
-.516
资产负债率
.359
.012
-.034
资本充足率
-.368
.046
.072
每股收益增长率
.203
-.051
.370
贷款增长率
-.138
.378
.137
存款增长率
-.016
.371
.003
总资产增长率
.167
.304
.083
提取方法:
主成分分析法。
旋转方法:
凯撒正态化最大方差法。
组件得分。
表中给出了因子得分系数矩阵,根据表中的因子得分系数和原始变量的标准化值就可以计算出每个观测值的各因子的得分。
旋转后的因子得分表达式可以写成:
F1=-0.165x1+0.203x2+0.359x3-0.368x4-0.009x5-0.138x6-0.016x7+0.167x8
F2=-0.029x1-0.051x2+0.012x3+0.046x4-0.138x5+0.378x6+0.371x7+0.304x8
F3=0.544x1+0.370x2-0.034x3+0.072x4-0.516x5+0.137x6+0.003x7+0.083x8
五、结论
本文通过采用多元统计分析中的因子分析法对国有商业银行的经营绩效加以评价,从盈利能力、安全能力和发展能力三方面来具体分析我国上市商业银行竞争力,对上市银行及非上市银行具有一定的指导作用。
实验项目:
商厦评分
(一)实验目的:
本实验目的利用SPSS层次聚类对商厦评分进行分类分析,以了解了解各商厦之间的相互关系。
(2)实验资料:
编号
购物环境
服务质量
A商厦
73
68
B商厦
66
64
C商厦
84
82
D商厦
91
88
E商厦
94
90
(三)实验步骤:
表一
聚类成员
个案
3个聚类
2个聚类
1:
A商厦
1
1
2:
B商厦
1
1
3:
C商厦
2
2
4:
D商厦
3
2
5:
E商厦
3
2
表一可知,当聚成3类时,A,B俩个商厦为一类,C商厦自成一类,D,E两个商厦为一类;当聚成两类时,A,B俩个商厦为一类,C,D,E三个商厦为一类,SPSS的层次聚类能够产生任意类数的分类结果。
图一
图一,可知,D商厦与E商厦的距离最近,首先合并成一类,其次,合并的是A,B俩个商厦它们的距离比D商厦与E商厦大,最后是合并C商厦。
最后聚城一体。
图二:
图二,可知,当聚成4类时,D,E两个商厦为一类;其他各商厦自成一类,聚成3类时,A,B俩个商厦为一类,C商厦自成一类,D,E两个商厦为一类;当聚成两类时,A,B俩个商厦为一类,C,D,E三个商厦为一类。
表二
初始聚类中心
聚类
1
2
3
购物环境
94.00
66.00
84.00
服务质量
90.00
64.00
82.00
表二,可知,3个初始类中心点的数据,分别为(94,90)(66,64)(84,82)可见第一类最优,第三类次之,第二类最差。
表三
迭代历史记录a
迭代
聚类中心中的变动
1
2
3
1
1.803
4.031
.000
2
.000
.000
.000
a.由于聚类中心中不存在变动或者仅有小幅变动,因此实现了收敛。
任何中心的最大绝对坐标变动为.000。
当前迭代为2。
初始中心之间的最小距离为12.806。
表三,可知,第一次迭代后,3个类中心点分别偏移了1.803,4.013.0.000,第2类中心点的偏移最大,在第3类和第二次迭代时中心点偏移均小于判定标准(0.02),聚类分析结束。
表四
最终聚类中心
聚类
1
2
3
购物环境
92.50
69.50
84.00
服务质量
89.00
66.00
82.00
表四,可知,最终类中心点的情况,分别为(92.5,89)(69.5,66)(84,82)仍然可见第一类为最优,第三类第二,第二类效果最差。
表五
ANOVA
聚类
误差
F
显著性
均方
自由度
均方
自由度
购物环境
268.100
2
14.500
2
18.490
.051
服务质量
272.600
2
5.000
2
54.520
.018
由于已选择聚类以使不同聚类中个案之间的差异最大化,因此F检验只应该用于描述目的。
实测显著性水平并未因此进行修正,所以无法解释为针对“聚类平均值相等”这一假设的检验。
由表五,展现了各指标在不同的均值比较情况,各数据项的含义依次为组间均方、组间自由度、组内均方、组内自由度、F统计量的观察值以及对应的概率P-值。
仍然看出第二类的差异最大。
(三)实验结论:
因此,在总数为五,有效数值为五的情况下的聚类分析可得,E商厦属最优类;C,D商厦属良好类;A,B商厦属合格类。