第 章主成分分析和因子分析习题答案.docx
《第 章主成分分析和因子分析习题答案.docx》由会员分享,可在线阅读,更多相关《第 章主成分分析和因子分析习题答案.docx(11页珍藏版)》请在冰豆网上搜索。
第章主成分分析和因子分析习题答案
第11章 主成分分析和因子分析
教材习题答案
11.1下表是2007年30家能源类上市公司的有关经营数据。
其中:
X1=主营业务利润;X2=净资产收益率;X3=每股收益;X4=总资产周转率;X5=资产负债率;X6=流动比率;X7=主营业务收入增长率;X8=资本积累率。
进行主成分分析并确定主成分的数量。
股票简称
X1
X2
X3
X4
X5
X6
X7
X8
海油工程
19.751
27.010
1.132
0.922
50.469
1.237
25.495
10.620
中海油服
33.733
12.990
0.498
0.510
25.398
3.378
46.990
-1.576
中国石化
13.079
18.260
0.634
1.835
54.584
0.674
55.043
43.677
中国石油
33.441
19.900
0.735
0.923
28.068
1.043
42.682
45.593
广聚能源
6.790
15.650
0.441
1.188
13.257
3.602
38.446
17.262
鲁润股份
5.315
0.500
0.011
1.879
52.593
1.222
207.373
33.721
海越股份
3.357
15.480
0.538
0.626
48.830
0.807
33.438
54.972
国际实业
29.332
10.340
0.299
0.662
53.140
1.218
16.579
7.622
靖远煤电
29.961
16.040
0.255
0.662
36.596
0.700
20.902
-3.682
美锦能源
23.342
18.580
0.497
0.923
60.963
0.992
1.271
12.128
神火股份
26.042
42.500
1.640
0.990
69.776
0.510
50.138
52.066
金牛能源
35.022
15.730
0.725
0.944
39.267
0.953
9.002
-3.877
煤气化
25.809
14.980
0.677
0.928
45.768
0.949
-3.851
24.881
西山煤电
39.506
17.820
0.868
0.703
45.450
1.525
9.162
-85.430
露天煤业
29.895
22.450
0.709
0.800
40.977
1.321
3.310
4.369
郑州煤电
18.160
12.740
0.299
1.374
52.962
1.240
-100.000
85.688
兰花科创
41.402
20.070
1.414
0.617
52.916
1.060
6.789
14.259
黑化股份
8.783
1.430
0.033
0.753
48.061
0.545
-11.659
6.856
兖州煤业
45.592
13.730
0.548
0.688
22.350
2.158
21.199
21.953
国阳新能
16.061
14.920
1.030
1.623
48.386
0.973
15.342
20.860
盘江股份
11.003
6.660
0.260
1.187
30.201
1.682
41.657
75.804
上海能源
24.876
17.950
0.709
0.968
48.674
0.510
20.548
14.526
山西焦化
12.825
4.450
0.331
0.849
48.476
1.417
43.676
29.419
恒源煤电
32.228
17.820
1.070
0.449
72.079
0.515
9.872
149.837
开滦股份
24.423
20.670
1.102
0.845
54.198
1.102
73.285
26.542
大同煤业
44.005
12.990
0.597
0.667
47.554
1.843
30.621
15.668
中国神华
48.180
15.400
0.994
0.408
37.687
2.097
27.813
46.229
潞安环能
28.567
21.710
1.534
1.023
54.261
1.590
48.315
29.610
中煤能源
41.214
16.680
0.441
0.669
40.932
2.058
29.903
11.350
国投新集
30.015
9.680
0.222
0.350
64.471
0.630
24.278
36.437
详细答案:
SPSS输出的各主成分分析结果如下表:
主成分的方差贡献率和累计方差贡献率
TotalVarianceExplained
Component
InitialEigenvalues
ExtractionSumsofSquaredLoadings
Total
%ofVariance
Cumulative%
Total
%ofVariance
Cumulative%
1
2.346
29.321
29.321
2.346
29.321
29.321
2
2.059
25.732
55.053
2.059
25.732
55.053
3
1.249
15.614
70.667
1.249
15.614
70.667
4
.843
10.539
81.206
5
.754
9.421
90.628
6
.337
4.215
94.843
7
.249
3.114
97.957
8
.163
2.043
100.000
ExtractionMethod:
PrincipalComponentAnalysis.
主成分的因子载荷矩阵
ComponentMatrix(a)
Component
1
2
3
X1
.490
-.698
-.113
X2
.804
-.066
.442
X3
.824
-.049
.464
X4
-.363
.603
.498
X5
.573
.643
-.219
X6
-.434
-.672
.332
X7
-.329
.248
.610
X8
.147
.524
-.219
ExtractionMethod:
PrincipalComponentAnalysis.
a3componentsextracted.
主成分方差贡献率表中前3个主成分的累计方差贡献率为70.667%,虽然没有达到80%以上,但第四个主成分的特征根小于1。
因此,按着主成分的选择要求,选择3个主成分比较合适。
从因子载荷矩阵看,第一主成分主要解释了X2(净资产收益率)和X3(每股收益)两个变量;第二个主成分主要解释了X1(主营业务利润)、X4(总资产周转率)、X5(资产负债率)、X6(流动比率)和X8(资本积累率)这5个变量;而第三个主成分只解释了X7(主营业务收入增长率)一个变量。
11.2根据11.1题的数据:
(1)检验该数据是否适合进行因子分析?
(2)进行因子分析,并对30家上市公司的因子综合得分进行排序。
详细答案:
SPSS输出的因子分析结果如下表:
(1)KMO检验和Bartlett球度检验表如下:
KMOandBartlett'sTest
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.
.554
Bartlett'sTestofSphericity
Approx.Chi-Square
75.082
df
28
Sig.
.000
从检验表中可见,Bartlett球度检验统计量为75.082。
检验的值接近0。
表明8个变量之间有较强的相关关系。
而KMO统计量为0.554,小于0.7。
进行因子分析的效果不一定很好。
(2)旋转后的因子载荷矩阵如下:
RotatedComponentMatrix(a)
Component
1
2
3
X1
.404
-.313
-.693
X2
.912
.094
-.075
X3
.940
.106
-.058
X4
-.066
.126
.850
X5
.264
.848
-.023
X6
-.082
-.862
.025
X7
.065
-.192
.707
X8
-.066
.575
.090
ExtractionMethod:
PrincipalComponentAnalysis.
RotationMethod:
VarimaxwithKaiserNormalization.
aRotationconvergedin5iterations.
因子1与X2(净资产收益率)和X3(每股收益)的载荷系数较大,这两个变量主要与上市公司盈利能力有关,因此可命名为“盈利能力”。
因子2与X5(资产负债率)、X6(流动比率)、X8(资本积累率)这3个变量的载荷系数较大,这三个变量主要涉及企业的偿债能力,因此可命名为“偿债能力因子”。
因子3与X1(主营业务利润)、X4(总资产周转率)、X7(主营业务收入增长率)这三个变量的载荷系数较大,这三个变量分别涉及了盈利能力、资产管理水平、企业成长能力等,因此,这个因子的命名比较困难。
各公所的因子综合得分和排名如下:
11.3对下表中的50名学生成绩进行主成分分析,可以选择几个综合变量来代表这些学生的六门课程成绩?
学生代码
数学
物理
化学
语文
历史
英语
1
71
64
94
52
61
52
2
78
96
81
80
89
76
3
69
56
67
75
94
80
4
77
90
80
68
66
60
5
84
67
75
60
70
63
6
62
67
83
71
85
77
7
74
65
75
72
90
73
8
91
74
97
62
71
66
9
72
87
72
79
83
76
10
82
70
83
68
77
85
11
63
70
60
91
85
82
12
74
79
95
59
74
59
13
66
61
77
62
73
64
14
90
82
98
47
71
60
15
77
90
85
68
73
76
16
91
82
84
54
62
60
17
78
84
100
51
60
60
18
90
78
78
59
72
66
19
80
100
83
53
73
70
20
58
51
67
79
91
85
21
72
89
88
77
80
83
22
64
55
50
68
68
65
23
77
89
80
73
75
70
24
72
68
77
83
92
79
25
72
67
61
92
92
88
26
73
72
70
88
86
79
27
77
81
62
85
90
87
28
61
65
81
98
94
95
29
79
95
83
89
89
79
30
81
90
79
73
85
80
31
85
77
75
52
73
59
32
68
85
70
84
89
86
33
85
91
95
63
76
66
34
91
85
100
70
65
76
35
74
74
84
61
80
69
36
88
100
85
49
71
66
37
63
82
66
89
78
80
38
87
84
100
74
81
76
39
81
98
84
57
65
69
40
64
79
64
72
76
74
41
60
51
60
78
74
76
42
75
84
76
65
76
73
43
59
75
81
82
77
73
44
64
59
56
71
79
67
45
64
61
49
100
99
95
46
56
48
61
85
82
80
47
62
45
67
78
76
82
48
86
78
92
87
87
77
49
66
72
79
81
87
66
50
61
66
48
98
100
96
详细答案:
SPSS输出的主成分分析结果如下表:
主成分的方差贡献率和累计方差贡献率
TotalVarianceExplained
Component
InitialEigenvalues
ExtractionSumsofSquaredLoadings
Total
%ofVariance
Cumulative%
Total
%ofVariance
Cumulative%
1
3.729
62.146
62.146
3.729
62.146
62.146
2
1.206
20.096
82.242
1.206
20.096
82.242
3
.403
6.724
88.966
4
.325
5.414
94.380
5
.204
3.395
97.775
6
.134
2.225
100.000
ExtractionMethod:
PrincipalComponentAnalysis.
主成分载荷矩阵
ComponentMatrix(a)
Component
1
2
数学
-.778
.430
物理
-.580
.682
化学
-.784
.318
语文
.893
.312
历史
.826
.406
英语
.833
.438
ExtractionMethod:
PrincipalComponentAnalysis.
a2componentsextracted.
头两个主成分能够解释总方差的82.242%,所以可以选择这两个主成分来代表原来的六门课程成绩。
由主成分载荷矩阵来看,第一个主成分既充分解释了数学、物理、化学三门课程成绩,也充分解释了语文、历史、英语三门课程成绩,但前三门课程的主成分载荷为均为负值,后三门课程的主成分载荷恰好相反,均为正值,这可能是由于文理科课程的性质不同而导致的。
第二主成分则与六门课程成绩均表现出一定的正相关关系。
11.4如果事先确定选择两个因子来代表习题11.3中50名学生的六门课程成绩,试对该数据进行因子分析,得到的两个因子有没有合理的直观意义?
详细答案:
SPSS输出的因子分析结果如下表:
旋转后的因子载荷矩阵
RotatedComponentMatrix(a)
Component
1
2
数学
-.341
.821
物理
-.028
.895
化学
-.415
.737
语文
.893
-.312
历史
.899
-.196
英语
.924
-.176
ExtractionMethod:
PrincipalComponentAnalysis.RotationMethod:
VarimaxwithKaiserNormalization.
aRotationconvergedin3iterations.
因子得分矩阵
ComponentScoreCoefficientMatrix
Component
1
2
数学
.059
.409
物理
.231
.539
化学
.000
.337
语文
.349
.054
历史
.383
.126
英语
.401
.145
ExtractionMethod:
PrincipalComponentAnalysis.RotationMethod:
VarimaxwithKaiserNormalization.
由旋转后的因子载荷矩阵来看,第一个因子主要表现出与语文、历史和英语有较强的正相关关系,相关系数分别为0.893,0.899,0.924;第二个因子则主要表现出与数学、物理、化学有较强的正相关关系,相关系数分别为0.821,0.895,0.737。
因此,从直观上来,可以分别给它们取名为“文科因子”和“理科因子”。
利用因子得分矩阵则可以计算每一个观测所对应的这两个因子的得分值。