第章主成分分析和因子分析习题答案.docx
《第章主成分分析和因子分析习题答案.docx》由会员分享,可在线阅读,更多相关《第章主成分分析和因子分析习题答案.docx(12页珍藏版)》请在冰豆网上搜索。
第章主成分分析和因子分析习题答案
第11章 主成分分析和因子分析
教材习题答案
下表是2007年30家能源类上市公司的有关经营数据。
其中:
X1=主营业务利润;X2=净资产收益率;X3=每股收益;X4=总资产周转率;X5=资产负债率;X6=流动比率;X7=主营业务收入增长率;X8=资本积累率。
进行主成分分析并确定主成分的数量。
股票简称
X1
X2
X3
X4
X5
X6
X7
X8
海油工程
中海油服
中国石化
中国石油
广聚能源
鲁润股份
海越股份
国际实业
靖远煤电
美锦能源
神火股份
金牛能源
煤气化
西山煤电
露天煤业
郑州煤电
兰花科创
黑化股份
兖州煤业
国阳新能
盘江股份
上海能源
山西焦化
恒源煤电
开滦股份
大同煤业
中国神华
潞安环能
中煤能源
国投新集
详细答案:
SPSS输出的各主成分分析结果如下表:
主成分的方差贡献率和累计方差贡献率
TotalVarianceExplained
Component
InitialEigenvalues
ExtractionSumsofSquaredLoadings
Total
%ofVariance
Cumulative%
Total
%ofVariance
Cumulative%
1
2
3
4
.843
5
.754
6
.337
7
.249
8
.163
ExtractionMethod:
PrincipalComponentAnalysis.
主成分的因子载荷矩阵
ComponentMatrix(a)
Component
1
2
3
X1
.490
X2
.804
.442
X3
.824
.464
X4
.603
.498
X5
.573
.643
X6
.332
X7
.248
.610
X8
.147
.524
ExtractionMethod:
PrincipalComponentAnalysis.
a3componentsextracted.
主成分方差贡献率表中前3个主成分的累计方差贡献率为%,虽然没有达到80%以上,但第四个主成分的特征根小于1。
因此,按着主成分的选择要求,选择3个主成分比较合适。
从因子载荷矩阵看,第一主成分主要解释了X2(净资产收益率)和X3(每股收益)两个变量;第二个主成分主要解释了X1(主营业务利润)、X4(总资产周转率)、X5(资产负债率)、X6(流动比率)和X8(资本积累率)这5个变量;而第三个主成分只解释了X7(主营业务收入增长率)一个变量。
根据题的数据:
(1)检验该数据是否适合进行因子分析?
(2)进行因子分析,并对30家上市公司的因子综合得分进行排序。
详细答案:
SPSS输出的因子分析结果如下表:
(1)KMO检验和Bartlett球度检验表如下:
KMOandBartlett'sTest
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.
.554
Bartlett'sTestofSphericity
df
28
Sig.
.000
从检验表中可见,Bartlett球度检验统计量为。
检验的值接近0。
表明8个变量之间有较强的相关关系。
而KMO统计量为,小于。
进行因子分析的效果不一定很好。
(2)旋转后的因子载荷矩阵如下:
RotatedComponentMatrix(a)
Component
1
2
3
X1
.404
X2
.912
.094
X3
.940
.106
X4
.126
.850
X5
.264
.848
X6
.025
X7
.065
.707
X8
.575
.090
ExtractionMethod:
PrincipalComponentAnalysis.
RotationMethod:
VarimaxwithKaiserNormalization.
aRotationconvergedin5iterations.
因子1与X2(净资产收益率)和X3(每股收益)的载荷系数较大,这两个变量主要与上市公司盈利能力有关,因此可命名为“盈利能力”。
因子2与X5(资产负债率)、X6(流动比率)、X8(资本积累率)这3个变量的载荷系数较大,这三个变量主要涉及企业的偿债能力,因此可命名为“偿债能力因子”。
因子3与X1(主营业务利润)、X4(总资产周转率)、X7(主营业务收入增长率)这三个变量的载荷系数较大,这三个变量分别涉及了盈利能力、资产管理水平、企业成长能力等,因此,这个因子的命名比较困难。
各公所的因子综合得分和排名如下:
对下表中的50名学生成绩进行主成分分析,可以选择几个综合变量来代表这些学生的六门课程成绩?
学生代码
数学
物理
化学
语文
历史
英语
1
71
64
94
52
61
52
2
78
96
81
80
89
76
3
69
56
67
75
94
80
4
77
90
80
68
66
60
5
84
67
75
60
70
63
6
62
67
83
71
85
77
7
74
65
75
72
90
73
8
91
74
97
62
71
66
9
72
87
72
79
83
76
10
82
70
83
68
77
85
11
63
70
60
91
85
82
12
74
79
95
59
74
59
13
66
61
77
62
73
64
14
90
82
98
47
71
60
15
77
90
85
68
73
76
16
91
82
84
54
62
60
17
78
84
100
51
60
60
18
90
78
78
59
72
66
19
80
100
83
53
73
70
20
58
51
67
79
91
85
21
72
89
88
77
80
83
22
64
55
50
68
68
65
23
77
89
80
73
75
70
24
72
68
77
83
92
79
25
72
67
61
92
92
88
26
73
72
70
88
86
79
27
77
81
62
85
90
87
28
61
65
81
98
94
95
29
79
95
83
89
89
79
30
81
90
79
73
85
80
31
85
77
75
52
73
59
32
68
85
70
84
89
86
33
85
91
95
63
76
66
34
91
85
100
70
65
76
35
74
74
84
61
80
69
36
88
100
85
49
71
66
37
63
82
66
89
78
80
38
87
84
100
74
81
76
39
81
98
84
57
65
69
40
64
79
64
72
76
74
41
60
51
60
78
74
76
42
75
84
76
65
76
73
43
59
75
81
82
77
73
44
64
59
56
71
79
67
45
64
61
49
100
99
95
46
56
48
61
85
82
80
47
62
45
67
78
76
82
48
86
78
92
87
87
77
49
66
72
79
81
87
66
50
61
66
48
98
100
96
详细答案:
SPSS输出的主成分分析结果如下表:
主成分的方差贡献率和累计方差贡献率
TotalVarianceExplained
Component
InitialEigenvalues
ExtractionSumsofSquaredLoadings
Total
%ofVariance
Cumulative%
Total
%ofVariance
Cumulative%
1
2
3
.403
4
.325
5
.204
6
.134
ExtractionMethod:
PrincipalComponentAnalysis.
主成分载荷矩阵
ComponentMatrix(a)
Component
1
2
数学
.430
物理
.682
化学
.318
语文
.893
.312
历史
.826
.406
英语
.833
.438
ExtractionMethod:
PrincipalComponentAnalysis.
a2componentsextracted.
头两个主成分能够解释总方差的%,所以可以选择这两个主成分来代表原来的六门课程成绩。
由主成分载荷矩阵来看,第一个主成分既充分解释了数学、物理、化学三门课程成绩,也充分解释了语文、历史、英语三门课程成绩,但前三门课程的主成分载荷为均为负值,后三门课程的主成分载荷恰好相反,均为正值,这可能是由于文理科课程的性质不同而导致的。
第二主成分则与六门课程成绩均表现出一定的正相关关系。
如果事先确定选择两个因子来代表习题中50名学生的六门课程成绩,试对该数据进行因子分析,得到的两个因子有没有合理的直观意义?
详细答案:
SPSS输出的因子分析结果如下表:
旋转后的因子载荷矩阵
RotatedComponentMatrix(a)
Component
1
2
数学
.821
物理
.895
化学
.737
语文
.893
历史
.899
英语
.924
ExtractionMethod:
:
VarimaxwithKaiserNormalization.
aRotationconvergedin3iterations.
因子得分矩阵
ComponentScoreCoefficientMatrix
Component
1
2
数学
.059
.409
物理
.231
.539
化学
.000
.337
语文
.349
.054
历史
.383
.126
英语
.401
.145
ExtractionMethod:
:
VarimaxwithKaiserNormalization.
由旋转后的因子载荷矩阵来看,第一个因子主要表现出与语文、历史和英语有较强的正相关关系,相关系数分别为,,;第二个因子则主要表现出与数学、物理、化学有较强的正相关关系,相关系数分别为,,。
因此,从直观上来,可以分别给它们取名为“文科因子”和“理科因子”。
利用因子得分矩阵则可以计算每一个观测所对应的这两个因子的得分值。