应用多元统计分析习题解答主成分分析Word格式.docx
《应用多元统计分析习题解答主成分分析Word格式.docx》由会员分享,可在线阅读,更多相关《应用多元统计分析习题解答主成分分析Word格式.docx(14页珍藏版)》请在冰豆网上搜索。
![应用多元统计分析习题解答主成分分析Word格式.docx](https://file1.bdocx.com/fileroot1/2022-11/26/98049304-918b-4844-8eeb-de1e9bffc04a/98049304-918b-4844-8eeb-de1e9bffc04a1.gif)
一.一一.为最大特征根,其对应的主成分为
(p-l)p^+ff2—1pffS■-pG2(p-l^po3+a2-Xo3—1—pa
(p—l)pa2+cs2—kpa2
(p—l)p(Jz+a3-ipa3.“prr3
0uafl-p)-A-■per3
-0tr=Cl-p)-Xl
"
0<
1,
打汽”-辭口一P)
Ai—Aa=pp>
0
_[.--;
为最大特征根
当一[.一-;
时,
P(l-p)P…opa-p)i
■"
■'
■
I;
1
pp・•・
ffl=aAi/»
y
6.8利用主成分分析法,综合评价六个工业行业的经济效益指标。
单位:
(亿元)
行业名称
资产
固定资产净
产品销
利润
总计
值平均余额
售收入
总额
丿甘*ltt:
壬壬口]作、||/
6917.2
3032.7
683.3
61.6
煤炭开采和选业
石油和天然气开采业
5675.9
3926.2
717.5
33877
黑色金属矿采选业
768.1
221.2
96.5
13.8
有色金属矿采选业
622.4
248
116.4
21.6
非金属矿采选业
699.9
291.5
84.9
6.2
其它采矿业
1.6
0.5
0.3
解:
令资产总计为X1,固定资产净值平均余额为X2,产品销售收入为X3,利润总额为X4,
用SPSS对这六个行业进行主成分分析的方法如下:
1.在SPSS窗口中选择Analyze宀DataReduction宀Factor菜单项,调出因子分
析主界面,并将变量X!
X5移入Variables框中,其他均保持系统默认选项,单
击0K按钮,执行因子分析过程(关于因子分子在SPSS中实现的详细过程,参
见7.7)。
得到如表6.1所示的特征根和方差贡献率表和表6.2所示的因子载荷阵。
第一个因子就可以解释86.5%
表6.1特征根和方差贡献率表
駙釋的总方差
袖自特征值
肓差的码
累糕%
合计
3460
86.499
S6.499
3.46D
86499
88498
2
.537
13.434
99.933
3
.002
.060
99993
4
XOO
.007
100.000
表6.2因子载荷阵
应阱葩阵h
x1
.947
X2
.ggg
.906
X4
765
2.将表6.2中因子载荷阵中的数据输入SPSS数据编辑窗口,命名为al。
点击菜单
项中的Transform〜Compute,调出Computevariable对话框,在对话框中输
入等式:
z仁al/SQRT(3.46),计算第一个特征向量。
点击0K按钮,即可在数据编辑窗
口中得到以z1为变量名的第一特征向量。
表6.3特征向量矩阵
z1
0.509
x2
0.537
x3
0.530
x4
0.413
根据表6.3得主成分的表达式:
Y10.509X10.537X20.530X30.413X4
3.再次使用Compute命令,调出Computevariable对话框,在对话框中输入等式:
y10.509*x10.537*x20.53*x30.413*x4
根据六个工业行业计算所的y1的大小可得石油和天然气开采业的经济效益最好,煤炭开
采和选业其次,接着依次是黑色金属、非金属、有色金属和其他采矿业。
6.9下表是我国2003年各地区农村居民家庭平均每人主要食品消费量,试用主成分方法对
各主要食品和地区进行分类。
地区
粮食
蔬菜
食油
猪牛羊肉
家禽
蛋类及其制品
水产品
食糠
酒
北京
134.0
5
92.78
9.15
14.6
2.17
10.1
4.25
2.92
14.42
天津
150.2
69.99
10
11.07
0.84
10.8
8.35
0.72
10.14
河北
216.7
55.97
6.59
7.1
0.54
6.36
2.25
0.65
7.29
山西
218.9
80.87
5.72
5.36
0.24
6.15
0.47
1.15
2.59
内蒙
207.3
70.77
2.79
21.18
1.41
3.82
1.45
1.34
10.77
辽宁
194.3
9
178.59
5.9
16.45
2.51
9.59
4.49
0.73
吉林
255.9
115.2
6.27
11.42
3.23
8.64
3.6
0.75
13.64
黑龙江
195.0
8
111.7
7.62
7.85
2.61
6.26
3.35
0.9
15.09
上海
189.4
76.6
8.59
16.37
7.4
7.51
16.11
2.12
16.77
江苏
251.9
109.12
8.27
12.05
4.5
6.72
9.09
1.3
8.82
浙江
208.4
6
83.91
5.81
16.42
6.03
5.33
14.64
2.13
24.15
安徽
228.3
80.97
6.87
9.07
4.27
5.04
5.43
1.42
10.61
福建
198.2
7
99.92
5.19
16.51
5.14
3.55
13.3
2.35
16.84
江西
264.8
144.22
8.77
13.24
3.31
3.5
1.13
7.31
山东
229.0
118.19
6.96
8.09
2.7
11.6
4.01
10.81
河南
236.9
100.11
4.22
6.48
1.23
8.01
1.35
4.23
湖南
227.3
159.76
9.4
19.86
2.74
3.86
8.1
0.92
湖北
247.2
149.44
17.51
3.89
3.28
6.89
4.02
广东
233.7
130.22
6.73
22.27
10.4
2.83
2.16
3.33
广西
205.6
108.94
4.92
14.44
7.33
1.12
3.57
1.18
6.14
海南
236.3
86.61
5.7
15.4
9.77
1.31
14.75
1.24
3.88
令粮食为X1,蔬菜为x2,食油为x3,猪牛羊肉为x4,家禽为x5,蛋类及其制品为x6,水产品为x7,食糠为x8,酒为x9,用SPSS进行主成分分析的具体方法参见6.8,分析
结果如下:
表6.4特征根和方差贡献率表
驚稈的总启差
初始特祁值
桿取平打和載入
右弄的務
2.92Z
32521
32.521
2.927
2.220
24.671
57.1192
3220
571S2
1.344
14.936
72.1128
72128
.801
9.905
91033
654
7263
98.286
.396
4.399
92S94
T
3.727
96.422
.222
2472
98994
g
100
1105
表6.5因子载荷阵
咸帕拒阵
成
X1
002
-.920
-006
.093
-.477
.715
X3
009
.276
.E09
78Q
-113
194
x5
.872
*212
-.064
J12
XT
£
57
177
130
.6S4
.496
・.151
x9
.241
735
-023
表6.6特征向量矩阵
z2
z3
0.001169
-0.55035
-0.00518
0.054359
-0.32014
0.616746
0.005261
0.185239
0.697829
0.455914
-0.07584
0.167341
0.509689
-0.14229
-0.05521
x6
-0.32908
0.408063
0.269126
x7
0.500921
0.118795
0.112136
x8
0.388112
0.332893
-0.13025
0.140866
0.4933
-0.01984
根据表6.6得主成分的表达式:
Y10.001X10.054X20.005X30.456X40.51X50.329X60.501X70.388X80.141X9
Y20.55X10.32X20.185X30.076X40.142X50.408X60.119X70.333X80.493X9
Y30.005X10.617X20.698X30.167X40.055X50.269X60.112X70.130X80.02X9
分别计算出以上三项后,利用公式Y—」丫1—丄Y2-^Y3得到综合得分并排序
如下表:
y1
y2
y3
14.92
-90.42
67.81
-10.16
11.80
-93.48
54.76
-15.31
24.39
-115.46
57.85
-16.51
24.55
-129.93
68.56
-19.17
25.14
-126.00
59.51
-19.43
19.55
-154.56
118.72
-19.47
13.27
-131.90
76.07
-23.38
23.53
-169.91
108.84
-24.97
29.80
-167.06
88.93
-25.29
19.18
-144.89
72.06
-25.99
15.93
-130.47
48.84
-27.33
24.93
-154.57
60.04
-29.19
11.81
-152.64
81.06
-30.09
21.71
-179.61
100.93
-30.74
14.06
-143.12
56.46
-30.92
18.07
-164.93
76.08
-32.51
7.10
-129.83
40.94
-32.73
6.20
-141.44
55.18
-34.15
14.54
-166.90
78.26
-34.32
18.74
-185.62
97.04
-34.94
8.32
-156.36
66.62
-35.93
最后的分类可以根据最终得分Y的值来划分,由于没有给出具体的分类标准,具体分类结
果根据各人的主观意愿可以有多种答案。
6.10根据习题5.10中2003年我国省会城市和计划单列市的主要经济指标数据,利用主成分分析法对这些地区进行分类。
解:
用SPSS进行主成分分析的具体方法参见6.8,分析结果如下:
表6.7特征根和方差贡献率表
初始特征值
提取平右和载入
舍计
方等的册
育萍的爲
累积确
5058
56.199
50.199
5058
56199
2300
26551
8Z750
2.^0
26.651
02.750
.814
9.041
91.780
341
3704
95.575
240
2.759
91333
1.108
99.441
027
.304
G1744
020
.219
99J64
003
036
100.000
表6.8因子载荷阵
咸的麓阵.
成借
.655
in
a
.629
.736
.316
-444
丈4
.094
-.571
X5
.908
-.302
戍
.894
-.419
.607
)ce
.383
.180
)cg
越2
-.370
0.29
0.28
0.48
0.14
-0.29
0.31
-0.37
0.40
-0.20
-0.27
0.39
0.12
-0.24
青岛
35237.27
14552.46
28597.44
大连
31830.56
17629.53
27272.03
济南
25149.73
16499.39
22372.97
福州
22734.16
16326.97
20677.45
乌鲁木齐
22284.54
15284.68
20037.59
沈阳
23184.99
12310.22
19694.19
武汉
23909.27
9770.56
19370.75
长春
21524.95
14179.21
19166.96
成都
33808.79
-17638.73
17294.14
太原
19445.42
9809.99
16352.45
郑州
18561.81
9822.90
15756.62
兰州
16568.97
13769.80
15670.44
海口
17666.70
11325.77
15631.26
昆明
18494.34
8579.72
15311.75
呼和浩特
16128.60
13359.10
15239.59
长沙
18845.23
6252.54
14802.98
石家庄
18229.33
7399.62
14752.99
西安
16764.15
4871.97
12946.76