应用多元统计分析习题解答主成分分析.docx

上传人:b****6 文档编号:7244204 上传时间:2023-01-22 格式:DOCX 页数:14 大小:43.85KB
下载 相关 举报
应用多元统计分析习题解答主成分分析.docx_第1页
第1页 / 共14页
应用多元统计分析习题解答主成分分析.docx_第2页
第2页 / 共14页
应用多元统计分析习题解答主成分分析.docx_第3页
第3页 / 共14页
应用多元统计分析习题解答主成分分析.docx_第4页
第4页 / 共14页
应用多元统计分析习题解答主成分分析.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

应用多元统计分析习题解答主成分分析.docx

《应用多元统计分析习题解答主成分分析.docx》由会员分享,可在线阅读,更多相关《应用多元统计分析习题解答主成分分析.docx(14页珍藏版)》请在冰豆网上搜索。

应用多元统计分析习题解答主成分分析.docx

应用多元统计分析习题解答主成分分析

主成分分析

6.1试述主成分分析的基本思想。

答:

我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,

人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。

当第一个组合不能提取

止。

这就是主成分分析的基本思想。

6.2主成分分析的作用体现在何处?

答:

一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。

以各

个主成分为分量,就得到一个更低维的随机向量;主成分分析的作用就是在降低数据“维数”

6.3简述主成分分析中累积贡献率的具体含义。

答:

主成分分析把p个原始变量X!

X2^l,Xp的总方差tr(习分解成了P个相互独立的变量p个主成分的,忽略一些带有较小方差的主成分将不会给总方差带来太大的影响。

这里我们

m/P

m(:

p)个主成分,则称'-;mk7s为主成分Y1,|l|,Ym的累计贡献率,累计贡献率

k土/k土

表明Y」n,Ym综合X!

X2^|,Xp的能力。

通常取m,使得累计贡献率达到一个较高的百分

数(如85%以上)。

答:

这个说法是正确的。

即原变量方差之和等于新的变量的方差之和

6.5试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。

答:

从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的。

从协方差矩阵出

发的,其结果受变量单位的影响。

主成分倾向于多归纳方差大的变量的信息,对于方差小的

变量就可能体现得不够,也存在“大数吃小数”的问题。

实际表明,这种差异有时很大。

5

需/2

3/2宀

的协差阵为

<3/2

21/+

5為4

3/2

5凋用

31/4

<3/23/2

丿

斗5^3/4=o

6.6已知Xfr;',••;:

..:

)'

11-X

解:

|I-AE|=问2

3/2

试进行主成分分析。

计算得禺T出同

AD(YJ=12』(YJ=Aa=8]D(Ya)=Aa=4

At=12

(I-XiE)

-20-2o73-1000

2v13

-27

5再

0

0

-17

\12

6苗18\/-2V3

-54V330Ho_再

10褐-34/\00

一护

0>

 

 

otj=(2^,1,同*

同理,计算得

鼻二8时,&=(-2,©3丫

易知[■■■■■..■^.-相互正交

・¥—TfYV—Tf¥V—TCV

-

综上所述,

第一主成分为Yi=tXi+;X2+^X3岖)=12

244

第二主成分为Y疔壮+汎+押叫=8

翻I

第三主成分为号=一;沧+;*3IXVa)二△

6.7设X=(%f屈,;)’的协方差阵(p囂鬥为

0

证明:

「十:

-:

「为最大特征根,其对应的主成分为

 

a3-Xpu2…pcf

pa2a:

-A.“pa:

pa

pa3ma3-Al

(p-l)pa2+a5-2ptf…pCFZ(p-l)pa3+a:

-1as-1・per3

■I■«:

■ME"

■■■贰

(p-l)pa2lu3-Apa2・》(J3-(p-l)pa:

+(js-Apaz"-per

0护(1一p)—X

7()

钉-內-环「卜J血―』

_:

:

-:

:

为最大特征根

 

当5二一一----.:

时,

/^p(l-p)

IT-l.FUPff:

pa£pa*1

*p『

/pfi-p)p+

tIQp(i-P)

9•Hi

I:

■■

\ppE

cti={144/-':

■■■

p(pP\

P

K

I

p(l-p)/M)

(J2p(l-p)

/o

I0

PQ、

_pp>«0

■o

1•**0\

0“0

 

 

所以,-

6.8利用主成分分析法,综合评价六个工业行业的经济效益指标。

单位:

(亿元)

行业名称

资产

固定资产净

产品销

利润

总计

值平均余额

售收入

总额

煤炭开采和选业

6917.2

3032.7

683.3

61.6

石油和天然气开采业

5675.9

3926.2

717.5

33877

黑色金属矿采选业

768.1

221.2

96.5

13.8

有色金属矿采选业

622.4

248

116.4

21.6

非金属矿采选业

699.9

291.5

84.9

6.2

其它采矿业

1.6

0.5

0.3

0

解:

令资产总计为X1,固定资产净值平均余额为X2,产品销售收入为X3,利润总额为X4,

用SPSS寸这六个行业进行主成分分析的方法如下:

1.在SPSS窗口中选择Analyze^DataReduction^Factor菜单项,调出因子分析主界

面,并将变量X^X5移入Variables框中,其他均保持系统默认选项,单击0K按

钮,执行因子分析过程(关于因子分子在SPSS中实现的详细过程,参见7.7)。

到如表6.1所示的特征根和方差贡献率表和表6.2所示的因子载荷阵。

第一个因子就可以解释86.5%

表6.1特征根和方差贡献率表

解秤的总育差

EW

初皓特征值

桿取平有和载入

台计

肓弟的%

累執隔

合计

君差的%

1

3.460

86.499

96.499

3.460

86.499

08.499

2

.537

13.434

99.S33

3

.002

.060

99.993

4

.000

.007

100.000

 

表6.2因子载荷阵

成棉

1

.047

.999

X3

.686

769

2.将表6.2中因子载荷阵中的数据输入SPSS数据编辑窗口,命名为al。

点击菜单项

中的TransformsCompute,调出Computevariable对话框,在对话框中输入等式:

z1=a1/SQRT3.46),计算第一个特征向量。

点击OK按钮,即可在数据编辑窗口中

得到以z1为变量名的第一特征向量。

表6.3特征向量矩阵

z1

x1

0.509

x2

0.537

x3

0.530

x4

0.413

根据表6.3得主成分的表达式:

Y1=0.509X10.537X20.530X30.413X4

3.再次使用Compute命令,调出Computevariable对话框,在对话框中输入等式:

y1=0.509*x10.537*x20.53*x30.413*x4

根据六个工业行业计算所的y1的大小可得石油和天然气开采业的经济效益最好,煤炭开采

和选业其次,接着依次是黑色金属、非金属、有色金属和其他采矿业。

6.9下表是我国2003年各地区农村居民家庭平均每人主要食品消费量,试用主成分方法对

各主要食品和地区进行分类。

地区

粮食

蔬菜

食油

猪牛羊肉

家禽

蛋类及其制品

水产品

食糠

北京

134.05

92.78

9.15

14.6

2.17

10.13

4.25

2.92

14.42

天津

150.2

69.99

10

11.07

0.84

10.8

8.35

0.72

10.14

河北

216.72

55.97

6.59

7.1

0.54

6.36

2.25

0.65

7.29

山西

218.91

80.87

5.72

5.36

0.24

6.15

0.47

1.15

2.59

内蒙

207.3

70.77

2.79

21.18

1.41

3.82

1.45

1.34

10.77

辽宁

194.39

178.59

5.9

16.45

2.51

9.59

4.49

0.73

10.8

吉林

255.99

115.2

6.27

11.42

3.23

8.64

3.6

0.75

13.64

黑龙江

195.08

111.7

7.62

7.85

2.61

6.26

3.35

0.9

15.09

上海

189.44

76.6

8.59

16.37

7.4

7.51

16.11

2.12

16.77

江苏

251.98

109.12

8.27

12.05

4.5

6.72

9.09

1.3

8.82

浙江

208.46

83.91

5.81

16.42

6.03

5.33

14.64

2.13

24.15

安徽

228.35

80.97

6.87

9.07

4.27

5.04

5.43

1.42

10.61

福建

198.27

99.92

5.19

16.51

5.14

3.55

13.3

2.35

16.84

江西

264.8

144.22

8.77

13.24

3.31

3.5

5.19

1.13

7.31

山东

229.06

118.19

6.96

8.09

2.7

11.61

4.01

1

10.81

河南

236.97

100.11

4.22

6.48

1.23

8.01

1.35

1.13

4.23

湖南

227.39

159.76

9.4

19.86

2.74

3.86

8.1

0.92

7.29

湖北

247.21

149.44

8.35

17.51

3.89

3.28

6.89

1.13

4.02

广东

233.75

130.22

6.73

22.27

10.4

2.83

13.3

2.16

3.33

广西

205.65

108.94

4.92

14.44

7.33

1.12

3.57

1.18

6.14

海南

236.31

86.61

5.7

15.4

9.77

1.31

14.75

1.24

3.88

解:

令粮食为X1,蔬菜为x2,食油为x3,猪牛羊肉为x4,家禽为x5,蛋类及其制品为x6,水产品为x7,食糠为x8,酒为x9,用SPSSS行主成分分析的具体方法参见6.8,分析结果如下:

表6.4特征根和方差贡献率表

解齋她总肓差

初始特征值

提取平方和载入

舍计

累镇監

舍计

育差的俯

累與%

1

2.927

32.521

32.521

2.927

32.521

32.521

2

2.220

24.671

57192

2.220

24.671

57192

3

1.344

14.936

72.120

1.344

14936

72.128

4

801

8905

31.033

5

.654

7.253

38296

6

.396

4.399

92,694

1

335

3727

96.422

E

222

2472

99.894

e

.100

1.105

100.000

表6.5因子载荷阵

1

2

3

XI

.002

.G20

-006

.093

-.477

.715

009

.276

SOS

X4

780

-.113

.194

-.212

■064

-.503

.608

312

.857

177

130

.664

.496

-.151

.241

.735

-.023

 

表6.6特征向量矩阵

z1

z2

z3

x1

0.001169

-0.55035

-0.00518

x2

0.054359

-0.32014

0.616746

x3

0.005261

0.185239

0.697829

x4

0.455914

-0.07584

0.167341

x5

0.509689

-0.14229

-0.05521

x6

-0.32908

0.408063

0.269126

x7

0.500921

0.118795

0.112136

x8

0.388112

0.332893

-0.13025

x9

0.140866

0.4933

-0.01984

根据表6.6得主成分的表达式:

Y1=0.001X10.054X20.005X30.456X40.51X5-0.329X60.501X70.388X80.141X9

Y2=-0.55X1-0.32X20.185X3-0.076X4-0.142X50.408X60.119X70.333X80.493X9

如下表:

Y3=-0.005X10.617X20.698X30.167X4—0.055X50.269X60.112X7—0.130X8—0.02X9

地区

y1

y2

y3

y

北京

14.92

-90.42

67.81

-10.16

天津

11.80

-93.48

54.76

-15.31

上海

24.39

-115.46

57.85

-16.51

福建

24.55

-129.93

68.56

-19.17

浙江

25.14

-126.00

59.51

-19.43

辽宁

19.55

-154.56

118.72

-19.47

黑龙江

13.27

-131.90

76.07

-23.38

湖南

23.53

-169.91

108.84

-24.97

广东

29.80

-167.06

88.93

-25.29

广西

19.18

-144.89

72.06

-25.99

分别计算出以上三项后,利用公式八宀丫1•宀丫2•^丫3得到综合得分并排序

内蒙

15.93

-130.47

48.84

-27.33

海南

24.93

-154.57

60.04

-29.19

山东

11.81

-152.64

81.06

-30.09

湖北

21.71

-179.61

100.93

-30.74

安徽

14.06

-143.12

56.46

-30.92

江苏

18.07

-164.93

76.08

-32.51

河北

7.10

-129.83

40.94

-32.73

山西

6.20

-141.44

55.18

-34.15

吉林

14.54

-166.90

78.26

-34.32

江西

18.74

-185.62

97.04

-34.94

河南

8.32

-156.36

66.62

-35.93

最后的分类可以根据最终得分Y的值来划分,由于没有给出具体的分类标准,具体分类结果根据各人的主观意愿可以有多种答案。

6.10根据习题5.10中2003年我国省会城市和计划单列市的主要经济指标数据,利用主成分分析法对这些地区进行分类。

解:

用SPSS进行主成分分析的具体方法参见6.8,分析结果如下:

表6.7特征根和方差贡献率表

解齋的总育差

初始特征值

提取平育和载入

台计

启差的%

累和%

舍计

育差的隔

累頼%

1

5.058

56.199

5B.199

5.058

56.199

56139

2

2390

26.551

82750

2.390

26.551

82.750

3

.814

9.041

91.790

4

.341

3.784

95.575

5

.248

2.769

9B.333

6

100

1.10B

99.441

7

.027

.304

9S.744

G

.020

21S

99.964

g

003

.036

100.000

表6.8因子载荷阵

1

2

X1

B55

722

X2

.629

.736

x3

.315

-444

X4

.694

-.571

x5

90S

-.302

x6

一曲4

-.419

x7

.687

.607

.683

180

y9

.882

-.370

 

表6.6特征向量矩阵

z1

z2

x1

0.29

0.47

x2

0.28

0.48

x3

0.14

-0.29

x4

0.31

-0.37

x5

0.40

-0.20

x6

0.40

-0.27

x7

0.31

0.39

x8

0.39

0.12

x9

0.39

-0.24

 

青岛

35237.27

14552.46

28597.44

大连

31830.56

17629.53

27272.03

济南

25149.73

16499.39

22372.97

福州

22734.16

16326.97

20677.45

乌鲁木齐

22284.54

15284.68

20037.59

沈阳

23184.99

12310.22

19694.19

武汉

23909.27

9770.56

19370.75

长春

21524.95

14179.21

19166.96

成都

33808.79

-17638.73

17294.14

太原

19445.42

9809.99

16352.45

郑州

18561.81

9822.90

15756.62

兰州

16568.97

13769.80

15670.44

海口

17666.70

11325.77

15631.26

昆明

18494.34

8579.72

15311.75

呼和浩特

16128.60

13359.10

15239.59

长沙

18845.23

6252.54

14802.98

石家庄

18229.33

7399.62

14752.99

西安

16764.15

4871.97

12946.76

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 表格模板 > 合同协议

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1