完整word版秋季多元统计分析考试答案.docx

上传人:b****6 文档编号:7762381 上传时间:2023-01-26 格式:DOCX 页数:19 大小:226.06KB
下载 相关 举报
完整word版秋季多元统计分析考试答案.docx_第1页
第1页 / 共19页
完整word版秋季多元统计分析考试答案.docx_第2页
第2页 / 共19页
完整word版秋季多元统计分析考试答案.docx_第3页
第3页 / 共19页
完整word版秋季多元统计分析考试答案.docx_第4页
第4页 / 共19页
完整word版秋季多元统计分析考试答案.docx_第5页
第5页 / 共19页
点击查看更多>>
下载资源
资源描述

完整word版秋季多元统计分析考试答案.docx

《完整word版秋季多元统计分析考试答案.docx》由会员分享,可在线阅读,更多相关《完整word版秋季多元统计分析考试答案.docx(19页珍藏版)》请在冰豆网上搜索。

完整word版秋季多元统计分析考试答案.docx

完整word版秋季多元统计分析考试答案

《多兀统计分析》课程试卷答案

2009年秋季学期

开课学院:

学号

考试方式闭卷、开卷、一纸开卷、其它考试时间:

120分钟

题号

-一一

-二二

^三

总分

得分

阅卷人

姓名

班级

但不得将试卷撕散,

说明:

本试卷后附有两张白纸,后一张为草稿纸,可以撕下,散卷作废。

/、

X1

"111"

(15分)设X=

X2

〜N3(巴£),其中卜=

-3

,送=

132

/3>

<1丿

J22>

1.

求3X1-2X2+X3的分布;

线

辽'

(111)

*3'

:

其中:

CP=(3-211

-3

=13,CSC'=(3-21)|132

-2

:

1

U丿

b22丿

.1丿

=9。

(4分)

匕3

(1分)

所以3xi-2X2+x3〜N(13,9)

其中:

互独立,只要

…(1分)

2、Ho:

在原假设成立的条件下,检验统计量为:

(3分)

T^(X-

 

(20分)据国家和地区的女子田径纪录数据,数据如下表:

表3.1国家和地区的女子田径纪录数据

国家和地区

100米

(秒)

200米

(秒)

400米

(秒)

800米

(分)

1500米

(分)

3000米

(分)

马拉松

(分)

阿根廷

11.61

22.94

54.50

2.15

4.43

9.79

178.52

澳大利亚

11.20

22.35

51.08

1.98

4.13

9.08

152.37

奥地利

11.43

23.09

50.62

1.99

4.22

9.34

159.37

比利时

11.41

23.04

52.00

2.00

4.14

8.88

157.85

美国

10.79

21.83

50.62

1.96

3.95

8.50

142.72

苏联

11.06

22.19

49.19

1.89

3.87

8.45

151.22

西萨摩亚

12.74

25.85

58.73

2.33

5.81

13.04

306.00

 

基于相关矩阵对上述数据进行因子分析,利用SPSS软件所得部分运算结果如下:

表3.2DescriptiveStatistics

Mean

Std.DeviationAn

alysisN

100米(秒)

11.6185

.45221

55

200米(秒)

23.6416

1.11106

55

400米(秒)

53.4058

2.67834

55

800米(分)

2.0764

.10822

55

1500米(分)

4.3255

.33243

55

3000米(分)

9.4476

.82434

55

马拉松(分)

173.2533

30.42954

55

I.838

表3.3KMOandBartlett'sTestKaiser-Meyer-OlkinMeasure

ofSamplingAdequacy.

Bartlett'sTestofSphericity

Approx.Chi-Square

605.335

df

21

Sig.

.000

 

表3.4ComponentMatrix

Component

1

2

100米(秒)

.888

.396

200米(秒)

.880

.434

400米(秒)

.919

.199

800米(分)

.927

-.126

1500米(分)

.938

-.291

3000米(分)

.937

-.281

马拉松(分)

.884

-.298

 

表3.5RotatedComponentMatrix

Component

1

2

100米(秒)

.400

.886

200米(秒)

.370

.909

400米(秒)

.555

.760

800米(分)

.776

.522

1500米(分)

.894

.405

3000米(分)

.887

.413

马拉松(分)

.859

.364

 

表3.6ComponentScoreCoefficientMatrix

Component

1

2

100米(秒)

-.288

.555

200米(秒)

-.328

.597

400米(秒)

-.084

.333

800米(分)

.247

-.038

1500米(分)

.417

-.226

3000米(分)

.406

-.214

马拉松(分)

.417

-.240

求:

1.写出正交因子模型;

2.

的原假设和备择假设,对

给出表3.3中Bartlett'sTestofSphericity此结果做出解释;

3.根据上述运算结果,试填写下表

原始变量

旋转因子载荷

共同度

*

f1

f2*

100米(秒)

200米(秒)

400米(秒)

800米(分)

1500米(分)

3000米(分)

马拉松(分)

累积贡献率

并对两个旋转因子的含义做出解释;

4.解释共同度及累计贡献率的含义;

5.写出两个旋转因子的因子得分表达式。

解:

1.X=卩+Af+£

E(f)=0

D(f)=lk

yov(f3)=0k邓

E(e)=0卫的协方差阵甲"iagd…,屮2)

令:

f\

X1

卩1〕

X=

b

h

£=

:

1

1&丿

f=

1

:

1.

〔fk丿

—特殊因子

—因子载荷矩阵

(5分)

2.

Ho:

P=lp,HrPHIp,由卩值<0.05,所以拒绝原假设,即相关矩阵不是单位矩阵。

(2分)

3.(7分)

原始变量

旋转因子载荷

共同度

*

f1

f;

100米(秒)

.400

.886

0.94536

200米(秒)

.370

.909

0.962756

400米(秒)

.555

.760

0.884162

800米(分)

.776

.522

0.926929

1500米(分)

.894

.405

0.964525

3000米(分)

.887

.413

0.95693

马拉松(分)

.859

.364

0.87026

累积贡献率

0.504427

0.922777

f1表示长跑耐力因子,f2表示短跑速度因子。

4.共同度表示提取的前k个公因子反映第i个原始变量的信息程度。

累计贡献率表示提取的前k个公因子对所有原始变量的解释程度。

(2分)

5.

X2-23.6416X3-53.4058

+0.597+0.333

1.111062.67834

X5-4.3255Xe-9.4476X7-173.2533

-0.226-0.214-0.240

0.332430.8243430.42954

(4分)

四、(20分)文件Poverty.sav是美国1960-1970年随机选择的30个城市的人口调查结果,其中丫表示该郡低于贫困线的家庭比例,X1表示1960-1970年间人口变化,X2表示从事农业人口数,X3表示居住与农场税率,X4表示住宅电话拥有率,X5表示农村人口比率,X6表示人口年龄中位数。

利用spss进行多元线性回归分析,结果如下:

表4.1DescriptiveStatistics

Mean

Std.Deviation

N

23.010

6.4266

30

X1

7.867

10.3323

30

X2

1548.6667

2038.38633

30

X3

.7187

.20270

30

X4

74.8333

10.00718

30

X5

70.727

24.0216

30

X6

30.280

2.8848

30

 

表4.2ModelSummary

Model

R

RSquare

AdjustedRSquare

Std.Errorofthe

Estimate

1

.733

.538

.521

4.4456

2

.836

.699

.677

3.6532

表4.3ANOVA

Model

SumofSquares

df

MeanSquare

F

Sig.

1

Regression

644.346

1

644.346

32.603

.000

Residual

553.381

28

19.764

Total

1197.727

29

2

Regression

837.381

2

418.690

31.372

.000

Residual

360.346

27

13.346

Total

1197.727

29

 

表4.4Coefficients

Model

UnstandardizedCoefficients

Standardized

Coefficients

t

Sig.

Correlations

B

Std.

Error

Beta

Zero-order

Partial

1

(Constant)

58.259

6.226

9.357

.000

X4

-.471

.082

-.733

-5.710

.000

-.733

-.733

2

(Constant)

52.496

5.336

9.837

.000

X4

-.366

.073

-.569

-4.993

.000

-.733

-.693

X1

-.270

.071

-.434

-3.803

.001

-.649

-.591

求:

1.解释表4.2中“R”,“RSquare”及“AdjustedRSquare”的含义;

2.写出表4.3Model2所检验的原假设和备择假设,当显著性水平a=0.05时,

给出检验的结论;

3.给定检验的显著性水平a=0.05,显著,解释原因;

4.当X1=10.7,X2=185QX3=0.93,

测值;

5.解释表4.4中偏相关系数的含义,释。

多元线性回归方程的回归系数t检验是否

X4=74,X5=70.6,X6=28.7时,写出y的预

并对Model2中偏相关系数的结果进行解

 

解:

1.R为复相关系数,衡量作为一个整体的X1,X2…,XP与丫的线性关系的大小。

RSquare称为判定系数或决定系数,它反映了回归方程的拟合程度,其值越大,说明回归

 

AdjustedRSquare为R;=1-一P—1),与RSquare一起反映回归方程的拟合

4分)

SST(n-1)

程度,其值越大,说明回归方程的拟合程度越高,反之,拟合程度越低。

2•令匕,P2分别表示自变量Xi,X4对应的的回归系数的表4.3Model2所检验的原

假设和备择假设为

H0:

p1=p2=0,VS比邛1邛2中至少有一个不为零。

 

(4分)

 

X4对丫的线性影响显著,因为t

检验的卩值=0.000va=0.05。

(4分)

4.多元线性回归方程为:

0=52.496-0.27X4-0.366X4,X1=10.7,X2=1850,

X3=0.93,X4=74,X5=70.6,X6=28.7时丫^=52.496-0.27x10.7-0.366x74=22.523。

(4分)

5.偏相关系数指其它变量都在模型里时,所研究自变量对因变量的影响。

X1在模型时,X4与丫的偏相关系数是-.693,对丫的影响是负影响。

X4在模型时,

X1与丫的偏相关系数是-.591,对丫的影响是负影响。

二者对丫的影响程度大致相当。

(4分)

五、(15分)五个样品间的距离矩阵如下

412

 

试用最短距离法对样品进行聚类。

画出聚类图,并给出聚为两类时的结果。

1

2

3

45

G

6

145

1

0

1

1G6

0

2

4

0

1

11

4

0

4

5

12

0

3

7

3

0

5

11

18

60

4

12

8

5

0

1

5

.18

14

11

60>

G745

G7

4

5

0

50

1160

(4)将4和Gz合并成G8,计算2类之间的距离

Gg5

G8

5

0

60

(5)画聚类图

(3分)

(2分)

G2

G3

G4

G5

Gz

G9

(3分)

(3分)

六、(16分)对破产企业收集他们在破产前两年的年度数据,对财务良好企业也收集同一时期的数据。

数据涉及四个变量,X1=现金流量/总债务,X2=净收入/

总资产,X3=流动资产/流动债务,X4=流动资产/净销售额。

数据列于表6.1

表6.1企业财务数据

Gi:

破产企业

G2:

非破产企业

序号

Xi

X2

X3

X4

序号

X1

X2

X3

X4

1

-0.45

-0.41

1.09

0.45

1

0.51

0.10

2.49

0.54

2

b

-0.56

h

-0.31

b

1.51

b

0.16

h

2

b

0.08

b

0.02

h

2.01

b

0.53

b

21

-0.28

-0.27

1.27

0.51

25

0.58

0.04

5.06

0.13

利用SPS软件计算结果如下:

 

表6.2GroupStatistics

GROUP

1

Mean

Std.Deviation

ValidN(listwise)

Unweighted

Weighted

1

X1

-6.8095E-02

.2099

21

21.000

X2

-8.1429E-02

.1449

21

21.000

X3

1.3667

.4053

21

21.000

X4

.4381

.2111

21

21.000

2

X1

.2352

.2169

25

25.000

X2

5.560E-02

4.874E-02

25

25.000

X3

2.5936

1.0231

25

25.000

X4

.4272

.1625

25

25.000

Total

X1

9.674E-02

.2608

46

46.000

X2

-6.9565E-03

.1240

46

46.000

X3

2.0335

1.0065

46

46.000

X4

.4322

.1842

46

46.000

表6.3TestsofEqualityofGroupMeans

Wilks'

Lambda

F

df1

df2

Sig.

X1

.657

22.976

1

44

.000

X2

.690

19.765

1

44

.000

X3

.623

26.610

1

44

.000

X4

.999

.039

1

44

.844

 

表6.4CovarianeeMatrices

GROUP

>

X1

X2

X3

X4

1

X1

4.407E-02

2.846E-02

3.452E-02

4.094E-03

X2

2.846E-02

2.100E-02

2.602E-02

3.412E-03

X3

3.452E-02

2.602E-02

.164

3.281E-02

X4

4.094E-03

3.412E-03

3.281E-02

4.458E-02

2

X1

4.705E-02

8.507E-03

7.493E-02

-6.568E-03

X2

8.507E-03

2.376E-03

8.583E-03

2.080E-04

X3

7.493E-02

8.583E-03

1.047

3.334E-02

X4

-6.568E-03

2.080E-04

3.334E-02

2.640E-02

Total

X1

6.801E-02

2.773E-02

.150

-2.522E-03

X2

2.773E-02

1.536E-02

5.878E-02

1.249E-03

X3

.150

5.878E-02

1.013

2.897E-02

X4

-2.522E-03

11.249E-03

2.897E-02

3.392E-02

 

表6.5PooledWithin-GroupsMatrices

X1

X2

X3

X4

Covarianee

X1

4.569E-02

1.758E-02

5.656E-02

-1.722E-03

X2

1.758E-02

1.084E-02

1.651E-02

1.664E-03

X3

5.656E-02

1.651E-02

.646

3.310E-02

X4

-1.722E-031

.664E-03

3.310E-02

3.466E-02

表6.6StandardizedCanonical表6.7Unstandardized

DiscriminantFunctionCoefficientsCanonicalDiscriminantFunction

Coefficients

表6.8ClassificationFunction

Coefficients

GROUP

1

2

X1

4.063

5.257

X2

-18.414

-9.944

X3

1.607

3.303

X4

12.192

9.910

(Constant)

-5.073

-7.435

 

表6.9ClassificationResults

GROUP

PredictedGroup)Membership

Total

1

2

Original

Count

1

18

3

21

2

1

24

25

%

1

85.7

1体3

100.0

2

4.0

196.0

100.0

1.指出表6.3的作用,并对表6.3的结果做评价;

2.写出Fisher判别法的线性判别函数f的表达式;

3.假定某企业的财务数据X1=0.08,X2=0.02,X3=2.01,x^0.53,那么,

该企业是否面临破产?

(分别用Fisher判别法和Bayes判别法给出判别结

果);

4.

根据表6.9的输出结果,你对本题中的判别方法有何评价?

值为

(3分)

0.844>0.05,则可以认为变量X4在两组的均值没有显著差别。

因此两组的均值有显

著性差异。

f2

=—5.073+4.063X0.08-18.414X0.02+1.607咒2.01+12.192^0.53=4.57559

=—7.435+5.257X0.08-9.9440.02+3.303咒2.01+9.910^0.53=4.67801

把某企业的财务数据代入Fisher判别法的线性判别函数得:

f=-0.03

计算临界值为:

F=-0.084。

由于f>口,说明该企业不面临破产。

(4分)

5.由表6.9可知,运用此判别方法有42个观测判别正确,判别正确的百分比为

42

——=91.3%。

G1中有18个观测判断正确,判对率为85.7%,G2中有24个观测判断正确,

46

(4分)

判对率为96%。

由此可以认为本题中所使用的判别方法判别效果较好。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1