多元统计分析课程设计题目Word文档格式.docx

上传人:b****6 文档编号:18816934 上传时间:2023-01-01 格式:DOCX 页数:18 大小:25.57KB
下载 相关 举报
多元统计分析课程设计题目Word文档格式.docx_第1页
第1页 / 共18页
多元统计分析课程设计题目Word文档格式.docx_第2页
第2页 / 共18页
多元统计分析课程设计题目Word文档格式.docx_第3页
第3页 / 共18页
多元统计分析课程设计题目Word文档格式.docx_第4页
第4页 / 共18页
多元统计分析课程设计题目Word文档格式.docx_第5页
第5页 / 共18页
点击查看更多>>
下载资源
资源描述

多元统计分析课程设计题目Word文档格式.docx

《多元统计分析课程设计题目Word文档格式.docx》由会员分享,可在线阅读,更多相关《多元统计分析课程设计题目Word文档格式.docx(18页珍藏版)》请在冰豆网上搜索。

多元统计分析课程设计题目Word文档格式.docx

1.82

11.35

7

青海

10.06

28.64

10.52

10.05

16.18

8.39

1.96

10.81

8

河北

9.09

28.12

7.40

9.62

17.26

11.12

2.49

12.65

9

陕西

9.41

28.20

5.77

10.80

16.36

11.56

1.53

12.17

10

宁夏

8.70

7.21

10.53

19.45

13.30

1.66

11.96

11

新疆

6.93

29.85

4.54

9.49

16.62

10.65

1.88

13.61

12

湖北

8.67

36.05

7.31

7.75

16.67

11.68

2.38

12.88

13

厶南

9.98

37.69

7.01

8.94

16.15

11.08

0.83

11.67

14

湖南

6.77

38.69

6.01

8.82

14.79

11.44

1.74

13.23

15

安徽

37.75

9.61

13.15

1.28

11.28

16

贵州

7.67

35.71

8.04

8.31

15.13

7.76

1.41

13.25

17

辽宁

7.90

39.77

12.94

19.27

11.05

2.04

13.29

18

四川

7.18

40.91

7.32

17.60

12.75

1.14

14.80

19

山东

33.70

7.59

10.98

18.82

14.73

1.78

10.10

20

江西

6.25

35.02

6.28

10.03

7.15

1.93

10.39

21

福建

10.60

52.41

7.70

12.53

11.70

2.31

14.69

22

广西

7.27

52.65

3.84

13.03

15.26

1.98

14.57

23

海南

13.45

55.85

5.50

7.45

9.55

9.52

2.21

16.30

24

天津

10.85

44.68

14.51

17.13

12.08

1.26

11.57

25

江苏

45.79

7.66

10.36

16.56

12.86

2.25

11.69

26

浙江

7.68

50.37

19.25

14.59

2.75

14.87

27

北京

7.78

48.44

8.00

20.51

22.12

15.73

1.15

16.61

28

西藏

7.94

39.65

20.97

20.82

22.52

12.41

1.75

29

上海

8.28

64.34

22.22

20.06

15.12

0.72

22.89

30

广东

12.47

76.39

5.52

11.24

14.52

22.00

5.46

25.50

2.下表是49位女性在空腹情况下三个不同时刻的血糖含量(用X1,X2,X3表示)和摄入等量食糖一小时后的三个时刻的血糖含量(用小X4,X5,X6表示)的观测值(单位:

mg/100ml).

分别从样本协方差阵S和样本相关系数矩阵R出发做主成分分析,求主成分的贡献率和各个主成分.在两种情况下,你认为应保留几个主成分?

其意义如何解释?

就此而言,你认为基于S和R的分析那个结果更为合理?

表二49位女性在空腹和摄入食糖后三个不同时刻的血糖含量

编号

空腹

摄入食糖

60

69

62

:

97

98

56

53

84

103

78

107

80

76

66

99

130

55

90

r801

85

114

75

68

116

91

74

64

70

109

101

71

77

102

73

115

110

67

119

82

72

133

127

61

134

121

150

158

100

—150n

131

142

83

105

63

164

138

r1601

117

144

153

89

r1141

93

122

65

118

p170n

147

132

143

-114亍

113

129

86

106

81

87

r1051

31

94

32

33

r120i

59

34

35

111

36

48

124

37

136

112

38

88

39

40

41

42

92

43

146

44

120

45

—122

155

P149

46

47

104

96

49

52

3.考察1985年至2000年全国如下各价格指数:

商品零售价格指数;

居民消费价格指数;

城市居民消费价格指数;

农村居民消费价格指数;

农产品收购价格指数;

农村工业品零售价格指数;

观测数据见下表•

按年份用下列方法进行系统聚类分析,画出谱系聚类图,并给出聚为3类

的结果•

(a)最短距离法;

(b)最长距离法;

(c)类平均距离法;

表三全国各年度各种价格指数

年份

1985

128.1

100.0

134.2

166.8

111.1

1986

135.8

106.5

143.6

106.1

177.5

114.7

1987

145.7

114.3

156.2

112.7

198.8

120.2

1988

172.7

188.5

132.4

244.5

138.5

1989

203.4

160.2

219.2

157.9

281.2

164.4

1990

207.7

162.2

222.0

165.1

273.9

172.0

1991

213.7

170.8

233.3

168.9

268.4

177.2

1992

225.7

181.7

253.4

176.8

277.5

182.7

1993

254.9

208.4

294.2

201.0

314.7

204.3

1994

310.2

258.6

367.8

248.0

440.3

239.4

1995

356.1

302.8

429.6

291.4

527.9

274.6

1996

377.8

327.9

467.4

314.4

550.1

291.6

1997

380.8

337.1

481.9

322.3

525.3

294.8

1998

370.9

334.4

479.0

319.1

483.3

288.3

1999

359.8

329.7

472.8

314.3

424.3

280.5

2000

354.4

331.0

476.6

314.0

409.0

277.1

4.考察1985年至2000年全国如下各价格指数:

X2:

X4:

X6:

农村工业品零售价格指数;

先将数据标准化,再按年份用下列方法进行系统聚类分析,画出谱系聚类图,并给出聚

为3类的结果•

(c)重心距离法.

表四全国各年度各种价格指数

5.研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)。

居民非商品支出x3(亿元)的关系。

数据见表。

货运总量

y(万吨)

工业总产值

x1(亿元)

农业总产值

x2(亿元)

居民非商品支出

x3(亿元)

160

1.0

260

2.4

210

2.0

265

3.0

240

1.2

220

1.5

275

4.0

3.2

250

(1)计算出y,x1,x2,x3的相关系数矩阵;

(2)求y关于x1,x2,x3的三元线性回归方程;

(3)对回归方程作显著性检验;

(4)对每一个回归系数作显著性检验;

(5)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验;

(6)当x1、x2、x3的值为:

68,43,2.5时,试对货运总量作出预测。

6.某科学基金会的管理人员欲了解从事研究工作的数学家的年工资额y与他们的研究

成果(论文、著作等)的质量指标x1、从事研究工作的时间x2,以及能成功获得资助的指

标x3之间的关系。

为此,按一定的设计方案调查了24位此类型的数学家,得数据见下表。

y

x1

x2

x3

33.2

3.5

6.1

40.3

5.3

6.4

38.7

5.1

7.4

46.8

5.8

6.7

41.4

4.2

7.5

37.5

6.0

5.9

39.0

6.8

40.7

5.5

4.0

30.1

3.1

52.9

7.2

8.3

38.2

4.5

5.0

31.8

4.9

43.3

8.0

7.6

44.1

5.6

7.0

42.8

6.6

33.6

3.7

4.4

34.2

6.2

48.0

38.0

35.9

40.4

36.8

4.3

45.2

4.8

35.1

3.9

(1)计算出y,x1,x2,x3的相关系数矩阵;

(2)求y关于x1,x2,x3的三元线性回归方程;

(5)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再作回归

方程的显著性检验和回归系数的显著性检验;

(6)假设某位数学家的关于x1、x2、x3的值为:

5.1,20,7.2,试预测他得年工资额。

7.在某地区抽取了14块岩石标本,其中7块含矿,7块不含矿。

每块岩石测定了Cu,

Ag,Bi三种化学成分,数据如下:

Cu

Ag

Bi

2.58

0.90

0.95

2.90

1.23

1.00

3.55

2.35

0.79

3.54

1.85

2.70

2.23

1.30

1.70

0.48

1.06

2.16

1.80

2.33

1.10

1.48

1.94

1.40

3.00

2.78

(1)生成SAS数据集;

(2)用DISCRIM程序进行判别分析(假定先验概率相等,两类样本协差阵相等);

(3)在显著性水平:

•=0.1下讨论已知类型的两组企业特征是否有显著差异;

(4)写出距离判别的线性判别函数;

(5)现在取一块岩石标本测得Cu、Ag、Bi分别为:

2.95、2.15和1.54,试判别这块岩石标本是含矿还是不含矿,并统计已知类别样品的错判概率。

8.为了研究中小企业的破产模型,选定4个经济指标:

总负债率(现金收益/总负债)、X2收益性指标(纯收入/总财产)、X3短期支付能力(流动资产/流动负债)、X4生产效率性指标(流动资产/纯销售额)。

对17个破产企业(1类)和21个正常运行企业(2类)进行了调查,调查资料下表,试对这些指标作判别分析。

•=0.05讨论已知类型的两组企业特征是否有显著差异;

(5)利用后验概率对8个待判企业(*)进行判别归类,并统计已知类别样品的错判概

率。

(注:

将下列图片数据转换成表格数据)

2UI

nn?

UE

035

0.40

0.52

0.55

0河

U.2h

0.47

4.29

U45

I99

0.30

fi-4?

0]J

0.13

1.50

0.71

137

O.4D

&

0.44

0.56

0-3H

0.4R

0阳

(Ml

327

一h——

0!

Q

O.OS

0,33

0P

4,Z4

n.63

031

0(W

4„45

0,69

0.05

CM2

0.J7

OlM

—0.33

n.56

0.20

047

017

MR

aw

Y06

□U7

K

0.29

0.54

o.os

007

[.AO

TJ1I

nfl7

01.09

009

Q.]I

0.14

0.G4

001

-0.06

-00(

—0.34

Q0A

0,06

0*11

250

G4fi

26J

3.01

[.24

2,92

S-U6

[37

1.S4

9.表1中的1995年到2007年我国国民经济数据(数据来自于中国统计年鉴),通过典型相

 

关分析来来找出邮电业和国民经济之间相互影响的内在规律,根据这个规律,给决策者提供

一个当前如何发展邮电业的参考。

采用如下指标来衡量我国各年份的邮电业:

函件(亿件)

快递(万件)

移动电话年末用户(万户)

固定电话年末用户(万户),

采用下面的指标来衡量我国各年份的经济(单位都是万亿)

yi:

第一产业

y:

工业

y3:

建筑业

y4:

第三产业

(2)数据预处理;

匸0.05讨论已知类型的两组特征数据是否有显著差异;

(4)给出典型相关变量;

(5)给出典型相关系数;

(6)给决策者提供一个当前如何发展邮电业的参考。

y1

y2

y3

y4

79.55

5562.7

362.9

4070.6

12135.8

24950.6

3728.8

19978.5

78.68

7096.6

685.3

5494.7

14015.4

29447.6

4387.4

23326.2

68.55

6878.9

1323.3

7031.0

14441.9

32921.4

4621.6

26988.1

65.51

7331.8

2386.3

8742.1

14817.6

34018.4

4985.8

30580.5

60.52

9091.3

4329.6

10871.6

14770.0

35861.5

5172.1

33873.4

77.71

11031.4

8453.3

14482.9

14944.7

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 面试

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1