《多元统计分析》第三版例题习题数.docx

上传人:b****6 文档编号:4688605 上传时间:2022-12-07 格式:DOCX 页数:64 大小:643.39KB
下载 相关 举报
《多元统计分析》第三版例题习题数.docx_第1页
第1页 / 共64页
《多元统计分析》第三版例题习题数.docx_第2页
第2页 / 共64页
《多元统计分析》第三版例题习题数.docx_第3页
第3页 / 共64页
《多元统计分析》第三版例题习题数.docx_第4页
第4页 / 共64页
《多元统计分析》第三版例题习题数.docx_第5页
第5页 / 共64页
点击查看更多>>
下载资源
资源描述

《多元统计分析》第三版例题习题数.docx

《《多元统计分析》第三版例题习题数.docx》由会员分享,可在线阅读,更多相关《《多元统计分析》第三版例题习题数.docx(64页珍藏版)》请在冰豆网上搜索。

《多元统计分析》第三版例题习题数.docx

《多元统计分析》第三版例题习题数

何晓群《多元统计分析》第三版(2012)数据下载

第2章

[例2-1]1999年财政部、国家经贸委、人事部和国家计委联合发布了《国有资本金效绩评价规则》。

其中,对竞争性工商企业的评价指标体系包括下面八大基本指标:

净资产收益率、总资产报酬率、总资产周转率、流动资产周转率、资产负债率、已获利息倍数、销售增长率和资本积累率。

下面我们借助于这一指标体系对我国上市公司的运营情况进行分析,以下数据为35家上市公司2008年年报数据,这35家上市公司分别来自于电力、煤气及水的生产和供应业,房地行业,信息技术业,在后面各章中也经常以该数据为例进行分析。

表2-1

行业

公司简称

股票代码

净资产收益率

总资产报酬率

资产负债率

总资产周转率

流动资产周转率

已获利息倍数

销售增长率

资本积累率

电力、煤气及水的生产和供应业

深圳能源

000027

9.17

4.92

53.45

.39

1.57

3.56

2.76

33.00

深南电A

000037

.61

1.23

61.17

.60

1.74

1.41

-12.81

-.01

富龙热电

000426

-11.30

-5.56

48.89

.13

.76

-.34

-40.10

-9.93

穗恒运A

000531

-7.70

-1.53

70.25

.57

2.70

.61

-29.45

-7.15

粤电力A

000539

.34

-1.15

54.84

.48

2.42

.52

11.78

-7.72

韶能股份

000601

-2.95

-1.29

61.79

.27

2.52

.53

15.77

-4.67

ST惠天

000692

-1.86

-.81

63.34

.40

1.09

.43

8.08

-1.82

城投控股

600649

12.28

8.46

39.92

.25

.57

40.20

29.21

-2.19

大连热电

600719

1.58

.96

60.53

.32

.70

1.31

-3.44

.75

华电能源

600726

.43

.33

77.63

.40

2.39

1.08

12.66

-6.04

国电电力

600795

1.26

.20

71.65

.26

1.68

1.10

-5.88

5.68

房地行业

长春经开

600215

.09

.21

29.10

.05

.08

1.23

9.07

.09

大龙地产

600159

1.21

.09

61.63

.04

.05

1.84

-57.90

-.08

金丰投资

600606

9.78

6.51

46.07

.20

.31

6.22

-51.99

-8.40

新黄浦

600638

6.81

5.96

31.91

.12

.31

5.57

-18.48

4.99

浦东金桥

600639

9.02

6.16

42.74

.20

.86

4.51

40.62

4.75

外高桥

600648

6.90

2.09

78.11

.70

2.47

7.04

19.88

5.21

中华企业

600675

14.31

6.82

63.67

.37

.44

5.89

33.93

11.82

渝开发A

000514

6.53

5.14

31.61

.14

.40

4.42

-15.56

6.64

莱茵置业

000558

21.22

7.95

73.67

.44

.52

1.04

-13.15

28.42

粤宏远A

000573

-8.47

-4.84

44.12

.14

.24

-3.90

-26.72

-7.81

中国国贸

600007

8.40

6.21

48.06

.12

3.04

1.10

1.20

5.06

万科A

000002

12.65

5.77

67.44

.37

.39

10.62

15.38

8.93

三木集团

000632

1.96

1.05

80.12

.88

.95

1.74

-11.30

-9.55

国兴地产

000838

2.97

2.21

44.34

.17

.17

30.65

-74.76

3.06

中关村

000931

9.69

1.72

80.11

.47

.57

2.03

-7.90

1.59

信息技术业

中兴通讯

000063

11.65

5.02

70.15

.98

1.21

4.28

27.36

17.40

长城电脑

000066

1.01

.39

53.93

1.35

3.57

1.22

-6.99

-30.87

南天信息

000948

9.48

6.61

45.43

1.06

1.41

4.62

15.13

110.72

同方股份

600100

3.57

2.63

53.32

.78

.00

2.79

-4.77

26.72

永鼎股份

600105

2.54

1.69

71.91

.42

.63

1.87

27.49

2.63

宏图高科

600122

10.71

5.42

57.49

1.77

2.12

3.21

33.03

11.23

新大陆

000997

4.54

3.74

31.88

.86

1.09

7.49

18.42

-6.27

方正科技

600601

4.42

3.16

43.95

1.40

4.67

3.06

-13.58

4.73

复旦复华

600624

4.44

3.68

49.44

.53

.85

3.19

13.57

2.60

习题3.今选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等9个内陆边远省份。

选取人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口的比例等五项能够较好的说明各地区社会经济发展水平的指标。

验证一下边远及少数民族聚居区的社会经济水平与全国平均水平有无显著差异。

边远及少数民族聚居区的社会经济水平发展的指标数据:

地区

人均GDP

三产比重

人均消费

人口增长

文盲半文盲

内蒙古

5068

31.1

2141

8.23

15,83

广西

4076

34.2

2040

9.01

13.32

贵州

2342

29.8

1551

14.26

28.98

云南

4355

31.1

2059

12.1

25.48

西藏

3716

43.5

1551

15.9

57.97

宁夏

4270

37.3

1947

13.08

25.56

新疆

6229

35.4

2745

12.81

11.44

甘肃

3456

32.8

1612

10..04

28.65

青海

4367

40.9

2047

14.48

42.92

数据来源:

《中国统计年鉴》(1998)。

5项指标的全国平均水平

μ0=(6212.0132.8729729.515.78)/

第3章

例3-1若我们需要将下列11户城镇居民按户主个人的收入进行分类,对每户作了如下的统计,结果列于表3-1。

在表中,“标准工资收入”、“职工奖金”、“职工津贴”、“性别”、“就业身份”等称为指标,每户称为样品。

若对户主进行分类,还可以采用其他指标,如“子女个数”、“政治面貌”等,指标如何选择取决于聚类的目的。

表3-1某市2001年城镇居民户主个人收入数据

X1职工标准工资收入X5单位得到的其他收入

X2职工奖金收入X6其他收入

X3职工津贴收入X7性别

X4其他工资性收入X8就业身份

X1

X2

X3

X4

X5

X6

X7

X8

540.00

0.0

0.0

0.0

0.0

6.00

国有

1137.00

125.00

96.00

0.0

109.00

812.00

集体

1236.00

300.00

270.00

0.0

102.00

318.00

国有

1008.00

0.0

96.00

0.0

86.0

246.00

集体

1723.00

419.00

400.00

0.0

122.00

312.00

国有

1080.00

569.00

147.00

156.00

210.00

318.00

集体

1326.00

0.0

300.00

0.0

148.00

312.00

国有

1110.00

110.00

96.00

0.0

80.00

193.00

集体

1012.00

88.00

298.00

0.0

79.00

278.00

国有

1209.00

102.00

179.00

67.00

198.00

514.00

集体

1101.00

215.00

201.00

39.00

146.00

477.00

集体

例3-3

English

Norwegian

Danish

Dutch

German

French

One

En

en

een

ein

un

Two

To

to

twee

zwei

deux

Three

Tre

tre

drie

drei

trois

Four

Fire

fire

vier

vier

quatre

Five

Fem

fem

vijf

funf

einq

Six

Seks

seks

zes

sechs

six

seven

Sju

syv

zeven

siebcn

sept

Eight

Ate

otte

acht

acht

huit

Nine

Ni

ni

negen

neun

neuf

Ten

Ti

ti

tien

zehn

dix

Spanish

Italian

Polish

Hungarian

Finnish

Uno

uno

jeden

egy

yksi

Dos

due

dwa

ketto

kaksi

Tres

tre

trzy

harom

kolme

cuatro

quattro

cztery

negy

neua

Cinco

cinque

piec

ot

viisi

Seix

sei

szesc

hat

kuusi

Siete

sette

siedem

het

seitseman

Ocho

otto

osiem

nyolc

kahdeksau

nueve

nove

dziewiec

kilenc

yhdeksan

Diez

dieci

dziesiec

tiz

kymmenen

例3-4

X1食品支出(元/人)X5交通和通讯支出(元/人)

X2衣着支出(元/人)X6娱乐、教育和文化服务支出(元/人)

X3家庭设备、用品及服务支出(元/人)X7居住支出(元/人)

X4医疗保健支出(元/人)X8杂项商品和服务支出(元/人)

X1

X2

X3

X4

X5

X6

X7

X8

辽宁

1772.14

568.25

298.66

352.20

307.21

490.83

364.28

202.50

浙江

2752.25

569.95

662.31

541.06

623.05

917.23

599.98

354.39

河南

1386.76

460.99

312.97

280.78

246.24

407.26

547.19

188.52

甘肃

1552.77

517.16

402.03

272.44

265.29

563.10

302.27

251.41

青海

1711.03

458.57

334.91

307.24

297.72

495.34

274.48

306.45

例3-5

x1人均粮食支出(元/人)x5人均衣着支出(元/人)

x2人均副食支出(元/人)x6人均日用杂品支出(元/人)

x3人均烟、酒、饮料支出(元/人)x7人均水电燃料支出(元/人)

x4人均其他副食支出(元/人)x8人均其他非商品支出(元/人)

x1

x2

x3

x4

x5

x6

x7

x8

北京

21.30

124.89

35.43

73.98

93.01

20.58

43.97

433.73

天津

21.50

122.39

29.08

51.64

55.04

11.30

54.88

288.13

河北

18.25

90.21

24.45

32.44

62.48

7.45

47.50

178.84

山西

21.84

66.38

18.05

31.32

74.48

8.19

34.97

177.45

内蒙古

21.37

67.08

20.28

35.27

81.07

10.94

39.46

182.20

辽宁

22.74

115.88

28.21

42.44

58.07

9.63

48.65

194.85

吉林

20.22

88.94

18.54

35.63

65.72

8.81

50.29

186.52

黑龙江

21.33

75.50

14.00

29.56

69.29

8.24

42.08

165.90

上海

21.13

168.69

40.81

70.12

74.32

15.46

50.90

422.74

江苏

18.61

122.51

27.07

42.50

63.47

15.38

36.14

240.92

浙江

19.96

142.24

43.33

50.74

101.77

12.92

53.44

394.55

安徽

19.61

107.13

32.85

35.77

61.34

7.53

34.60

142.23

福建

25.56

171.65

22.30

40.53

57.13

12.60

54.03

225.08

江西

18.75

104.68

15.55

35.61

51.80

11.18

36.27

142.72

山东

18.27

88.34

19.07

43.19

72.98

12.59

42.16

200.18

河南

19.07

73.18

18.01

29.38

64.51

8.91

38.14

155.45

湖北

18.76

102.67

21.87

30.47

64.33

11.99

42.14

168.17

湖南

20.25

104.45

20.72

38.15

62.98

12.67

39.16

213.56

广东

23.68

173.30

17.43

43.59

53.66

16.86

65.02

385.94

广西

18.70

131.35

11.69

32.06

41.54

10.84

42.77

178.51

海南

16.16

139.92

12.98

23.58

24.87

10.76

32.35

144.21

重庆

18.18

120.39

26.18

37.94

68.16

11.64

38.48

246.37

四川

18.53

109.95

21.49

33.04

50.98

10.88

33.96

183.85

贵州

18.33

92.43

25.38

32.19

56.32

14.00

38.57

144.82

云南

22.30

99.08

33.36

32.01

52.06

7.04

32.85

190.04

西藏

29.67

146.90

64.51

54.36

86.10

14.77

32.19

193.10

陕西

20.03

70.75

19.75

34.95

53.29

10.55

38.20

189.41

甘肃

18.68

72.74

23.72

38.69

62.41

9.65

35.26

170.12

青海

20.33

75.64

20.88

33.86

53.81

10.06

32.82

171.32

宁夏

19.75

70.24

18.67

36.71

61.75

10.08

40.26

165.22

新疆

21.03

78.55

14.35

34.33

64.98

9.83

33.87

161.67

第4章

[例4-1]判别分析的一个重要应用是用于动植物的分类当中,最著名的一个例子是1936年Fisher的鸢尾花数据(IrisData)。

鸢尾花为法国的国花,Setosa、Versicolour、Virginica是三种有名的鸢尾花,其萼片是绚丽多彩的,和向上的花瓣不同,花萼是下垂的。

这三种鸢尾花很像,人们试图建立模型,根据萼片和花瓣的四个度量来把鸢尾花分类。

该数据给出150个鸢尾花的萼片长(sepallength)、萼片宽(sepalwidth)、花瓣长(petallength)、花瓣宽(petalwidth)以及这些花分别属于的种类(Species)等共五个变量。

萼片和花瓣的长宽为四个定量变量,而种类为分类变量(取三个值Setosa、Versicolour、Virginica)。

这里三种鸢尾花各有50个观测值。

数据格式如下图所示:

定义新的变量y为被解释变量,用“1”代表Setosa鸢尾花,用“2”代表Versicolour鸢尾花,用“3”代表Virginica鸢尾花,将萼片长(sepallength)、萼片宽(sepalwidth)、花瓣长(petallength)和花瓣宽(petalwidth)四个变量作为解释变量。

使用SPSS软件中的Analyze→Classify→Discriminant,就进入了判别分析的对话框。

分组变量(GroupingVariable)选择y,然后定义

的区域,最小值是1,最大值是3。

解释变量(Independents)选择sepal.length、sepal.width、petal.length和petal.width。

统计量(Statistics)选项中选择描述统计量Means,UnivariateANOVAs和Box’M,函数选择Fisher和非标准化函数,矩阵选择Within-groupscorrelation。

分类(Classify)选项中选择先验概率(所有组相等或根据组的大小计算概率),因为三个品种的都是50种,因此两种选择的效果一样,子选项显示(display)中选择每个个体的结果(Casewiseresults),综合表(SummeryTable)和“留一个在外”(Leave-one-outclassifation)的验证原则,协方差矩阵选择Within-groups,作图选择Combined-groups。

保存(Save)选项中可以选择预测的分类、判别得分以及所属类别的概率。

如果采用逐步判别法,我们还可以选择判别的方法(Method)。

得到分析结果如下:

输出结果4-1

Discriminant

(1)

(2)

(3)

输出结果4-1分析的是各组的描述统计量和对各组均值是否相等的检验。

第1张表反映的是有效样本量及变量缺失的情况。

第2张表是各组变量的描述统计分析。

第3张表是对各组均值是否相等的检验。

由第3张表可以看出,在0.01的显著性水平上我们拒绝变量萼片长(sepallength)、萼片宽(sepalwidth)、花瓣长(petallength)和花瓣宽(petalwidth)在三组的均值相等的假设,即认为变量萼片长(sepallength)、萼片宽(sepalwidth)、花瓣长(petallength)和花瓣宽(petalwidth)在三组的均值是有显著性差异的。

输出结果4-2

Box'sTestofEqualityofCovarianceMatrices

(1)

(2)

输出结果4-2是对各组协方差矩阵是否相等的Box’M检验。

第1张表反映协方差矩阵的秩和行列式的对数值。

由行列式值可以看出协方差矩阵不是病态矩阵。

第2张表是对各总体协方差阵是否相等的统计检验。

值及其显著水平,我们在0.05的显著性水平下拒绝原假设(原假设假定各总体协方差阵相等)。

因此,在分类(Classify)选项中的协方差矩阵选择可以考虑采用Separate-groups,以检验采用Within-groups和Separate-groups两种协方差所得出的结果是否存在显著差异。

如果存在显著差异就应该采用Separate-groups协方差矩阵,反之,就用Within-groups协方差矩阵。

输出结果4-3

SummaryofCanonicalDiscriminantFunctions

(1)

(2)

输出结果4-3分析的是典型判别函数。

第1张表反映判别函数的特征值、解释方差的比例和典型相关系数。

第一判别函数解释了99.1%的方差,第二判别函数解释了0.9%的方差,两个判别函数解释了全部方差。

第2张表是对两个判别函数的显著性检验。

由Wilks’Lambda检验,认为两个判别函数在0.05的显著性水平上是显著的。

输出结果4-4

(1)

(2)

(3)

(4)

输出结果4-4显示的是判别函数、判别载荷和各组的重心。

第1张表是标准化的判别函数,表示为

,这里

表示标准化变量,标准化变量的系数也就是前面讲的判别权重。

第2张表是结构矩阵,即判别载荷。

由判别权重和判别载荷可以看出两个解释变量对判别函数的贡献较大。

第3张表是非标准化的判别函数,表示为

我们可以根据这个判别函数计算每个观测的判别Z得分。

第4张表是反映判别函数在各

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 理化生

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1