15练习题pm.docx

上传人:b****6 文档编号:7843887 上传时间:2023-01-26 格式:DOCX 页数:14 大小:75.81KB
下载 相关 举报
15练习题pm.docx_第1页
第1页 / 共14页
15练习题pm.docx_第2页
第2页 / 共14页
15练习题pm.docx_第3页
第3页 / 共14页
15练习题pm.docx_第4页
第4页 / 共14页
15练习题pm.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

15练习题pm.docx

《15练习题pm.docx》由会员分享,可在线阅读,更多相关《15练习题pm.docx(14页珍藏版)》请在冰豆网上搜索。

15练习题pm.docx

15练习题pm

2015练习题及参考答案

统计学院李锋

练习题为老师个人行为,具体考试要求学生应该主要参考统计学院本学期学习要点及要求(参见文档2015统计学知识点。

教材:

应用统计学;马立平、刘娟编著首都经济贸易大学出版社

练习题仅供自己练习,不需要做好上交。

由于每年的教材有变化,部分内容本书没有,请按照本书内容和本学期要求选择参考.

 

1一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他

们的消费支付方式是用信用卡。

 

(1)这一研究的总体是什么?

样本是什么?

样本量是多少?

 

(2)“月收入”是分类变量、顺序变量还是数值变量?

 (3)“消费支付方式”是分类变量、顺序变量还是数值变量?

 详细答案:

 

(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。

 

(2)数值变量。

 (3)分类变量。

2下面是我国10个城市2006年各月份的气温数据:

月份

北京

沈阳

上海

南昌

郑州

武汉

广州

海口

重庆

昆明

1月

-1.9

-12.7

5.7

6.6

0.3

4.2

15.8

18.5

7.8

10.8

2月

-0.9

-8.1

5.6

6.5

3.9

5.8

17.3

20.5

9.0

13.2

3月

8.0

0.5

11.1

12.7

11.5

12.8

17.9

21.8

13.3

15.9

4月

13.5

8.0

16.6

19.3

17.1

19.0

23.6

26.7

19.2

18.0

5月

20.4

18.3

20.8

22.7

21.8

23.9

25.3

28.3

22.9

18.0

6月

25.9

21.6

25.6

26.0

27.8

28.4

27.8

29.4

25.4

20.4

7月

25.9

24.2

29.4

30.0

27.1

30.2

29.8

30.0

31.0

21.3

8月

26.4

24.3

30.2

30.0

26.1

29.7

29.4

28.5

32.4

20.6

9月

21.8

17.5

23.9

24.3

21.2

24.0

27.0

27.4

24.8

18.3

10月

16.1

11.6

22.1

22.1

19.0

21.0

26.4

27.1

20.6

16.9

11月

6.7

0.8

15.7

15.0

10.8

14.0

21.9

25.3

14.6

13.2

12月

-1.0

-6.7

8.2

8.1

3.0

6.8

16.0

20.8

9.4

9.8

绘制各城市月气温的箱线图,并比较各城市气温分布的特点。

详细答案:

箱线图如下:

  从箱线图可以看出,10个城市中气温变化最小的是昆明,最大的是沈阳。

从中位数来看,多数靠近上四分位数,说明多数城市的气温分布都有一定的左偏。

3一家公司在招收职员时,首先要通过两项能力测试。

在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。

一位应试者在A项测试中得了115分,在B项测试中得了425分。

与平均分数相比,该位应试者哪一项测试更为理想?

详细答案:

通过计算标准化值来判断,

,说明在A项测试中该应试者比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。

4一种产品需要人工组装,现有3种可供选择的组装方法。

为检验哪种方法更好,随机抽取15个工人,让他们分别用3种方法组装。

下面是15个工人分别用3种方法在相同的时间内组装的产品数量(单位:

个):

方法A

方法B

方法C

164

129

125

167

130

126

168

129

126

165

130

127

170

131

126

165

130

128

164

129

127

168

127

126

164

128

127

162

128

127

163

127

125

166

128

126

167

128

116

166

125

126

165

132

125

1.你准备用哪些统计量来评价组装方法的优劣?

2.如果让你选择一种方法,你会做出怎样的选择?

试说明理由。

详细答案:

3种方法的主要描述统计量如下:

方法A

方法B

方法C

平均

165.6

平均

128.73

平均

125.53

中位数

165

中位数

129

中位数

126

众数

164

众数

128

众数

126

标准差

2.13

标准差

1.75

标准差

2.77

峰度

-0.13

峰度

0.45

峰度

11.66

偏度

0.35

偏度

-0.17

偏度

-3.24

极差

8

极差

7

极差

12

离散系数

0.013

离散系数

0.014

离散系数

0.022

最小值

162

最小值

125

最小值

116

最大值

170

最大值

132

最大值

128

  

(1)从集中度、离散度和分布的形状三个角度的统计量来评价。

从集中度看,方法A的平均水平最高,方法C最低;从离散度看,方法A的离散系数最小,方法C最大;从分布的形状看,方法A和方法B的偏斜程度都不大,方法C则较大。

  

(2)综合来看,应该选择方法A,因为平均水平较高且离散程度较小。

5参数估计:

利用下面的信息,构建总体均值

的置信区间。

(1)总体服从正态分布,且已知

,置信水平为95%。

(2)总体不服从正态分布,且已知

,置信水平为95%。

(3)总体不服从正态分布,方差未知,

,置信水平为90%。

(4)总体不服从正态分布,方差未知,

,置信水平为99%。

详细答案:

(1)(8647,9153)。

(2)(8734,9066)。

(3)(8761,9039)。

(4)(8682,9118)。

6参数估计:

某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。

采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。

(1)求总体中赞成新措施的户数比例的置信区间,置信水平为95%。

(2)如果小区管理者预计赞成的比例能达到80%,要求估计误差不超过10%。

应抽取多少户进行调查?

详细答案:

(1)(51.37%,76.63%)。

(2)62。

7参数估计:

一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得到的自信心测试分数如下:

人员编号

方法1

方法2

1

78

71

2

63

44

3

72

61

4

89

84

5

91

74

6

49

51

7

68

55

8

76

60

9

85

77

10

55

39

构建两种方法平均自信心得分之差的95%的置信区间。

详细答案:

(6.33,15.67)。

8参数估计:

某超市想要估计每个顾客平均每次购物花费的金额。

根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求估计误差不超过20元,应抽取多少个顾客作为样本?

详细答案:

139。

9假设检验:

一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为7.25小时,标准差为2.5小时。

据报道,10年前每天每个家庭看电视的平均时间是6.70小时。

取显著性水平

,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?

详细答案:

=3.11,

<α,拒绝

,如今每个家庭每天收看电视的平均时间显著地增加了。

10假设检验:

安装在一种联合收割机的金属板的平均重量为25公斤。

对某企业生产的20块金属板进行测量,得到的重量数据如下:

22.6

26.6

23.1

23.5

27.0

25.3

28.6

24.5

26.2

30.4

27.4

24.9

25.8

23.2

26.9

26.1

22.2

28.1

24.2

23.6

  假设金属板的重量服从正态分布,在显著性水平α=0.05下,检验该企业生产的金属板是否符合要求?

详细答案:

>α,不拒绝

,没有证据表明该企业生产的金属板不符合要求。

11假设检验:

在对消费者的一项调查表明,17%的人早餐饮料是牛奶。

某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。

为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。

显著性水平下,检验该生产商的说法是否属实?

详细答案:

<α,拒绝H0,该生产商的说法属实。

(注意在0.01水平上不拒绝)

12假设检验:

某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。

样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。

潜在购买力的分值为0~10分,分值越高表示潜在购买力越高。

原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。

=0.05的显著性水平,用下列数据检验该假设,并对该广告给予评价。

购买力得分

购买力得分

个体

看后

看前

个体

看后

看前

1

6

5

5

3

5

2

6

4

6

9

8

3

7

7

7

7

5

4

4

3

8

6

6

详细答案:

=1.36,

<α,不拒绝

,广告提高了平均潜在购买力得分。

13方差分析:

某企业准备用3种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。

通过对每个工人生产的产品数进行方差分析得到下面的结果:

方差分析表

差异源

SS

df

MS

F

P-value

Fcrit

组间

 

 

210

 

0.245946

3.354131

组内

3836

 

 

总计

29

(1)完成上面的方差分析表。

(2)若显著性水平

,检验3种方法组装的产品数量之间是否有显著差异?

详细答案:

14相关和回归:

下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:

地区

人均GDP(元)

人均消费水平(元)

北京

22460

7326

辽宁

11226

4490

上海

34547

11546

江西

4851

2396

河南

5444

2208

贵州

2662

1608

陕西

4549

2035

(1)绘制散点图,并计算相关系数,说明二者之间的关系。

(2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

(3)计算判定系数和估计标准误差,并解释其意义。

(4)检验回归方程线性关系的显著性(

(5)如果某地区的人均GDP为5000元,预测其人均消费水平。

(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。

详细答案:

(1)散点图如下:

二者之间为高度的正线性相关关系。

,二者之间为高度的正线性相关关系。

(2)估计的回归方程为:

回归系数

表示人均GDP每变动1元,人均消费水平平均变动0.3087元。

(3)判定系数

表明在人均消费水平的变差中,有99.63%是由人均GDP与消费水平之间的关系决定的。

估计标准误差

,表示用人均GDP预测人均消费水平的平均误差为247.3元。

(4)检验统计量

,拒绝原假设,线性关系显著。

(5)

元。

(6)置信区间:

[1990.749,2565.464];预测区间:

[1580.463,2975.750]。

15相关和回归:

某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。

通过计算得到下面的有关结果:

方差分析表

变差来源

df

SS

MS

F

SignificanceF

回归

 

 

 

 

2.17E-09

残差

 

40158.07

 

总计

11

1642866.67

参数估计表

Coefficients

标准误差

tStat

P-value

Intercept

363.6891

62.45529

5.823191

0.000168

XVariable1

1.420211

0.071091

19.97749

2.17E-09

(1)完成上面的方差分析表。

(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?

(3)销售量与广告费用之间的相关系数是多少?

(4)写出估计的回归方程并解释回归系数的实际意义。

(5)检验线性关系的显著性(a=0.05)。

详细答案:

(1)方差分析表中所缺的数值如下:

方差分析表

变差来源

df

SS

MS

F

SignificanceF

回归

1

1602708.6

1602708.6

399.100

2.17E-09

残差

10

40158.07

4015.807

总计

11

1642866.67

(2)R2=SSR/SST=1602708.60/1642866.67=97.56。

表明汽车销售量的变差中有97.56%是由于广告费用的变动引起的。

(3)

r=0.9877

(4)

回归系数

表示广告费用每变动一个单位,销售量平均变动1.420211个单位。

(5)(回归系数显著性检验t检验。

)回归方程线性关系检验F检验:

SignificanceF=2.17E-09<α=0.05,线性关系显著。

16时间序列分析:

下表是1981年—1999年国家财政用于农业的支出额数据

年份

支出额(亿元)

年份

支出额(亿元)

1981

110.21

1991

347.57

1982

120.49

1992

376.02

1983

132.87

1993

440.45

1984

141.29

1994

532.98

1985

153.62

1995

574.93

1986

184.2

1996

700.43

1987

195.72

1997

766.39

1988

214.07

1998

1154.76

1989

265.94

1999

1085.76

1990

307.84

 

 

(1)绘制时间序列图描述其形态。

(2)计算年平均增长率。

(3)根据年平均增长率预测2000年的支出额。

详细答案:

(1)时间序列图如下:

  从时间序列图可以看出,国家财政用于农业的支出额大体上呈指数上升趋势。

(2)年平均增长率为:

(3)

17时间序列分析下表是1981年—2000年我国财政用于文教、科技、卫生事业费指出额数据

年份

支出(万元)

年份

支出(万元)

1981

171.36

1991

708.00

1982

196.96

1992

792.96

1983

223.54

1993

957.77

1984

263.17

1994

1278.18

1985

316.70

1995

1467.06

1986

379.93

1996

1704.25

1987

402.75

1997

1903.59

1988

486.10

1998

2154.38

1989

553.33

1999

2408.06

1990

617.29

2000

2736.88

(1)绘制时间序列图描述其趋势。

(2)选择一条适合的趋势线拟合数据,并根据趋势线预测2001年的支出额。

详细答案:

(1)趋势图如下:

(2)从趋势图可以看出,我国财政用于文教、科技、卫生事业费指出额呈现指数增长趋势,因此,选择指数曲线。

经线性变换后,利用Excel输出的回归结果如下:

回归统计

 

 

 

 

 

MultipleR

0.998423

 

 

 

 

 

RSquare

0.996849

 

 

 

 

 

AdjustedRSquare

0.996674

 

 

 

 

 

标准误差

0.022125

 

 

 

 

 

观测值

20

 

 

 

 

 

 

 

 

 

 

 

 

方差分析

 

 

 

 

 

 

  

df

SS

MS

F

SignificanceF

 

回归分析

1

2.787616

2.787616

5694.885

5.68E-24

 

残差

18

0.008811

0.000489

 

 

 

总计

19

2.796427

  

  

  

 

 

 

 

 

 

 

 

  

Coefficients

标准误差

tStat

P-value

Lower95%

Upper95%

Intercept

2.163699

0.010278

210.5269

5.55E-32

2.142106

2.185291

XVariable1

0.064745

0.000858

75.46446

5.68E-24

0.062942

0.066547

所以,指数曲线方程为:

2001年的预测值为:

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 成人教育 > 成考

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1