统计学第五版课后答案Word下载.docx

资源描述

统计学第五版课后答案Word下载.docx

《统计学第五版课后答案Word下载.docx》由会员分享，可在线阅读，更多相关《统计学第五版课后答案Word下载.docx（22页珍藏版）》请在冰豆网上搜索。

统计学第五版课后答案Word下载.docx

12.0

16.0

28.0

36.0

40.0

48.0

60.0

68.0

72.0

76.0

80.0

84.0

88.0

92.0

96.0

100.0

Total

从频数看出，众数Mo有两个：

19、23;

从累计频数看，中位数Me=23。

⑵根据定义公式计算四分位数。

Q1位置=25/4=6.25，因此Q仁19,Q3位置=3X25/4=18.75，因此Q3=27，或者，由于25

和27都只有一个，因此Q3也可等于25+0.75X2=26.5。

（3）计算平均数和标准差；

Mean=24.00;

Std.Deviation=6.652

（4）计算偏态系数和峰态系数：

Skewness=1.080Kurtosis=0.773

（5）对网民年龄的分布特征进行综合分析：

分布，均值=24、标准差=6.652、呈右偏分布。

如需看清楚分布形态，需要进行分组。

为分组情况下的直方图：

3.0

tnuoc

1111Q■1■■111■■■IIir

1516171819202122232425272930313438

为分组情况下的概率密度曲线:

15161718

1920

21222324

2527293031

343841

分组:

1、确定组数:

才1g^

（2）

.Ig25二1.1.398

Ig20.30103

二5.64，取k=6

2、确定组距：

组距=（最大值-最小值）-组数=（41-15）-6=4.3，取5

3、分组频数表

网络用户的年龄（Binned）

=15

16-20

32.0

21-25

26-30

31-35

36-40

41+

分组后的均值与方差:

23.3000

7.02377

Variance

49.333

Skewness

1.163

Kurtosis

1.302

分组后的直方图:

Mean=23.30

Std.Dev.=7.024

N=25

4.6在某地区抽取120家企业，按利润额进行分组，结果如下：

按利润额分组（万元）

企业数（个）

200~300

300~400

400~500

500~600

600以上

合计

120

（1）计算120家企业利润额的平均数和标准差。

（2）计算分布的偏态系数和峰态系数。

解:

企业利润组中值

Mi（万元）

426.6667

116.48445

0.208

Std.ErrorofSkewness

0.221

-0.625

Std.ErrorofKurtosis

0.438

Mean=426.67

Std.Dev.=116.484

N=120

Casesweightedby企业个数

4.9一家公司在招收职员时，首先要通过两项能力测试。

在A项测试中，其平均分数是100分，标准差是15分；

在B项测试中,

其平均分数是400分，标准差是50分。

一位应试者在A项测试中得了115分，在B项测试中得了425分。

与平均分数相比，该应

试者哪一项测试更为理想？

应用标准分数来考虑问题，该应试者标准分数高的测试理想。

x-x115-100x-x425-400

Za===1；

Zb===0.5因此，A项测试结果理想。

s15s50

4.11对10名成年人和10名幼儿的身高进行抽样调查，结果如下：

成年组

166169172177180170172174168173

幼儿组

68696870717372737475

（1）如果比较成年组和幼儿组的身高差异，你会采用什么样的统计量？

为什么？

均值不相等，用离散系数衡量身高差异。

（2）比较分析哪一组的身高差异大？

平均

172.1

71.3

标准差

4.20佃51

2.496664

离散系数

0.024415

0.035016

幼儿组的身高差异大。

7.3从一个总体中随机抽取n=100的随机样本，得到x=104560，假定总体标准差b=86414，构建总体均值瓦的95%的置信区间。

已知n=100，x=104560，卢85414，1-:

■=95%

由于是正态总体，且总体标准差已知。

总体均值」在1＜置信水平下的置信区间为

104560±

1.96X85414-V100=104560±

16741.144

==1.2

7.4从总体中抽取一个n=100的简单随机样本，得到x=81，s=12o

样本均值服从正态分布：

讥n或xlNi.g'

置信区间为:

「n丿I’n丿

（1）构建岂的90%的置信区间。

ZG2=z）,05=1.645，置信区间为:

（81-1.645X1.2,81+1.645X1.2）=（79.03，82.97）

⑵构建「的95%的置信区间。

Z住2=Zj.025=1.96，置信区间为:

（81-1.96X1.2,81+1.96X1.2）=（78.65，83.35）

（3）构建」的99%的置信区间。

Z（y2=Z0.005=2.576，置信区间为:

（81-2.576X1.2,81+2.576X1.2）=（77.91，84.09）

7.5利用下面的信息，构建总体均值的置信区间

（1）x=25,b=3.5,n=60，置信水平为95%

（2）x=119.6,s=23.89,n=75,置信水平为95%

（3）x=3.419,s=0.974,n=32，置信水平为90%

衣土』曲竿或未知）解：

/•1）1-：

.=95%，-J一'

其置信区间为：

25±

1.96X3.5-V60=25±

0.885

2）1-:

.=98%,_则：

=0.02,：

/2=0.01,1-：

./2=0.99,查标准正态分布表，可知：

2.33

其置信区间为:

119.6±

2.33X23.89-V75=119.6±

6.345

3）1-尸90%1.65其置信区间为：

3.149±

1.65X0.974-V32=3.149±

0.284

7.7某大学为了解学生每天上网的时间，在全校7500名学生中采取重复抽样方法随机抽取36人，调查他们每天上网的时间，得

到下面的数据

（2）抽样平均误差:

重复抽样:

匚=1.61/6=0.268

s=、一n

3.3

3.1

6.2

5.8

2.3

4.1

5.4

4.5

3.2

4.4

2.0

2.6

6.4

1.8

3.5

5.7

2.1

1.9

1.2

5.1

4.3

4.2

3.6

0.8

1.5

4.7

1.4

2.9

2.4

0.5

2.5

求该校大学生平均上网时间的置信区间，置信水平分别为95%

（1）样本均值X=3.32，样本标准差s=1.61;

=0.268X、一0.995=0.268X0.998=0.267

（3）置信水平下的概率度：

1-a=0.95,t=Z/=z0.025=1.96

（4）边际误差（极限误差）：

也x=t<

Tx=Zy21-a=0.95，也x=t=Z0.02^yx

重复抽样：

=Zot2=Z0.025Qx=1.96X0.268=0.525

不重复抽样：

也x=乙2=Z0.025Qx=1.96X0.267=0.523

（5）置信区间：

1-:

-=0.95,

x—x,xx=3.32—0.525,3.320.525=（2.79,3.85）

x—x,xx=3.32—0.441,3.320.441=（2.80,3.84）

7.8从一个正态总体中随机抽取样本量为8的样本，各样本值分别为：

10、8、12、15、6、13、5、11.,求总体均值的95%的置

信区间

-工扎

先求样本均值:

本题为一个小样本正态分布,

狂一

=80-8=10

于是，

再求样本标准差:

V84/7=3.4641

卩的置信水平为1-a的置信区间是

已知1-a=25,n=8,_则a=0.05,a/2=0.025，查自由度为n-1=7的一分布表得临界值

2.45

所以，置信区间为：

10±

2.45X3.4641-V7

7.11某企业生产的袋装食品采用自动打包机包装，每袋标准重量为l00g。

现从某天生产的一批产品中按重复抽样随机抽取50

包进行检查，测得

每包重量（g）

包数

96~98

98~100

100~102

102~104

104~106

合计

已知食品包重量服从正态分布，要求:

（1）确定该种食品平均重量的95%的置信区间。

解：

大样本，总体方差未知，用z统计量

二LW

、、n

置信区间:

样本均值=101.4，样本标准差s=1.829

X乙2

1—肚=0.95，Z/2=Zo.025=4.96

”101.4—1.96疋1：

829,101.4+1.96父18291=（100.89,101.91）

VV50V50丿

（2）如果规定食品重量低于l00g属于不合格，确定该批食品合格率的95%的置信区间。

总体比率的估计大样本，总体方差未知，用z统计量

LN0,1

样本比率=（50-5）/50=0.9

P久2

PZ2

P（—P）

（

0.9—1.96

0.91-0.9

1—E=0.95，^2=Z0.025=12.96

=（0.8168，0.9832）

7.佃某小区共有居民500户，小区管理着准备采用一项新的供水设施，想了解居民是否赞成。

采取重复抽样方法随机抽取了50户，

其中有32户赞成，18户反对。

1）已知N=50,P=32/50=0.64,a=0.05,a12=0.025，则

1.96

P±

V{P（1-P）/N}

=0.64±

1.96V0.64X0.36/50=0.64

1.96X0.48/7.07=0.64

0.133

2）已知丌=0.8,E=0.1,

a=0.05,

a/2=0.025

=叼72丌（1-丌）/E2=1.962X0.8X0.2-0.12"

8.1已知某炼铁厂的含碳量服从正态分布N（4.55,0.1082）,现在测定了9炉铁水，其平均含碳量为4.484,如果估计方差没有变化，

可否认为现在生产的铁水平均含碳量为4.55?

已知卩0=4.55,

a2=0.1082,

N=9,

=4.484

这里采用双侧检验，小样本,

a已知，使用Z统计。

假定现在生产的铁水平均含碳量与以前无显著差异。

则,

H0:

卩=4.55

a=0.05,a/2=0.025

，查表得临界值为

计算检验统计量:

=（4.484-4.55）/（0.108/

V9）=-1.833

决策：

tZ值落入接受域，.••在：

=0.05的显著性水平上接受H0。

4.55

结论：

有证据表明现在生产的铁水平均含碳量与以前没有显著差异，可以认为现在生产的铁水平均含碳量为

8.2—种元件，要求其使用寿命不得低于700小时。

现从一批这种元件中随机抽取36件，测得其平均寿命为680小时。

已知该

元件寿命服从正态分布，:

二=60小时，试在显著性水平0.05下确定这批元件是否合格。

H0:

详700;

応700已知：

X=680c=60

由于n=36>

30，大样本，因此检验统计量:

680二700

6036

当a=0.05，查表得Z=1.645。

因为ZV-乙.，故拒绝原假设，接受备择假设，说明这批产品不合格。

8.3某地区小麦的一般生产水平为亩产250公斤，其标准差为30公斤，先用一种花费进行试验，从25个小区抽样，平均产量为270

公斤。

这种化肥是否使小麦明显增产？

已知g0=250,a=30,N=25,x=270这里是小样本分布，a已知，用Z统计量。

右侧检验，a=0.05,_则Z炸1.645

提出假设：

假定这种化肥没使小麦明显增产。

即H0:

250H1:

250

计算统计量：

Z=（X-g0）/（aVN）=（270-250）/（30/V25）=3.33

Z统计量落入拒绝域，在a=0.05的显著性水平上，拒绝H0,接受H1。

有证据表明，这种化肥可以使小麦明显增产。

10..1从3个总体中各抽取容量不同的样本数据，结果如下。

检验3个总体的均值之间是否有显著差异

方差分析：

单因素方差分析

SUMMARY

组

观测数

求和

方差

样本1

790

158

61.5

样本2

600

150

36.66667

样本3

507

169

121

方差分析

差异源

SSdfMS

P-valueFcrit

组间

组内

618.9167

598

2309.4583

966.44444

4.65740.0408778.021517

总计1216.91711

10.。

2下面是来自5个总体的样本数据

12.33333

4.333333

0.666667

样本

样本5

P-value

Fcrit

93.76812

23.44203

15.82337

1.02E-05

4.579036

26.66667

1.481481

总计

120.4348

10.3一家牛奶公司有4台机器装填牛奶，每桶的容量为4L。

下面是从4台机器中抽取的样本数据：

机器l

机器2

机器3

机器4

4.05

3.99

3.97

4.00

4.01

4.02

3.98

4.04

3.95

4.0l

取显著性水平a=0.01，检验4台机器的装填量是否相同？

不相同。

地区

人均GDP元）

人均消费水平（元）

ANOVA

平方和

均方

显著性

0.007

0.002

8.721

0.001

0.004

0.000

总数

0.011

每桶容量（L）

11.6下面是7个地区2000年的人均国内生产总值（GDP）和人均消费水平的统计数据：

地区人均GDP元）人均消费水平（元）

北京

22460

7326

辽宁

11226

4490

上海

34547

11546

江西

4851

2396

河南

5444

2208

贵州

2662

1608

陕西

4549

2035

要求:

⑴人均GDP作自变量，人均消费水平作因变量，绘制散点图，并说明二者之间的关系形态。

（2）计算两个变量之间的线性相关系数，说明两个变量之间的关系强度。

（3）利用最小二乘法求出估计的回归方程，并解释回归系数的实际意义。

（4）计算判定系数，并解释其意义。

（5）检验回归方程线性关系的显著性（a=0.05）。

（6）如果某地区的人均GDP为5000元，预测其人均消费水平。

⑺求人均GDP为5000元时，人均消费水平95%的置信区间和预测区间。

6000

4000

2000

人12000

消

费

水

平10000

元

）

8000

010000200003000040000

人均GDP（元）

（1）可能存在线性关系

（2）相关系数：

有很强的线性关系。