统计学第五版课后答案Word下载.docx

上传人:b****5 文档编号:16702552 上传时间:2022-11-25 格式:DOCX 页数:22 大小:113.86KB
下载 相关 举报
统计学第五版课后答案Word下载.docx_第1页
第1页 / 共22页
统计学第五版课后答案Word下载.docx_第2页
第2页 / 共22页
统计学第五版课后答案Word下载.docx_第3页
第3页 / 共22页
统计学第五版课后答案Word下载.docx_第4页
第4页 / 共22页
统计学第五版课后答案Word下载.docx_第5页
第5页 / 共22页
点击查看更多>>
下载资源
资源描述

统计学第五版课后答案Word下载.docx

《统计学第五版课后答案Word下载.docx》由会员分享,可在线阅读,更多相关《统计学第五版课后答案Word下载.docx(22页珍藏版)》请在冰豆网上搜索。

统计学第五版课后答案Word下载.docx

12.0

4

16.0

7

28.0

9

36.0

40.0

12

48.0

60.0

68.0

72.0

76.0

80.0

84.0

88.0

92.0

96.0

100.0

Total

从频数看出,众数Mo有两个:

19、23;

从累计频数看,中位数Me=23。

⑵根据定义公式计算四分位数。

Q1位置=25/4=6.25,因此Q仁19,Q3位置=3X25/4=18.75,因此Q3=27,或者,由于25

和27都只有一个,因此Q3也可等于25+0.75X2=26.5。

(3)计算平均数和标准差;

Mean=24.00;

Std.Deviation=6.652

(4)计算偏态系数和峰态系数:

Skewness=1.080Kurtosis=0.773

(5)对网民年龄的分布特征进行综合分析:

分布,均值=24、标准差=6.652、呈右偏分布。

如需看清楚分布形态,需要进行分组。

为分组情况下的直方图:

3.0

tnuoc

1111Q■1■■111■■■IIir

1516171819202122232425272930313438

I

2-

为分组情况下的概率密度曲线:

15161718

1920

21222324

2527293031

343841

分组:

1、确定组数:

才1g^

ig

(2)

.Ig25二1.1.398

Ig20.30103

二5.64,取k=6

2、确定组距:

组距=(最大值-最小值)-组数=(41-15)-6=4.3,取5

3、分组频数表

网络用户的年龄(Binned)

<

=15

16-20

8

32.0

21-25

26-30

31-35

36-40

41+

分组后的均值与方差:

23.3000

7.02377

Variance

49.333

Skewness

1.163

Kurtosis

1.302

分组后的直方图:

Mean=23.30

Std.Dev.=7.024

N=25

4.6在某地区抽取120家企业,按利润额进行分组,结果如下:

按利润额分组(万元)

企业数(个)

200~300

300~400

400~500

42

500~600

600以上

11

合计

120

(1)计算120家企业利润额的平均数和标准差。

(2)计算分布的偏态系数和峰态系数。

解:

企业利润组中值

Mi(万元)

426.6667

116.48445

0.208

Std.ErrorofSkewness

0.221

-0.625

Std.ErrorofKurtosis

0.438

Mean=426.67

Std.Dev.=116.484

N=120

Casesweightedby企业个数

4.9一家公司在招收职员时,首先要通过两项能力测试。

在A项测试中,其平均分数是100分,标准差是15分;

在B项测试中,

其平均分数是400分,标准差是50分。

一位应试者在A项测试中得了115分,在B项测试中得了425分。

与平均分数相比,该应

试者哪一项测试更为理想?

应用标准分数来考虑问题,该应试者标准分数高的测试理想。

x-x115-100x-x425-400

Za===1;

Zb===0.5因此,A项测试结果理想。

s15s50

4.11对10名成年人和10名幼儿的身高进行抽样调查,结果如下:

成年组

166169172177180170172174168173

幼儿组

68696870717372737475

(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?

为什么?

均值不相等,用离散系数衡量身高差异。

(2)比较分析哪一组的身高差异大?

平均

172.1

71.3

标准差

4.20佃51

2.496664

离散系数

0.024415

0.035016

幼儿组的身高差异大。

7.3从一个总体中随机抽取n=100的随机样本,得到x=104560,假定总体标准差b=86414,构建总体均值瓦的95%的置信区间。

已知n=100,x=104560,卢85414,1-:

■=95%

由于是正态总体,且总体标准差已知。

总体均值」在1<置信水平下的置信区间为

104560±

1.96X85414-V100=104560±

16741.144

==1.2

7.4从总体中抽取一个n=100的简单随机样本,得到x=81,s=12o

样本均值服从正态分布:

讥n或xlNi.g'

'

置信区间为:

「n丿I’n丿

(1)构建岂的90%的置信区间。

ZG2=z),05=1.645,置信区间为:

(81-1.645X1.2,81+1.645X1.2)=(79.03,82.97)

⑵构建「的95%的置信区间。

Z住2=Zj.025=1.96,置信区间为:

(81-1.96X1.2,81+1.96X1.2)=(78.65,83.35)

(3)构建」的99%的置信区间。

Z(y2=Z0.005=2.576,置信区间为:

(81-2.576X1.2,81+2.576X1.2)=(77.91,84.09)

7.5利用下面的信息,构建总体均值的置信区间

(1)x=25,b=3.5,n=60,置信水平为95%

(2)x=119.6,s=23.89,n=75,置信水平为95%

(3)x=3.419,s=0.974,n=32,置信水平为90%

衣土』曲竿或未知)解:

T'

/•1)1-:

.=95%,-J一'

-'

其置信区间为:

25±

1.96X3.5-V60=25±

0.885

2)1-:

.=98%,_则:

=0.02,:

/2=0.01,1-:

./2=0.99,查标准正态分布表,可知:

2.33

其置信区间为:

119.6±

2.33X23.89-V75=119.6±

6.345

3)1-尸90%1.65其置信区间为:

3.149±

1.65X0.974-V32=3.149±

0.284

7.7某大学为了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得

到下面的数据

(2)抽样平均误差:

重复抽样:

匚=1.61/6=0.268

s=、一n

3.3

3.1

6.2

5.8

2.3

4.1

5.4

4.5

3.2

4.4

2.0

2.6

6.4

1.8

3.5

5.7

2.1

1.9

1.2

5.1

4.3

4.2

3.6

0.8

1.5

4.7

1.4

2.9

2.4

0.5

2.5

求该校大学生平均上网时间的置信区间,置信水平分别为95%

(1)样本均值X=3.32,样本标准差s=1.61;

=0.268X、一0.995=0.268X0.998=0.267

(3)置信水平下的概率度:

1-a=0.95,t=Z/=z0.025=1.96

(4)边际误差(极限误差):

也x=t<

Tx=Zy21-a=0.95,也x=t=Z0.02^yx

重复抽样:

=Zot2=Z0.025Qx=1.96X0.268=0.525

不重复抽样:

也x=乙2=Z0.025Qx=1.96X0.267=0.523

(5)置信区间:

1-:

-=0.95,

x—x,xx=3.32—0.525,3.320.525=(2.79,3.85)

x—x,xx=3.32—0.441,3.320.441=(2.80,3.84)

7.8从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:

10、8、12、15、6、13、5、11.,求总体均值的95%的置

信区间

-工扎

先求样本均值:

本题为一个小样本正态分布,

狂一

=80-8=10

于是,

再求样本标准差:

V84/7=3.4641

卩的置信水平为1-a的置信区间是

已知1-a=25,n=8,_则a=0.05,a/2=0.025,查自由度为n-1=7的一分布表得临界值

ST

2.45

所以,置信区间为:

10±

2.45X3.4641-V7

7.11某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g。

现从某天生产的一批产品中按重复抽样随机抽取50

包进行检查,测得

每包重量(g)

包数

96~98

98~100

100~102

102~104

104~106

合计

已知食品包重量服从正态分布,要求:

(1)确定该种食品平均重量的95%的置信区间。

解:

大样本,总体方差未知,用z统计量

二LW

、、n

置信区间:

S

.n

样本均值=101.4,样本标准差s=1.829

X乙2

1—肚=0.95,Z/2=Zo.025=4.96

”101.4—1.96疋1:

829,101.4+1.96父18291=(100.89,101.91)

VV50V50丿

(2)如果规定食品重量低于l00g属于不合格,确定该批食品合格率的95%的置信区间。

总体比率的估计大样本,总体方差未知,用z统计量

LN0,1

样本比率=(50-5)/50=0.9

f

P久2

PZ2

P(—P)

0.9—1.96

0.91-0.9

1—E=0.95,^2=Z0.025=12.96

=(0.8168,0.9832)

7.佃某小区共有居民500户,小区管理着准备采用一项新的供水设施,想了解居民是否赞成。

采取重复抽样方法随机抽取了50户,

其中有32户赞成,18户反对。

1)已知N=50,P=32/50=0.64,a=0.05,a12=0.025,则

1.96

-<

V{P(1-P)/N}

=0.64±

1.96V0.64X0.36/50=0.64

±

1.96X0.48/7.07=0.64

0.133

2)已知丌=0.8,E=0.1,

a=0.05,

a/2=0.025

N=

=叼72丌(1-丌)/E2=1.962X0.8X0.2-0.12"

62

8.1已知某炼铁厂的含碳量服从正态分布N(4.55,0.1082),现在测定了9炉铁水,其平均含碳量为4.484,如果估计方差没有变化,

可否认为现在生产的铁水平均含碳量为4.55?

已知卩0=4.55,

a2=0.1082,

N=9,

=4.484

这里采用双侧检验,小样本,

a已知,使用Z统计。

假定现在生产的铁水平均含碳量与以前无显著差异。

则,

H0:

卩=4.55

H1

a=0.05,a/2=0.025

,查表得临界值为

计算检验统计量:

=(4.484-4.55)/(0.108/

V9)=-1.833

决策:

tZ值落入接受域,.••在:

=0.05的显著性水平上接受H0。

4.55

结论:

有证据表明现在生产的铁水平均含碳量与以前没有显著差异,可以认为现在生产的铁水平均含碳量为

8.2—种元件,要求其使用寿命不得低于700小时。

现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。

已知该

元件寿命服从正态分布,:

二=60小时,试在显著性水平0.05下确定这批元件是否合格。

H0:

详700;

応700已知:

X=680c=60

由于n=36>

30,大样本,因此检验统计量:

680二700

6036

当a=0.05,查表得Z=1.645。

因为ZV-乙.,故拒绝原假设,接受备择假设,说明这批产品不合格。

8.3某地区小麦的一般生产水平为亩产250公斤,其标准差为30公斤,先用一种花费进行试验,从25个小区抽样,平均产量为270

公斤。

这种化肥是否使小麦明显增产?

已知g0=250,a=30,N=25,x=270这里是小样本分布,a已知,用Z统计量。

右侧检验,a=0.05,_则Z炸1.645

提出假设:

假定这种化肥没使小麦明显增产。

即H0:

g<

250H1:

g>

250

计算统计量:

Z=(X-g0)/(aVN)=(270-250)/(30/V25)=3.33

Z统计量落入拒绝域,在a=0.05的显著性水平上,拒绝H0,接受H1。

有证据表明,这种化肥可以使小麦明显增产。

10..1从3个总体中各抽取容量不同的样本数据,结果如下。

检验3个总体的均值之间是否有显著差异

方差分析:

单因素方差分析

SUMMARY

观测数

求和

方差

样本1

5

790

158

61.5

样本2

600

150

36.66667

样本3

507

169

121

方差分析

差异源

SSdfMS

P-valueFcrit

组间

组内

618.9167

598

2309.4583

966.44444

4.65740.0408778.021517

总计1216.91711

10.。

2下面是来自5个总体的样本数据

37

12.33333

4.333333

48

0.666667

样本

80

样本5

6

78

13

SS

df

MS

F

P-value

Fcrit

93.76812

23.44203

15.82337

1.02E-05

4.579036

26.66667

1.481481

总计

120.4348

10.3一家牛奶公司有4台机器装填牛奶,每桶的容量为4L。

下面是从4台机器中抽取的样本数据:

机器l

机器2

机器3

机器4

4.05

3.99

3.97

4.00

4.01

4.02

3.98

4.04

3.95

4.0l

取显著性水平a=0.01,检验4台机器的装填量是否相同?

不相同。

地区

人均GDP元)

人均消费水平(元)

ANOVA

平方和

均方

显著性

0.007

0.002

8.721

0.001

0.004

0.000

总数

0.011

每桶容量(L)

11.6下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:

地区人均GDP元)人均消费水平(元)

北京

22460

7326

辽宁

11226

4490

上海

34547

11546

江西

4851

2396

河南

5444

2208

贵州

2662

1608

陕西

4549

2035

要求:

⑴人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

(4)计算判定系数,并解释其意义。

(5)检验回归方程线性关系的显著性(a=0.05)。

(6)如果某地区的人均GDP为5000元,预测其人均消费水平。

⑺求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。

6000

4000

2000

人12000

平10000

8000

010000200003000040000

人均GDP(元)

(1)可能存在线性关系

(2)相关系数:

有很强的线性关系。

相关性

人均GDP(元)

Pearson相关性

.998(**)

显著性(双侧)

**.在.01水平(双侧)上显著相关。

(3)回归方程:

回归系数的含义:

人均GDP没增加1元,人均消费增加0.309元

系数(a)

模型

非标准化系数标准化系数

B标准误Beta

t

(常量)

人均GDP

(元)

734.693139.540

0.3090.0080.998

5.265

36.492

0.003

a.因变量:

(4)人均GDP对人均消费的影响达到99.6%

模型摘要

R

R方调整的R方估计的标准差

.998(a)

0.9960.996247.303

a.预测变量:

(常量),人均GDP(元)

(5)F检验:

ANOVA(b)

回归

81,444,968.680

1,331.692

.000(a)

残差

305,795.034

61,159.007

81,750,763.714

a.预测变量:

b.因变量:

回归系数的检验:

t检验

B

标准误

Beta

734.693

0.309

139.540

0.008

0.998

(6)某地区的人均GDP为5000元,预测其人均消费水平为2278.10657元。

(7)人均GDP为5000元时,人均消费水平95%的置信区间为[1990.74915,2565.46399],预测区间为[1580.46315,2975.74999]。

(1)求总体中赞成该项改革的户数比例的置

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿教育 > 育儿理论经验

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1