统计学第三版课后习题答案.docx

资源描述

统计学第三版课后习题答案.docx

《统计学第三版课后习题答案.docx》由会员分享，可在线阅读，更多相关《统计学第三版课后习题答案.docx（29页珍藏版）》请在冰豆网上搜索。

统计学第三版课后习题答案.docx

统计学第三版课后习题答案

Hah和网速是无形的

1：

各章练习题答案

2.1

（1）属于顺序数据。

（2）频数分布表如下:

服务质量等级评价的频数分布

服务质量等级

家庭数（频率）

频率%

合计

100

（3）条形图（略）

2.2

（1）频数分布表如下:

40个企业按产品销售收入分组表

按销售收入分组

（万元）

企业数

（个）

频率

（％）

向上累积

向下累积

企业数

频率

企业数

频率

100以下

100~110

110～120

120~130

130～140

140以上

12.5

22.5

30。

17.5

10。

7.5

12。

35。

65.0

82。

92.5

100.0

87。

65.0

35.0

17。

7.5

合计

100.0

—

（2）某管理局下属40个企分组表

按销售收入分组（万元）

企业数（个）

频率（％）

先进企业

良好企业

一般企业

落后企业

27.5

27。

22。

合计

100。

2.3频数分布表如下：

某百货公司日商品销售额分组表

按销售额分组（万元）

频数（天）

频率（％）

25～30

30～35

35～40

40～45

45～50

10.0

15.0

37.5

22。

15.0

合计

100。

直方图（略）。

2.4

（1）排序略.

（2）频数分布表如下:

100只灯泡使用寿命非频数分布

按使用寿命分组（小时）

灯泡个数（只）

频率（％）

650～660

660~670

670～680

680～690

690~700

700～710

710～720

720～730

730～740

740~750

合计

直方图（略）。

（3）茎叶图如下：

2.5

（1）属于数值型数据.

（2）分组结果如下:

分组

天数（天）

-25～-20

-20~-15

—15~-10

-10~—5

—5~0

0~5

5～10

合计

（3）直方图（略）。

2.6

（1）直方图（略）。

（2）自学考试人员年龄的分布为右偏。

2.7

（1）茎叶图如下：

A班

树茎

B班

数据个数

树叶

数据个数

0448

122456677789

97665332110

011234688

98877766555554443332100

00113449

6655200

123345

632220

011456

000

（2）A班考试成绩的分布比较集中，且平均分数较高;B班考试成绩的分布比A班分散,

且平均成绩较A班低。

2.8箱线图如下：

（特征请读者自己分析）

2.9

（1）=274.1（万元）；Me=272.5；QL=260。

25；QU=291。

25。

（2）（万元）。

2.10

（1）甲企业平均成本＝19。

41（元）,乙企业平均成本＝18。

29（元）；原因：

尽管两个企业的单位成本相同，但单位成本较低的产品在乙企业的产量中所占比重较大，因此拉低了总平均成本。

2.11=426.67（万元）；（万元）。

2.12

（1）

（2）两位调查人员所得到的平均身高和标准差应该差不多相同，因为均值和标准差的大小基本上不受样本大小的影响。

（3）具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大，变化的范围就可能越大.

2.13

（1）女生的体重差异大，因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。

（2）男生：

=27。

27（磅），（磅）；

女生：

=22。

73（磅），（磅）；

（3）68%；

（4）95%。

2.14

（1）离散系数,因为它消除了不同组数据水平高地的影响。

（2）成年组身高的离散系数：

；

幼儿组身高的离散系数：

；

由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。

2.15下表给出了一些主要描述统计量，请读者自己分析。

方法A

方法B

方法C

平均

165.6

平均

128。

平均

125.53

中位数

165

中位数

129

中位数

126

众数

164

众数

128

众数

126

标准偏差

2。

标准偏差

1.75

标准偏差

2。

极差

最小值

162

最小值

125

最小值

116

最大值

170

最大值

132

最大值

128

2.16

（1）方差或标准差;

（2）商业类股票；（3）（略）。

2.17（略）。

第3章概率与概率分布

3。

1设A＝女性，B＝工程师，AB＝女工程师,A+B＝女性或工程师

（1）P（A）＝4/12＝1/3

（2）P（B）＝4/12＝1/3

（3）P（AB）＝2/12＝1/6

（4）P（A+B）＝P（A）＋P（B）－P（AB）＝1/3＋1/3－1/6＝1/2

3。

2求这种零件的次品率，等于计算“任取一个零件为次品”（记为A）的概率。

考虑逆事件“任取一个零件为正品”，表示通过三道工序都合格。

据题意，有：

于是

3.3设A表示“合格",B表示“优秀".由于B＝AB,于是

＝0。

8×0。

15＝0。

3.4设A＝第1发命中.B＝命中碟靶。

求命中概率是一个全概率的计算问题.再利用对立事件的概率即可求得脱靶的概率。

＝0。

8×1＋0.2×0.5＝0.9

脱靶的概率＝1－0。

9＝0.1

或（解法二）：

P（脱靶）＝P（第1次脱靶）×P（第2次脱靶）＝0。

2×0.5＝0。

3。

5设A＝活到55岁，B＝活到70岁。

所求概率为：

3。

6这是一个计算后验概率的问题。

设A＝优质率达95%，＝优质率为80％，B＝试验所生产的5件全部优质。

P（A）＝0.4，P（）＝0.6，P（B｜A）=0。

955，P（B｜）=0。

85，所求概率为：

决策者会倾向于采用新的生产管理流程。

3.7令A1、A2、A3分别代表从甲、乙、丙企业采购产品，B表示次品。

由题意得:

P（A1）＝0。

25,P（A2）＝0.30，P（A3）＝0.45；P（B｜A1）＝0.04，P（B|A2）＝0.05，P（B|A3）＝0。

03；因此，所求概率分别为:

（1）

＝0.25×0.04＋0.30×0.05＋0。

45×0。

03＝0。

0385

（2）

3.8据题意,在每个路口遇到红灯的概率是p＝24/（24+36）＝0。

4。

设途中遇到红灯的次数＝X,因此，X～B（3，0。

4）。

其概率分布如下表：

P（X=xi）

0。

216

0。

432

0.288

0。

064

期望值（均值）＝1.2（次），方差＝0。

72，标准差＝0。

8485（次）

3.9设被保险人死亡数＝X，X~B（20000，0.0005）。

（1）收入＝20000×50（元）＝100万元。

要获利至少50万元,则赔付保险金额应该不超过50万元，等价于被保险人死亡数不超过10人.所求概率为：

P（X≤10）＝0。

58304。

（2）当被保险人死亡数超过20人时，保险公司就要亏本。

所求概率为：

P（X>20）＝1－P（X≤20）＝1－0.99842＝0.00158

（3）支付保险金额的均值＝50000×E（X）

＝50000×20000×0.0005（元）＝50（万元）

支付保险金额的标准差＝50000×σ（X）

＝50000×（20000×0.0005×0。

9995）1/2＝158074（元）

3.10

（1）可以。

当n很大而p很小时，二项分布可以利用泊松分布来近似计算。

本例中，λ=np=20000×0。

0005=10，即有X～P（10）。

计算结果与二项分布所得结果几乎完全一致。

（2）也可以。

尽管p很小,但由于n非常大,np和np（1-p）都大于5，二项分布也可以利用正态分布来近似计算。

本例中,np=20000×0.0005=10，np（1—p）=20000×0.0005×（1—0.0005）=9.995，

即有X~N（10,9。

995）.相应的概率为:

P（X≤10.5）＝0。

51995，P（X≤20.5）＝0。

853262.

可见误差比较大（这是由于P太小，二项分布偏斜太严重）。

【注】由于二项分布是离散型分布，而正态分布是连续性分布,所以，用正态分布来近似计算二项分布的概率时，通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点，这就是所谓的“连续性校正"。

（3）由于p＝0.0005，假如n=5000，则np＝2.5〈5，二项分布呈明显的偏态，用正态分布来计算就会出现非常大的误差.此时宜用泊松分布去近似。

3。

（1）＝0。

04779

合格率为1—0.04779＝0。

95221或95。

221％。

（2）设所求值为K，满足电池寿命在200±K小时范围内的概率不小于0.9,即有：

即：

，K/30≥1。

64485,故K≥49.3456。

3。

12设X＝同一时刻需用咨询服务的商品种数，由题意有X～B（6，0.2）

（1）X的最可能值为：

X0＝［（n+1）p］＝［7×0。

2]＝1（取整数）

（2）

＝1-0.9011＝0.0989

第4章抽样与抽样分布

4。

1a.20，2b.近似正态c.-2。

25d。

1.50

4。

2a。

0.0228b。

0。

0668c。

0。

0062d。

0.8185e.0。

0013

4。

3a。

0.8944b。

0。

0228c。

0.1292d。

0。

9699

4.4a。

101,99b。

1c。

不必

4。

5趋向正态

4.6。

a。

正态分布，213,4。

5918b。

0.5，0。

031，0。

938

4.7。

a.406,1.68，正态分布b。

0。

001c。

是，因为小概率出现了

4.8.a。

增加b.减少

4。

9.a。

正态b.约等于0c。

不正常d.正态，0.06

4.10a。

0.015b。

0.0026c.0.1587

4.11.a.（0。

012,0。

028）b。

0.6553,0。

7278

4.12.a.0。

05b.1c。

0。

000625

第5章参数估计

5.1

（1）。

（2）E=1.55。

5.2

（1）。

（2）E=4.2。

（3）（115.8,124.2）.

5.3（2。

88，3.76）;（2。

80，3.84）;（2。

63,4.01）。

5.4（7.1，12。

9）.

5.5（7.18，11。

57）。

5.6（18。

11%，27。

89%）；（17。

17%，22。

835）。

5.7

（1）（51。

37%，76.63%）；

（2）36。

5.8（1.86，17。

74）；（0.19,19。

41）。

5.9

（1）2±1。

176;

（2）2±3.986；（3）2±3.986；（4）2±3.587；（5）2±3.364。

5.10

（1），；

（2）1。

75±4。

27.

5.11

（1）10％±6.98％；

（2）10%±8。

32%。

5.12（4。

06，14.35）。

5.1348。

5.14139。

5.1557。

5.16769.

第6章假设检验

6.1研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”，所以原假设与备择假设应为：

，。

6.2＝“某一品种的小鸡因为同类相残而导致的死亡率",，。

6.3，。

6.4

（1）第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克，但检验结果却提供证据支持店方倾向于认为其重量少于60克；

（2）第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点，从而拒收这批产品；

（3）连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。

6.5

（1）检验统计量,在大样本情形下近似服从标准正态分布；

（2）如果,就拒绝；

（3）检验统计量＝2。

94〉1。

645，所以应该拒绝。

6.6＝3.11，拒绝。

6.7＝1。

93，不拒绝.

6.8＝7.48，拒绝。

6.9＝206.22，拒绝。

6.10＝—5。

145，拒绝.

6.11＝1。

36，不拒绝。

6.12＝-4.05，拒绝。

6.13＝8。

28,拒绝。

6.14

（1）检验结果如下：

t—检验：

双样本等方差假设

变量1

变量2

平均

100。

109.9

方差

24.11578947

33。

35789474

观测值

合并方差

28.73684211

假设平均差

tStat

—5.427106029

P（T<=t）单尾

1。

73712E-06

t单尾临界

1.685953066

P（T〈=t）双尾

3。

47424E—06

t双尾临界

2.024394234

t-检验:

双样本异方差假设

变量1

变量2

平均

100.7

109.9

方差

24.11578947

33。

35789474

观测值

假设平均差

tStat

—5。

427106029

P（T〈=t）单尾

1.87355E-06

t单尾临界

1.687094482

P（T<=t）双尾

3。

74709E-06

t双尾临界

2.026190487

（2）方差检验结果如下:

F—检验双样本方差分析

变量1

变量2

平均

100.7

109.9

方差

24。

11578947

33。

35789474

观测值

0.722940991

P（F〈=f）单尾

0。

243109655

F单尾临界

0。

395811384

第7章方差分析与试验设计

7.1（或）,不能拒绝原假设。

7.2（或），拒绝原假设。

拒绝原假设；

，不能拒绝原假设;

，拒绝原假设.

7.3方差分析表中所缺的数值如下表：

差异源

P-value

Fcrit

组间

420

210

1.478

0。

245946

3。

354131

组内

3836

142.07

—

总计

4256

—

（或）,不能拒绝原假设.

7.4有5种不同品种的种子和4种不同的施肥方案，在20快同样面积的土地上，分别采用5种种子和4种施肥方案搭配进行试验，取得的收获量数据如下表：

（或），拒绝原假设。

7.5（或），不能拒绝原假设。

（或），不能拒绝原假设。

7.6（或），拒绝原假设。

（或），不能拒绝原假设.

（或），不能拒绝原假设。

第8章相关与回归分析

8。

（1）利用Excel计算结果可知,相关系数为,说明相关程度较高。

（2）计算t统计量

给定显著性水平=0.05,查t分布表得自由度n-2=10-2=8的临界值为2。

306,

显然，表明相关系数r在统计上是显著的。

8.2利用Excel中的”数据分析”计算各省市人均GDP和第一产业中就业比例的相关系数为：

—0.34239，这说明人均GDP与第一产业中就业比例是负相关，但相关系数只有—0.34239，表明二者负相关程度并不大。