统计学部分课后答案.docx

资源描述

统计学部分课后答案.docx

《统计学部分课后答案.docx》由会员分享，可在线阅读，更多相关《统计学部分课后答案.docx（30页珍藏版）》请在冰豆网上搜索。

统计学部分课后答案.docx

统计学部分课后答案

思考与练习（第五章）BY缪嘉伦

思考题

1.解释原假设与备择假设的含义，并归纳常见的几种建立原假设与备择假设的原则。

答：

原假设（nullhypothesis）通常是研究者想悼念证据予以反对的假设，也称零假设，

用H0表示。

备择假设（alternativehypothesis）通常是研究者想悼念证据予以支持的假设，也称研究假设，用H|或Ha表示。

几种常见的原则：

第一，原假设和备择假设是一个完备事件组，而且相互对立。

第二，在建立原假设时，通常是先确定备择假设，然后再确定原假设。

第三，在假设检验中，等号“=”总是放在原假设上。

第四，在面对某一实际问题时，由于不同的研究者有不同的研究目的，即使对同一问

题也可能提出截然相反的原假设和备择假设。

第五，假设检验的目的主要是收集证据拒绝原假设。

3.什么是显著性水平？

它对于假设检验决策的意义是什么？

与置信水平的区别？

答：

显著性水平（levelofsignificance）是指当原假设实际上是正确时，检验统计量落在拒绝域的概率，记为:

-o

它是人们事先指定的犯第〔类错误概率:

的最大允许值。

显著性水平:

越小，犯第［类错误的可能性自然就越小，但犯第二类错误的可能性随之增大。

置信水平是指变量落在置信区间的可能性，记为1*。

4.什么是P值？

P值检验和统计量检验有什么不同？

答：

P值（Pvalue）就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。

如果P值很小，说明原假设情况的发生的概率很小，而如果出现了，根据小概率原理，我们就有理由拒绝原假设，P值越小，我们拒绝原假设的理由越充分。

总之，P值越小，表

明结果越显著。

但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要

我们自己根据P值的大小和实际问题来解决。

区别：

从显著性水平来比较，如果选择的〉值相同，所有检验结论的可靠性都一样；

通过计算P值，可测量出样本观测数据与原假设的值％的偏离程度。

练习题

4.解：

提出假设：

Ho乞6,H16

已知：

-=1.19,n=100,:

=0.5

（1）选择检验统计量

s/n

（2）拒绝规则是：

若Zz,拒绝H0；否则，不拒绝H0

（3）计算检验统计量的数值，即

6.35-6

1.19/"100

=2.941

即有，z=2.941>丢=Zo.o5=1.64

因此，拒绝H。

，认为改进工艺能提高纤维原的平均强度。

5.解：

提出假设：

Ho：

"_6.7O，Hi>6.70

其中」为如今每个家庭每天收看电视的平均时间

调查的样本：

n=200^=7.2s&,2.5

x-"07.25-6.70

检验统计量：

z==,=3.111

sM/n2.5/V200

进行P值检验，利用ExceI的统计函数功能进行计算，如下图

图5.5

可得z值3.111左边的面积为0.999067725，用1减去该值，即为单侧检验的P值，即P值=1-0.999067725=0.000932275，小于给定的显著性水平0.01，所以拒绝原假设，认为如今每个家庭收看电视的平均时间增加了。

2222

6.解：

提出假设：

H0：

6v.「vcr=0.75,已：

6v0.75

已知：

n=3Os2二2,=0.05

检验统计量：

（3（0；22=103.112/2（n-1）=爲5（30-1）=42.722

"■VCR0.75

因此，拒绝H。

，认为电视寿命的方差显著大于VCR>

2222

10•解：

提出假设:

H。

：

；—=；「2屮1：

；—=6

在ExceI中输入相关数据，如下图：

两部机器生产前袋茶重童

£95

3.45

3.5

3,75

3,43

3.2E

3.33

3.2

机31

望2

3.22

3.33

3.§

3.36

望2S

3.29

3,2

3.22

3,7

3.34

E1S

3,S5

3.12

3+Z2

3.31

3-N

3.29

3.葢

3.3

耳27

机器2

比38

3.31

3.35

3.19

3.35

3,05

3,36

328

3.3

3,28

3.3

3,2

3.16

S.33

图5.10.1

利用F检验双样本方差分析，得下图

F-检验双样本方差分析

机器1

机琴3

平均

3.3284

3.278182

方羞

0.04888&

0.005901

观测值

221

21J

8.284:

4=4:

3.61E-0&

K单雇临界

2.054004：

图5.10.2

可得，检验统计量为：

^r0S=8.2849

则有,

F=8.2849＞甩（口—In—1）=F°.o25（24,21）=2.37

因此，拒绝H。

，认为两种机器生产的袋茶重量的方差存在显著差异。

思考与练习（第六章）

思考题

1.什么是方差分析？

它所研究的是什么？

答：

方差分析（analysisofvarianee，ANOVA）是检验多个总体均值是否相等的统计方法。

本质上它研究的是分类型自变量对数值型因变量的影响。

3.方差分析中有哪些基本假设？

答：

（1）每个总体都应服从正态分布；

（2）各个总体的方差必须相同；（3）观测值

是独立的。

4.简述方差分析的基本思想。

答：

试验指标的变化可以用指标值的方差反映，导致试验指标值发生变化的原因有

两方面：

一是可控因素，二是不可控因素或未加控制因素。

方差分析就是将试验指标值

的方差分解成条件变差与随机误差，然后，将各因素形成的条件变差与随机误差进行

比较，评价由某种因素所引起的变异是否具有统计学意义。

6.简述方差分析的基本步骤。

答：

（1）提出假设；

（2）构造检验的统计量；（3）统计决策；（4）方差分析表。

7.解释水平项平方和、误差项平方和的含义。

答：

水平项误差平方和简记为SSA它是各组平均值与总平均值的误差平方和，反

映各总体的样本均值之间的差异程度，因此双称为组间平方各。

误差项平方和，简记为SSE它是每个水平或的各样本数据与其组平均值误差的平方和，反映了每个样本各观测

值的离散状况，因此双称为组内平方和或残差平方和。

11.解释试验、试验设计、试验单元的含义。

答：

试验：

收集样本数据的过程。

试验设计：

收集样本数据的计划。

试验单元：

接受“处理”的对象或实体。

12.简述完全随机化设计、随机化区组设计、因子设计的含义。

答：

含义：

完全随机化设计：

将k种“处理”随机地指派给试验单元的设计。

随机化区组设计：

先按一定规则将试验单元划分为若干同质组，称为“区组”，然后

再将各种处理随机地指派给各个区组。

因子设计：

考虑两个因素（可推广到多个因素）的搭配试验设计。

练习题

1.解：

提出假设：

H。

：

叫=二”3,出：

亠，讥，”3不完全相等

式中，叫为第i个样本的均值。

在ExceI中输入相关数据，如下图：

三个总休中抽収的样本数1S

样本1

样粧

祥本3I

158

153

169

14^8

142

158]

1&L

L56

1E0|

154

149

1&9

图6.1.1

利用单因素方差分析，可得

SUOaR?

詛

束和

平均

方差

7^0

158

6L.5

悴本2

600

50T

150

leg

36.66667

121

方養分祈

ITS

F-VSJlJ-：

F£Tlt

filB.916S667

300.1583

4.657d

0.043877B.021517

更内

598

E6.<444^

总L

1216.91666/

图6.1.2

从分析方差表中可以看到，由于

F=4.6574cF0.01（2,9）=8.021517

所以不拒绝原假设，即不能认为3个总体的均值之间存在显著差异。

4.解：

对两个因素分别提出如下假设：

行因素（品种）为

已：

叫』2,叮厂打厂'不全相等

列因素（施肥方案）为

Ho：

丄1二”2二”3二^4已宀宀宀宀不全相等

在ExceI中输入相关数据，如下图：

5种种子和4种龍肥方案搭配试验的收获量

口口种

施肥方素

9.5

10-4

9.7J

13.7

11.5

12.4

9・6

14,3

12.3

11,4

1L11

14+2

12.5

13.1

11.4

图6.4.1

利用无重复双因素分析，可得

方差井祈：

无垂農蕊囚素另析

SUIIUKY

求札1

壬均

丛F.

ior+

1-ZRhn-.rFrr

忆£

2.966666667

4玄L

12.275

2.OSZ&

52.7

13+17J

1.18^166£67

5L5

12.8^5

1.169166E67

S7-2

13*44

0.D13

61.3

LZ26

3.563

59.B

11,96

1.133

•5

53.b

10.

J.曲

芍差分折

F-valut?

cijt

19+067

4,76675

7.239716492

0.C033153.2E9167

列

1乩⑻F

a.0605

9.2045576?

0,01）1^49乩生9眈篩

7.901

0.653416667

惡计

45.1435

图6.4.2

从分析方差表中可以看到，

由于，

Fr=7.239716492>F=3.2591667

所以拒绝原假设Ho，认为品种对收获量有显著影响。

由于,

Fr=9.20465763>F=3.490295

所以拒绝原假设H0，认为施肥方案对收获量有显著影响。

思考与练习（第七章）

思考题

1.相关分析与回归分析的区别和联系是什么？

答：

相关与回归分析是研究变量之间不确定性统计关系的重要方法，相关分析主要

是判断两个或两个以上变量之间是否存在相关关系，并分析变量间相关关系的形态和程

度。

回归分析主要是对存在相关关系的现象间数量变化的规律性作出测度。

但它们在研究目的和对变量的处理上有明显区别。

它们均是统计方法，不能揭示现象之间的本质关系。

3•什么是总体回归函数和样本回归函数？

它们之间的区别是什么？

答：

以简单线性回归模型为例，总体回归函数是总体因变量的条件期望表现为自变量的函数：

EW门兀或并二天」+片。

总体回归函数是确定的和未知的，是回归分析所估计的对象。

样本回归函数是根据样本数据所估计出的因变量与自变量之间的函数关系：

或•一总一疳匚S

回归分析的目的是用样本回归函数来估计总体回归函数。

它们的区别在于，总体回归函数是未知但是确定的，而样本回归函数是随样本波动而变化；总体回归函数的参数-,

是确定的，而样本回归函数的系数

是随机变量；总体回归函数中的误差项

iu不可观察的，而样本回归函数中的残差项ie是可以观察的。

4•什么是机误差项和残差？

它们之间的区别是什么？

答：

随机误差项表示自变量之外其他变量的对因变量产生的影响，是不可观察的，通常要对其给出一定的假设。

残差项指因变量实际观察值与样本回归函数计算的估计值之间的偏差，是可以观测的。

它们的区别在于，反映的含义是不同且可观察性也不同，它们的联系可有下式：

碍二片_（鋼禽）=（◎+/?

兀+吗I—（tz—0舌|=（£Z_G）——0応+比

5•为什么在对参数进行最小二乘估计之前，要对模型提出一些基本的假定？

答：

最小二乘法只是寻找估计量的一种方法，其寻找到的估计量是否具有良好的性质则依赖模型的一些基本的假定。

只有在一系列的经典假定下，最小二乘估计量才是

BLUE

11•为什么用可决系数能够度量回归方程对样本数据的拟合程度？

为什么对多元线性回归的多重可决系数要作修正？

答：

可决系数是测定变量间相关关系密切程度的统计分析指标，它也是反映自变量对

因变量的联合的影响程度。

可决系数越大，自变量对因变量的解释程度越高，自变量引起的

变动占总变动的百分比高。

观察点在回归直线附近越密集。

可决系数的取值范围在0到

1之间，它是一个非负统计量。

随着抽样的不同而不同，既是随样本而变动的统计量。

在样本容量一定下，随着模型中自变量个数的增加，可决系数R2会随之增加，模型

的拟合程度上升，但自由度会损失，从而降低推断的精度，因此需要用自由度来修正可决系数，用修正的可决系数来判断增加自变量的合适性。

12•对回归系数显著性作t检验的基本思想是什么？

在多元线性回归中，对参数作了t检验

以后为什么还要作方差分析和F检验？

答：

回归系数显著性检验是检验模型中每个自变量与因变量之间的线性关系是否显

著。

显著性检验是通过计算各回归系数的t检验值进行的。

回归系数的t检验值的计算

公式为：

=（j=1,2，…，k）,式中是回归系数的标准差。

在多元回归模型中，某个变量回归系数的t检验没有通过，说明该变量与因变量之间不存在显著的线性相关关系，在回归分析时就可以将该变量删去，或者根据情况作适当的调整，而后用剩下的自变量再进行回归分析。

t检验仅是对单个系数的显著性进行检验，由于自变量之间存在着较为复杂的关系，因此有必要对回归系数进行整体检验，方差分析和F检验就是对回归方程的整体统计显著性进行的检验方法。

17•试证明“在一元回归情形下F=t2,F检验与t检验是等价的”。

试证明在一元回归中t检

验与F检验是等价的。

练习题

2•解：

在ExceI中输入相关数据，如下图,

美国各航空公司的航班正点率和投诉率

航空公司名称

航班正点率〔％）

投诉率（次/1O万名乘客）

西南航空公司

81.81

0.21

大陆航空公司

76.6

0,58

西北航空公司

76.6J

美国航空公司

75.7:

0.68

联合航空公司

73.81

0.74

类删航空公司—

72.2J

①93

德尔塔航空公司

71.2I

0.72

美国西部航空公司

70.8

1.22

环球航空公司

68.5

1.25

图7.2.1

（1）如图

（3）

航脏正点率

图7.2.2

负相关关系

一町匚J'J

『归吨计

HulTlp1ef.

gE3^fiO74ZE

0.17钢953审

Adl_E3tedE2LlUklTE

0l7^7413321

Di1W0L7K4

方埒询Li

□1：

FsnlllcarLce?

0.C.&菱

24flT36JQ.

0.133036700

c.OEsees

Fit

CoeEUclents

标•雀w基

tSt*.t

f-vbJlelmetgatumETgmxF很紡一小-限甩氓

EritT-r亡如十

良017931930

1.0S225&e^

5-T1S&E1

①m2!

3-529G33債肌叙:

孔

二B29633B.50G431

-0-0704144

0-0141TS72

-4.a阳

7山的3；-0.03U9

图7.2.3

由Excel回归分析结果可得，y=6.017831995-0.0704144（

（4）估计的斜率系数为—0.0704144，表示航班的正点率每提高1%,百万名乘客的投诉

次数会下降：

0.0704144*1=0.0704144次。

（5）y=6.017831995-0.070414480=0.38

4.解：

要ExceI中输入相关数据，如下图,

嘩PI口】代忖*

iwwi"几》

庚"

年伤

1^79

3645.21?

22M・1

I9^3

S3欣机02

21fet^s*

LSB-O

吒CG2・S794E45.W

鶴箱7sotff.巳

■mr©豁E9310.33

3^42.g

3&-T4Ef.Z

1901

4R99・£0!

33&1・ES

19胛

TDJ42・4^

43919.O

L^CPZ

J53550.-fc31

ST1*b0

i珅丁

『口gQ・Q3r

1^03

GE-2

4124・4

1咱B

8302^.前

9is@e.s

19S4

7£13„TE2

召曰3

ee^Te.1s>

□E5«=-3ta.m

19B3

^04□„*F3?

也曰£E

2aoo

5HMD.

i&itiE

1^0t7

1957^1口卑

1EO5CI・62

辱旦卫m□7@cM„6

3QQ1

2002

1Q3000tiL9■皿57

0鬧mO71^1.2

14M

3S^Ss>・冒空

3貝3奋,E

7744Cii.呂

L9EB

17□DO-52

111B4.2

2004

L5^3B£.7

BTC3Z„日

2jub

LS-iTS^Jl

jTte：

22a7

B・2

20皿

sneoB

IJXg2

ia&a

它社・E：

羽

17205・M

图7.4.1

Excel回归分析，可得

£皿时0DTPE

mtiplfK

Ol995陋刪

2沁re

OL931179504

AdjuEtoiESquare

0LHC852515

為髓

^37.300667

帆if

11$

SiEni：

iC3（icef

29872652^93

29812652993

3Q3LO524刖

N3O662E-29

Z65B30411.T

冏*刃9MIKE

总计

30tSUBS90i

C：

-cfficzentE

tStat

P-VillLE

Lorer35S

In:

342T.OG031S

SOL8&5B82T

Q・OOBT&153I

r6t2817fi3

呢77886c

0,545903^9

d0*******6

5LDB223393

2soesa-sj

O.^E6B21

：

'.f662Sa347

图7.4.2

（1）y=2427.0303130.54590327&

（2）由Excel回归分析结果可得,

标准误差：

3137.800667

1的t统计量为55.082234。

可决系数：

0.991179504

（3）提出假设：

H0:

：

-：

*,出：

：

=-■■*

H。

：

，二已：

亠*

由图7.4.2可得，

的t统计量为2.996756，

若取显著性水平为5%,查t分布表得

t°.025（29—2）=2.0518

显然，。

和B的t统计量都大于t°.025（29—2），表明应拒绝H。

y2007=2427.0303130.545903278236000=131260.2

利用预测系数的95%上下限计算可得到95%预测区间

124799.3793,137721.0287

案例分析

在ExceI中输入相关数据，如图1,

巾国轿车主立与相关園

至的数庭

轿车生产量

私人轼吝汽车拥

城销启民冢庭！

公踣里程

国內生产总愷

城镇居民人均可

年份

（万辆）

有量<万钢）

格尔系数g

（万公里〉

GDF（亿元）

支配收入（7E）.

町

1990

3.5

聃.CT

54..24

102,33

198S7.E2

1510.2

二991

6.S7

30.3&

53+S

104.11

21781.5

oo.e

1992

lb.17

41,78

53.14445

105.b7

2&3Z3.48

ZC26.6

19贮

22.29

53.85

50.3167

108.35

35333.92

257L4

：

9&4

26.97

75.£2

50i03928

11L.79

49197.66

349&,2

33.7

114.15

50.0906

115.7

6073（3.73

4283

1996

38,29

1^3.04

4S.76093

118,53

71176.59

4338.9

46.6

191.27

<6.59502

122.£4

73^73.Q3

5160.3

19&6

50.71

230.65

44.66099

127.35

64402.28

5425.1

1939

E7.1

304.09

42.06798

135.17

89677.05

展开阅读全文