统计学习题 第十三章 检验与方差分析.docx

上传人:b****3 文档编号:4141956 上传时间:2022-11-28 格式:DOCX 页数:15 大小:51.38KB
下载 相关 举报
统计学习题 第十三章 检验与方差分析.docx_第1页
第1页 / 共15页
统计学习题 第十三章 检验与方差分析.docx_第2页
第2页 / 共15页
统计学习题 第十三章 检验与方差分析.docx_第3页
第3页 / 共15页
统计学习题 第十三章 检验与方差分析.docx_第4页
第4页 / 共15页
统计学习题 第十三章 检验与方差分析.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

统计学习题 第十三章 检验与方差分析.docx

《统计学习题 第十三章 检验与方差分析.docx》由会员分享,可在线阅读,更多相关《统计学习题 第十三章 检验与方差分析.docx(15页珍藏版)》请在冰豆网上搜索。

统计学习题 第十三章 检验与方差分析.docx

统计学习题第十三章检验与方差分析

第十三章

检验与方差分析

第一节拟合优度检验

拟合优度检验(比率拟合检验)·正态拟合检验

第二节无关联性检验

独立性、理论频数及自由度·频数比较和连续性修正·关系强度的量度

第三节方差分析

总变差及其分解·自由度·检验统计量Fo的计算·相关比率·方差分析的几点讨论

第四节回归方程与相关系数的检验

回归系数的检验·积差系数的检验·回归方程的区间估计

 

一、填空

1.方差分析可以对多个总体()是否相等进行检验。

2.列联表是按()标志把两个变量的频数进行交互分类的。

3.在使用

检验法进行列联表检验所使用的自由度为()。

4.在对()的列联表进行检验时,存在着

的关系。

5.列联表检验是通过()而不是通过相对频数的比较进行的。

6.方差分析是()检验的推广,一般用于处理自变量是一个(或多个)定类变量和因变量是一个定距变量之间的关系。

7.在对6×5的列联表进行方差分析时,与组间平方和相联系的自由度为(),与组内平方和相联系的自由度为(),与总平方和相联系的自由度为()。

8.方差分析中把已解释的变差对总变差的比值称为()。

9.检验两个总体变量(定距—定距变量)是否具有线性关系,主要是检验总体的()是否等于零。

10.对于定距—定距变量计算积差系数r时,要求相关的两个变量均为()变量。

在回归分析中,只有()变量才是随机的。

11.在实际运用中,方差分析的结果常用一种称为()的标准形式的表格表示出来。

12.取

±1SY/X,那么在散点图上约有()%的观测点落在其间。

13.取

±2SY/X,那么在散点图上约有()%的观测点落在其间

14.取

±3SY/X,那么在散点图上约有()%的观测点落在其间。

二、单项选择

1.在

比率拟合优度检验中,对于选定的显著性水平α求临界值

,此时的自由度是()。

A实验数据总数n―1

B变量X的取值种类数c―l

C实验数据总数n—变量X的取值种类数c

D实验数据总数n+变量X的取值种类数c

2.在

正态拟合优度检验中,对于选定的显著性水平α求临界值

,此时的自由度是()。

A数据的分组数B数据的分组数―l

C数据的分组数―2D数据的分组数―3

3.使用

检验法对n×c列联表进行无关联性检验,与

这个检验统计量相联系的自由度()。

An―1Bc―lCn―cD(n—1)×(c—1)

4.对于一个复杂的列联表,还可以把它进一步分解为许多子表,以确定表格的那一部分卡方

影响最大。

这是利用了卡方分布的()。

A恒正性B方差为期望值的2倍C可加性D前三者

5.在方差分析中,自变量是()。

A定类变量B定序变量C定距变量D定比变量

6.在直线回归分析中,相关比率PRC=0.750。

那么,积差系数r=()。

A0.750B0.5625C1.333D0.866

三、多项选择

1.可以用于拟和优度检验的方法有()。

A

检验BF检验

C累计频数检验D游程检验

2.方差分析法()。

A可以用于一个总体均值是否相等的检验

B可以用于两个总体均值是否相等的检验

C可以用于三个总体均值是否相等的检验

D可以用于多个总体均值是否相等的检验

3.对拟和优度推断结果,下列说法正确的是()。

A当试验规模很小而作出维持原假设决定时,这可能只是数据太少,不是真的表明实际情况切合零假设

B数据少如果否定了零假设,这一否定的可靠性是很大的

C规模极大的试验可把零假设有极细微的差别检测出来,而这种差别可能并无多大实际意义

D若试验规模很大而仍能维持原假设,则可视为是对原假设的有力支持

4.使用

检验拟和优度,下列说法正确的是()。

A相对频数相同的列联表,在统计检验中其显著性相同

B相对频数相同的列联表,在统计检验中其显著性并不相同

C相对频数相同的列联表,样本容量增加K倍,

不变

D相对频数相同的列联表,样本容量增加K倍,

变也扩大K倍

5.相关比率PRE度量的可以是()

A定类—定距变量之间的相关程度

B定距—定距变量之间的相关程度

C线性相关

D非线性相关

6.下列说法正确的是()。

A方差分析的优点在于,一个检验可以代替多个均值差检验

B方差分析总是优于一系列的均值差检验

C方差分析中的自变量X如果是二分变量,不论采用方差分析或均值差检验,其结果完全相同

D总变差分解的思想可以直接推广至多因素显著性检验

7.方差分析所包含的假定包括()。

A正态分布

B独立随机样本

C等方差性

D非负性

四、名词解释

1.拟和优度检验

2.列联表

3.理论频数

4.方差分析

5.方差分析表

6.总变差

7.组内变差

8.组间平方和

9.相关比率

10.估计标准误差

五、判断题

1.理论频数fe与观测频数fo越接近,经验分布与理论分布拟合程度越好。

()

2.对于拟合优度检验,在试验规模大时,否定零假设的意义大,接受零假设的意义不大。

()

3.规模极大的试验可把零假设有极细微的差别检测出来。

()

4.如何求得列联表中的理论频数就成了独立性检验的关键。

()

5.

检验法用于对交互分类资料的独立性检验,有其它方法无法比拟的优点。

()

6.

检验不适用于定类变量和定序变量的相关统计。

()

7.在2×2列联表中,若不能从卡方表中准确得到所需要的临界值,可以取事先未预测方向的(Zα/2)2来找出

的近似值。

()

8.相对频数相同的列联表,在统计检验中其显著性也相同。

()

9.组内变差反映了数据的c个“中心”的散布程度。

()

10.组间平方和反映了数据围绕各“中心”的散布程度。

()

11.方差分析是用(可以解释的方差)/(不能解释的方差)作为检验统计量。

()

12.我们不可以从总平方和减去组间平方和来求组内平方和。

()

13.

只可用于一个定类变量与一个定距变量的相关程度的测定。

()

14.方差分析的优点在于,一个检验可以代替多个检验。

()

15.如果仔细运用均值差检验,它可能会提供比方差分析更多的信息。

()

16.拟合值Yc上下设置一个合适区间,那么Y被估计到的可能性便会大大增加。

()

六、计算题

1.一位社会学家想知道私立本科大学每年的生源是否呈均匀分布。

为此,他在某校随机抽取了4500个本科生,这些学生的分布是:

一年级1200人,二年级1100人,三年级1150人,四年级1050人。

试问,在给定显著性水平α为0.05下,四个年级学生人数构成是否均匀?

2.一位遗传学家想知道某种紫花的颜色是否符合孟德尔隐性遗传规律,按照这种规律两种粉色杂交后,后代将以白∶粉∶红=1∶2∶1的比例出现。

他做了一项杂交实验,植株了100株后代,结果发现:

21株白,61株粉,18株红。

试问,在给定显著性水平α为0.05下,是否植株后代以白:

粉:

红=1∶2∶1的比例出现?

3.某种动物的两个品种杂交后可能出现四种特征。

某种理论分析表明,可能出现的四种特征的数量将以9∶3∶3∶1的比例出现。

生物学家为此做了一项实验,检查了160个后代,结果发现具有着四种特征的后代的数量分别是72、38、32、18。

试问,在给定显著性水平α为0.05下,是否杂交后代以9∶3∶3∶1的比例出现?

4.某公司对电视机的可靠性进行了一次调查,使用100台电视机作样本,记录了在电视机出现故障之前所经历的月份。

根据经历的月份(按等级划分),下表给出了出现故障的实际分布月份和故障按照正态概率分布月份:

出现故障之前的月份(等级)

出现故障之前的实际月份

出现故障之前的期望月份

17以下

17—20

21—23

24—26

27—29

30以上

6

24

28

18

14

10

9

17

27

25

15

7

要求:

检验故障的实际分布与正态分布是否有明显差别(α取0.05)。

5.下表是三个年龄组的100名居民对生活质量要求的分布频数(按高、中、低分类):

年龄(岁)

生活质量要求

总计

17—30

11—35

45—65

12

11

8

15

13

10

13

11

7

40

35

20

总计

31

38

31

100

试问,居民对生活质量的要求与年龄是否有明显的关系(α取0.05)。

6.下列表中是有关车祸事故的频数与司机单程驾车的路程分布资料。

小于5次

5—10次

5次以上

合计

10公里以内

10—20公里

20公里以上

42

32

19

31

23

7

30

5

11

103

60

37

合计

93

61

46

200

试问,车祸事故的频数与司机单程驾车的路程是否有明显的关系?

(α取0.05)

7.为研究职业的代际流动问题,在某地随机抽取了160名职业区民进行调查,调查的结果如下表所示:

父辈职业

合计

脑力劳动

体力劳动

农业劳动

脑力劳动

体力劳动

农业劳动

25

15

5

8

35

7

5

10

50

38

60

62

合计

45

50

65

160

试问,子辈职业与父辈职业之间是否存在相关关系?

(α取0.05)

8.某中学想知道城市学生家长和农村学生家长对延长学生在校时间是否持不同看法。

研究者随机抽出来自农村和城市的两个家长样本,调查结果表明:

在来自城市的200位家长中,123人支持,36人反对,41人没有看法;在来自农村的300位家长中,145人支持,85人反对,70人没有看法。

试问,家长对学生延长在校时间的看法是否与其居住在城市或农村有关?

(α取0.01)

9.某连锁商业企业在同城三个不同地点开设了三个分店,从这三家商店随机抽出5天的营业额的数据如下表所示:

单位:

万元

第一家分店

第二家分店

第三家分店

第一天

10

7

14

第二天

12

11

8

第三天

9

8

12

第四天

8

13

10

第五天

11

10

11

要求:

(1)求三家店每天的平均每天的营业额和5天的平均每天营业额;

(2)求总变差、组内变差和组间平方和;

(3)编制方差分析表;

(4)检验三个商店的地点不同对每天的营业额是否有显著的影响

(5)计算商店的地点不同对每天的营业额之间的相关比率。

10.为了研究职业与家庭子女数之间的关系,随机地抽出了41户家庭进行了调查,调查三种职业家庭的子女数的资料如下:

工人:

1,3,4,4,6,2,3,4,3,5,2,4;

干部:

3,5,0,5,4,4,2,3,1,3,2,3,3,2,4,2,6,1;

知识分子:

6,4,2,2,3,0,5,3,1,2,1。

要求:

(1)求三种职业家庭户均子女数;

(2)求总变差、组内变差和组间平方和;

(3)编制方差分析表;

(4)检验不同职业的生育观是否有显著的不同。

(5)计算职业与子女数量之间的相关比率。

11.有关雇员初始年薪和他10年后的年薪之间的一项调查,共抽取了13名雇员。

数据表明,二者之间的积差系数是0.570。

现给定α=0.05,试检验此相关系数是否显著。

12.1992—2003年我国城镇居民人均消费性支出和人均可支配收入的数据见下表:

单位:

千元

年份

人均可支配收入

人均消费性支出

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2.027

2.577

3.496

4.283

4.839

5.160

5.425

5.854

6.280

6.860

7.703

8.472

1.672

2.111

2.851

3.538

3.919

4.186

4.332

4.616

4.998

5.309

6.030

6.511

要求:

(1)计算我国城镇居民人均消费性支出和人均可支配收入的积差系数;

(2)检验所计算的积差系数的显著性;

(3)建立我国居民人均消费支出依人均可支配收入的线性回归模型;

(4)计算居民人均消费支出与人均可支配收入之间的相关比率,说明这一相关比率与积差系数的数量关系;

(5)计算估计标准误差;

(6)已知某年我国居民人均年可支配收入为8000元,试以95%的置信度预测人均年消费性支出的估计区间。

13.某银行25家分行的不良贷款额与贷款余额调查数据如下(单位:

亿元):

分行编号

各项贷款余额

不良贷款额

1

67.3

0.9

2

111.3

1.1

3

173

4.8

4

80.8

3.2

5

199.7

7.8

6

16.2

2.7

7

107.4

1.6

8

185.4

12.5

9

96.1

1

10

72.8

2.6

11

64.2

0.3

12

132.2

4

13

58.6

0.8

14

174.6

3.5

15

263.5

10.2

16

79.3

3

17

14.8

0.2

18

73.5

0.4

19

24.7

1

20

139.4

6.8

21

368.2

11.6

22

95.7

1.6

23

109.6

1.2

24

196.2

7.2

25

102.2

3.2

要求:

(1)计算各项贷款余额和不良贷款额的积差系数;

(2)检验所计算的积差系数的显著性;

(3)建立不良贷款额依各项贷款余额的线性回归模型;

(4)对回归模型进行F检验;

(5)计算估计标准误差;

(6)求出贷款余额为100亿元时,不良贷款95%的置信区间.

 

七、问答题

1.对于拟合优度检验,解释统计推断的结果时,应注意些什么?

2.简述相关比率

、积差系数之平方r2和相关指数R之间的关系。

参考答案

一、填空

1.均值2.品质3.

(c-1)(r-1)4.2×25.频数6.均值差

7.4,1,58.相关比率9.回归系数B10.随机,因11.方差分析表

12.68.2613.95.4614.99.73

二、单项选择

1.B2.D3.D4.C5.A6.D

三、多项选择

1.AC2.BCD3.ABCD4.BD5.ABCD6.ACD7.ABC

四、名词解释

1.拟和优度检验:

是有关检定总体是否具有正态或其他分布形式的非参数统计检验。

2.列联表:

是按品质标志把两个变量的频数进行交互分类的统计表格。

3.理论频数:

是按照理论分布计算出的样本各组频数。

4.方差分析:

研究多个总体均值是否存在差异的统计检验方法。

5.方差分析表:

用于表达方差分析结果的标准形式的表格。

其基本形式如下:

项目SS自由度MS检验统计量临界值显著性

组间SSB(c―1)MSBMSB/MSWFα(c―1,n―c)(待定)

组内SSW(n―c)MSW——————

总SST(n―1)————————

6.总变差:

记作SST,它表示

对于总均值

的偏差之平方和,即

SST=

7.组内变差:

记作SSW,它是各观测值

对其所属类别均值

的偏差的平方和,即

8.组间平方和:

记作SSB,是自变量因素所没有解释的

的变异,即

9.相关比率:

方差分析中把已解释的变差对总变差的比值称为相关比率,用符号

表示。

=1―

10.估计标准误差:

为回归剩余方差MSW的平方根,即SY/X=

五、判断题

1.(√)2.(×)3.(√)4.(√)

5.(√)6.(×)7.(√)8.(×)

9.(×)10.(×)11.(√)12.(×)

13.(×)14.(√)15.(√)16.(√)

六、计算题

1.各年级理论频数均为1125人,

=11.111>

=7.81,接受H1:

四个年级的学生频数不构成均匀分布

2.白、粉、红三色花的理论频数分别是25、50和25,

=5.020>

=5.99,接受H0:

植株后代以白∶粉∶红=1∶2∶1的比例出现

3.四种特征后代的理论频数为:

90、30、30、10,

=12.267>

=781,接受H1:

杂交后代不是以9∶3∶3∶1的比例出现

4.

=11.71>

=7.23,接受H0:

检验故障的实际分布与正态分布没有明显差别

5.

=9.448>

=0.16,接受H0:

居民对生活质量的要求与年龄没有明显的关系

6.

=13.28>

=12.376,接受H0:

车祸事故的频数与司机单程驾车的路程相互独立

7.

=94.79>

=9.49,接受H1:

子辈职业与父辈职业之间是存在相关关系

8.

=9.61>

=9.21,拒绝H0:

家长对学生延长在校时间的看法与其居住在城市或农村无关

9.

(1)、

(2)略;(3)见下表;(4)由于Fo=0.4697<F0.05(2,12)=3.98,接受H0:

三个商店的地点不同对每天的营业额没有显著的影响;(5)0.0726

SS自由度MS统计量临界值显著性

组间

组内

4.133322.06670.46973.89

52.800124.4000

56.93314

10.

(1)、

(2)略;(3)见下表;(4)由于Fo=0.72<F0.05(2,38)=3.24,接受H0:

不同职业的生育观没有显著的不同;(5)0.0381

SS自由度MS统计量临界值显著性

组间

组内

3.593421.79670.723.24

94.4066382.4843

98.00040

11.t=2.301>t0.025,11=2.201,拒绝H0:

ρ=0

12.

(1)r=0.9991;

(2)t=66.6>t0.025,8=2.306,拒绝H0:

ρ=0;(3)

=0.2310+0.7511X;(4)

=0.9982,r=

;(5)SY/X=0.0638;(6)

=6.2398,6.1148~6.3648

13.

(1)r=0.8436;

(2)t=7.5344>

,拒绝H0:

ρ=0;(3)

;(4)

,则拒绝

两个变量间的线性关系不显著;(5)SY/X=1.9799;(6)2.11405~3.80585

七、问答题

1.答:

首先,当试验规模很小而作出维持原假设决定时,这可能只是数据太少,不是真的表明实际情况切合零假设。

但是,数据少如果否定了零假设,这一否定的可靠性是很大的。

其次,当试验规模极大而得到否定零假设的结果时,需要进一步(使用区间估计等方法)考虑与零假设的偏离有多大,而不能只是宣布一下统计检验的结果就了事。

反之,若试验规模很大而仍能维持原假设,则可视为是对原假设的有力支持。

2.答:

被用于研究定距—定距变量之间的关系时,不仅可以作为线性相关的量度,也可以作为非线性相关的量度。

对线性相关,相关比率

与r2(积差系数之平方)有相同的PRE性质。

R2可以看做

的特例(定距—定距变量)。

对于定距—定距变量,曲线相关要用R来测量。

同一资料通过相关指数R与积差系数r计算的比较,可以判断确定两定距变量的关系是不是直线。

如果同时求出r与R,r等于或略大于R,可说明两变量关系是直线的,用r去测量是合适的;如果r<R,则说明两变量关系可能是曲线的。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1