统计地训练题目及答案详解.docx

上传人:b****8 文档编号:30092148 上传时间:2023-08-04 格式:DOCX 页数:33 大小:124.87KB
下载 相关 举报
统计地训练题目及答案详解.docx_第1页
第1页 / 共33页
统计地训练题目及答案详解.docx_第2页
第2页 / 共33页
统计地训练题目及答案详解.docx_第3页
第3页 / 共33页
统计地训练题目及答案详解.docx_第4页
第4页 / 共33页
统计地训练题目及答案详解.docx_第5页
第5页 / 共33页
点击查看更多>>
下载资源
资源描述

统计地训练题目及答案详解.docx

《统计地训练题目及答案详解.docx》由会员分享,可在线阅读,更多相关《统计地训练题目及答案详解.docx(33页珍藏版)》请在冰豆网上搜索。

统计地训练题目及答案详解.docx

统计地训练题目及答案详解

1.已知初婚年龄服从正态分布,根据21个人的抽样调查有:

(岁),

(岁),求置信水平为95%的初婚年龄的置信区间。

(已知t0。

05(21)=1.721、t0。

05(20)=1.725、t0。

025(21)=2.080、t0,025(20)=2.086)。

【22.10,24.90】

2.某工厂妇女从事家务劳动时间服从正态分布N(

)。

根据36人的随机抽样调查,每天平均从事家务劳动时间

为:

=2.65小时。

的双侧置信区间(置信度取0.95和0.99两种)。

【2.4344,2.8656】【2.3662,2.9338】

3.根据某地100户的随机抽查,其中有60户拥有电冰箱,求该地区拥有电冰箱成数P的置信区间(置信度为0.95)。

【0.5040,0.6960】

4.某工厂根据200名青年职工的抽样调查,得知其中有60%参加各种形式的业余学习。

求青年职工参加业余学习成数的区间估计。

(置信水平取0.90)【0.5428,0.6572】

5.电视台要调查电视观众收看电视剧《渴望》的收视率。

问在95%的置信度下,允许误差

,问样本容量需要多大才能最大限度地满足调查要求?

【384,样本取整数400】

6.某企业有职工1385人,现从中随机抽出50人调查其工资收入情况如下:

月收入(元)

220

285

310

330

375

405

440

495

530

工人数(人)

4

6

6

8

10

7

4

3

2

试以0.95的置信度估计该企业职工的月平均工资收入所在范围。

【355.6,363.6】

7.某食品公司所生产的牛肉干中,随机抽7盒,称得各盒重量如下:

9.6、10.2、9.8、10.0、10.4、9.8、10.2。

如牛肉干盒重量近似于正态分布,求置信水平为95%的情况下,牛肉干盒平均重量的置信区间是多少?

【9.74,10.24】

8.从某校随机地抽取81名女学生,测得平均身高为163厘米,标准差为6.0厘米,试求该校女生平均身高95%的置信区间。

【161.7,164.3】

9.如果认为该市农民工参保率是35%,若要求在95%的置信水平上保证这一比例的估计误差不超过6%,试问调查的样本容量应该有多大?

【971】

10.若某一居民小区中住房拥有者的比例近似0.75,那么建立总宽度为0.03的95%的置信区间,需要多大样本?

若住房拥有者的比例改为0.5,那么建立总宽度为0.03的95%的置信区间,又需要多大样本?

【3201】【4268】

13.已知总体

服从正态分布

(100,3

),

,…

是正态总体

的样本,

为样本均值,若概率

{

≤101}≥0.95,问样本容量

至少应取多大?

七、问答题

1.简述统计量成为总体参数的合理估计的三个标准。

2.简述在参数估计中准确性和可靠性的辨正统一的关系。

 

1.答:

抽样调查是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分

样本单位来进行调查、观察,然后用所得到的调查结果来推断总体。

抽样调查的最大优点是省时、省力和节省经费。

此外,由于抽样调查的范围较小,调查工作可能做得更加深入细致。

错误发生的机会减少,资料的可信程度提高,这也是抽样调查的一个优点。

2.答:

分层抽样也叫类型抽样,就是先将总体按某种特征或属性分若干类别或层次,再按照一定比例在各个子类别或层次中随机抽取,最后将各抽取的单位合并成样本。

整群抽样是从总体中成群地抽取调查单位。

也就是说,要先将总体单位分为若干群,再在其中随机地抽取部分群,整群抽样并不以抽样框的获得为前提。

(6分)

整群抽样与分层抽样确实有相似之处,即它们的第一步都是根据某种标准将总体划分为若干群或层。

但两者的主要差别在于过程后一步。

对于整群抽样,抽中群的全部个体都是样本单位,未抽中群的样本单位都不在调查之列。

分层抽样则要在所有层中均抽取一个小样本,它们合起来构成总体样本。

也就是说,对于分层抽样,调查对象来自所有层,调查结果的代表性自然比较高。

分层抽样和整群抽样在适用上的基本差别是:

分层抽样时,层间差异尽可能大,层内差异尽可能小;整群抽样时,群间差异尽可能小,群内差异尽可能大。

 

六、计算题

1.根据统计,北京市初婚年龄服从正态分布,其均值为25岁,标准差为5岁,问25岁到30岁之间结婚的人;其百分数为多少?

【84.13%】

2.共有5000个同龄人参加人寿保险,设死亡率为0.1%。

参加保险的人在年初应交纳保险费10元,死亡时家属可领2000元。

求保险公司一年内从这些保险的人中,获利不少于30000元的概率。

【98.75%】

3.为了验证统计报表的正确性,作了共50人的抽样调查,人均收入的结果有:

问能否证明统计报表中人均收入μ=880元是正确的(显著性水平α=0.05)。

【不能,因为Z=-3.03<-1.96,所以否定原假设μ=880】

4.某单位统计报表显示,人均月收入为3030元,为了验证该统计报表的正确性,作了共100人的抽样调查,样本人均月收入为3060元,标准差为80元,问能否说明该统计报表显示的人均收入的数字有误(取显著性水平α=0.05)。

【可以,因为Z=3.75〉1.96,所以可以拒绝原假设μ=3030,即可以认为统计报表有误】

5.已知初婚年龄服从正态分布,根据9个人的抽样调查有:

(岁),

(岁)。

问是否可以认为该地区平均初婚年龄已超过20岁(α=0.05)?

【可以,因为t=3.2998〉2.821,所以可以拒绝原假设μ=20,可以认为平均初婚年龄已超过20岁】

6.某地区成人中吸烟者占75%,经过戒烟宣传之后,进行了抽样调查,发现了100名被调查的成人中,有63人是吸烟者,问戒烟宣传是否收到了成效?

(α=0.05)【

=-2.77<-1.65.所以拒绝原假设,接受备择假设。

7.据原有资料,某城市居民彩电的拥有率为60%,现根据最新100户的抽样调查,彩电的拥有率为62%。

问能否认为彩电拥有率有所增长?

(α=0.05)

【不能,因为Z=0.408<1.65,所以接受原假设p=60%,不能认为彩电拥有率有所增长】

8.一个社会心理学家试图通过实验来表明采取某种手段有助于增加群体的凝聚力。

但有16个小组,将它们配对成一个实验组和控制组,实验组和控制组各有8个小组,问怎样用二项分布去检验无效力的零假设,列出检验所需的零假设,计算抽样分布,用显著水平0.05,请指出否定域。

【在社会研究的实验法中,此为“双组实验设计”,其步骤是:

1)用匹配或随机指派的方法将实验对象一半分到控制组一半分到实验组;2)对实验组实施实验刺激但不对控制组实施这种刺激;3)然后同时对控制组和实验组进行测量,即后测;4)在比较和分析两个组后测结果之间的差别,得出实验刺激的影响。

由此,我们先将16个组两两匹配,得到8个配对组(要使每个配对组在除实验变量之外的其他方面尽量相似)。

然后在每个配对组中任取一组安排于实验组,另一组安排于控制组。

接着,在4-8年的时间内,让分到实验组的8组人接受某种手段,如共同游戏,而控制组的8组人则没有这样做。

而后对每个配对组分别进行后度测量,并用“+”号表示实验组比控制组好的那些配对组,用“-”表示实验组比控制组差的那些配对组。

除非度量方法很粗燥,每配对组应该都能判断出差异。

这样便可以用二项分布做实验无效的检验了。

,选用0.1的显著性水平。

,所以否定域由7个“+”和8个“+”组成,即对每配对组进行后测度量,如出现7个“+”和或8个“+”时,在0.1的显著性水平上,我们将否定零假设,说明实验有效。

否则就不能否定零假设,也就是说实验无效】

9.孟德尔遗传定律表明:

在纯种红花豌豆与白花豌豆杂交后所生的,子二代豌豆中,红花对白花之比为3:

1。

某次种植试验的结果为:

红花豌豆352株,白花豌豆96株。

试在

=0.05的显著性水平上,检定孟德尔定律。

=1.75<1.96,所以保留原假设】

10.一个样本容量为50的样本,具有均值10.6和标准差2.2,要求:

1)请用单侧检验,显著性水平0.05检验总体均值为10.0的假设;

【1.65<1.928,所以否定原假设,接受备择假设均值为10.6】

2)请用双侧检验,显著性水平0.05检验总体均值为10.0的假设;

【1.928<1.96,所以不能否定原假设,仍接受总体均值为10.0】

3)请比较上述单、双侧检验犯第一类错误和犯第二类错误的情况。

【在方向可知时,同样犯第一类错误概率的情况下,单侧检验比双侧检验能减少犯第二类错误的概率】

11.设要评价某重点中学教学质量情况,原计划升学率为60%,在高校录取工作结束后,现在一个由81个学生组成的随机样本中,发现升学率55%,用显著性水平为0.02,你能否就此得出该校的工作没有达到预期要求的结论。

为什么?

【-0.918>-1.65,所以不能否认原假设p=60%】

12.在重复抛掷一枚硬币49次的二项试验中,试求成功29次的概率?

13.某市2003年居民的户均收入是3500元,为了了解该市居民2004年的收入情况,有关调查部门作了一个共100户的收入情况的抽样调查,样本户均月收入为3525,标准差为100元。

据此,你有多大把握说该市居民户均收入是增加了。

【在

=0.05进行双侧检验时,Z=2.5>1.96,有95%的把握】

15.某地区回族占全体居民人数的6%,今随机抽取10位居民,问其中恰有2名是回族的概率是多少?

【0.099】

16.工人中吸烟的比例为0.5%。

某车间有工人300名,求以下概率:

(1)全部吸烟;

(2)2人吸烟;(3)100人吸烟;(4)160人吸烟。

】【

】【

】【

17.某工厂总体的10%是技术人员,求7人委员会中4人是技术员的概率,并指出检验所

验所需的假设。

【p=0.26%,

18.设某股民在股票交易中,每次判断正确的概率是60%。

该股民最近作了100次交

易。

试求至少有50次判断正确的概率。

【0.9793】

19.某市去年的数字显示:

进城农民工参加社保的比例是30%。

今年在进城农民工中

随机抽取400人进行调查,经计算得该样本总体的参保率为33%,试在

=0.05的显著性水平上,检定“今年该市农民工参保情况有了改进”的零假设。

【单侧检验时,

Z=1.31<1.65,所以不能否定原假设,即不能认为今年农民工参保情况有了改进】

20.根据调查,儿童的智商分布为N(100,102),某幼儿园共有儿童250名,问智商在110~120之间的儿童共有多少名?

【34】

21.根据调查,女大学生的身高分布为N(163,62),某大学共有女大学生1500名,问身高在164~168厘米之间的女大学生共有多少名?

【343】

七、问答题

1.简述中心极限定理。

中心极限定理的具体内容是:

如果从任何一个具有均值μ和方差σ2的总体(可以具有任何分布形式)中重复抽取容量为n的随机样本,那么当n变得很大时,样本均值

的抽样分布接近正态,并具有均值μ和方差

2.试述正态分布的性质与特点。

(1)正态曲线以X=μ呈钟形对称,其均值、中位数和众数三者必定相等。

(2)

(X=x)在X=μ处取极大值。

X离μ越远,

(X=x)值越小。

这表明对于同样长度的区间,当区间离μ越远,X落在这个区间的概率越小。

正态曲线以X铀为渐近线,即

(X=x)在|X|无限增大时趋于零,即

(x)=0或

(x)=0。

(3)对于固定的σ值,不同均值μ的正态曲线的外形完全相同,差别只在于曲线在横轴方向上整体平移了一个位置(参见图7.3)。

(4)对于固定的μ值,改变σ值,σ值越小,正态曲线越陡峭;σ值越大,正态曲线越低平(参见图7.4)。

(5)正态分布的数学期望E(X)=μ,变异数D(X)=σ2,

5.简述编制离散数列和连续数列组距的不同之处。

离散变量的整数值如果变动幅度较小,可以将每一个变量值列为一组,编制单项数列;离散变量的整数值如果变动幅度较大,而且总体单位数N又很大,则要编制组距数列。

连续变量因其数学特征,在一个区间可以有无限多数值,无法按顺序一一列举,所以只能编制组距数列。

与离散变量组距数列不同之处在于,根据连续变量的特征,此时组距数列中相邻两组的上限和下限共有一个组限,即相邻两组交界处的组限重合。

1.消减误差比例

变量间的相关程度,可以用不知Y与X有关系时预测Y的误差

,减去知道Y与X有关系时预测Y的误差

,再将其化为比例来度量。

将削减误差比例记为PRE。

2.确定性关系

当一个变量值确定后,另一个变量值夜完全确定了。

确定性关系往往表现成函数形式。

3.非确定性关系

在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定范围内变化。

4.因果关系

变量之间的关系满足三个条件,才能断定是因果关系。

1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。

5.单相关和复相关

单相关只涉及到两个变量,所以又称为二元相关。

三个或三个以上的变量之间的相关关系则称为复相关,又称多元相关。

6.正相关与负相关

正相关与负相关:

正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。

7.散点图

散点图:

将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X与Y的相互关系,即得相关图,又称散点图。

8.皮尔逊相关系数r

皮尔逊相关系数是协方差与两个随机变量X、Y的标准差乘积的比率。

9.同序对

在观察X序列时,如果看到

,在Y中看到的是

,则称这一配对是同序对。

10.异序对

在观察X序列时,如果看到

,在Y中看到的是

,则称这一配对是异序对。

11.同分对

如果在X序列中,我们观察到

(此时Y序列中无

),则这个配对仅是X方向而非Y方向的同分对;如果在Y序列中,我们观察到

(此时X序列中无

),则这个配对仅是Y方向而非X方向的同分对;我们观察到

,也观察到

,则称这个配对为X与Y同分对。

5.下表是三个年龄组的100名居民对生活质量要求的分布频数(按高、中、低分类):

年龄(岁)

生活质量要求

总计

17—30

11—35

45—65

12

11

8

15

13

10

13

11

7

40

35

20

总计

31

38

31

100

试问,居民对生活质量的要求与年龄是否有明显的关系(α取0.05)。

6.下列表中是有关车祸事故的频数与司机单程驾车的路程分布资料。

小于5次

5—10次

5次以上

合计

10公里以内

10—20公里

20公里以上

42

32

19

31

23

7

30

5

11

103

60

37

合计

93

61

46

200

试问,车祸事故的频数与司机单程驾车的路程是否有明显的关系?

(α取0.05)

7.为研究职业的代际流动问题,在某地随机抽取了160名职业区民进行调查,调查的结果如下表所示:

父辈职业

合计

脑力劳动

体力劳动

农业劳动

脑力劳动

体力劳动

农业劳动

25

15

5

8

35

7

5

10

50

38

60

62

合计

45

50

65

160

试问,子辈职业与父辈职业之间是否存在相关关系?

(α取0.05)

8.某中学想知道城市学生家长和农村学生家长对延长学生在校时间是否持不同看法。

研究者随机抽出来自农村和城市的两个家长样本,调查结果表明:

在来自城市的200位家长中,123人支持,36人反对,41人没有看法;在来自农村的300位家长中,145人支持,85人反对,70人没有看法。

试问,家长对学生延长在校时间的看法是否与其居住在城市或农村有关?

(α取0.01)

10.为了研究职业与家庭子女数之间的关系,随机地抽出了41户家庭进行了调查,调查三种职业家庭的子女数的资料如下:

工人:

1,3,4,4,6,2,3,4,3,5,2,4;

干部:

3,5,0,5,4,4,2,3,1,3,2,3,3,2,4,2,6,1;

知识分子:

6,4,2,2,3,0,5,3,1,2,1。

要求:

(1)求三种职业家庭户均子女数;

(2)求总变差、组内变差和组间平方和;

(3)编制方差分析表;

(4)检验不同职业的生育观是否有显著的不同。

(5)计算职业与子女数量之间的相关比率。

11.有关雇员初始年薪和他10年后的年薪之间的一项调查,共抽取了13名雇员。

数据表明,二者之间的积差系数是0.570。

现给定α=0.05,试检验此相关系数是否显著。

12.1992—2003年我国城镇居民人均消费性支出和人均可支配收入的数据见下表:

单位:

千元

年份

人均可支配收入

人均消费性支出

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2.027

2.577

3.496

4.283

4.839

5.160

5.425

5.854

6.280

6.860

7.703

8.472

1.672

2.111

2.851

3.538

3.919

4.186

4.332

4.616

4.998

5.309

6.030

6.511

要求:

(1)计算我国城镇居民人均消费性支出和人均可支配收入的积差系数;

(2)检验所计算的积差系数的显著性;

(3)建立我国居民人均消费支出依人均可支配收入的线性回归模型;

(4)计算居民人均消费支出与人均可支配收入之间的相关比率,说明这一相关比率与积差系数的数量关系;

(5)计算估计标准误差;

(6)已知某年我国居民人均年可支配收入为8000元,试以95%的置信度预测人均年消费性支出的估计区间。

13.某银行25家分行的不良贷款额与贷款余额调查数据如下(单位:

亿元):

分行编号

各项贷款余额

不良贷款额

1

67.3

0.9

2

111.3

1.1

3

173

4.8

4

80.8

3.2

5

199.7

7.8

6

16.2

2.7

7

107.4

1.6

8

185.4

12.5

9

96.1

1

10

72.8

2.6

11

64.2

0.3

12

132.2

4

13

58.6

0.8

14

174.6

3.5

15

263.5

10.2

16

79.3

3

17

14.8

0.2

18

73.5

0.4

19

24.7

1

20

139.4

6.8

21

368.2

11.6

22

95.7

1.6

23

109.6

1.2

24

196.2

7.2

25

102.2

3.2

要求:

(1)计算各项贷款余额和不良贷款额的积差系数;

(2)检验所计算的积差系数的显著性;

(3)建立不良贷款额依各项贷款余额的线性回归模型;

(4)对回归模型进行F检验;

(5)计算估计标准误差;

(6)求出贷款余额为100亿元时,不良贷款95%的置信区间.

4.

=11.71>

=7.23,接受H0:

检验故障的实际分布与正态分布没有明显差别

5.

=9.448>

=0.16,接受H0:

居民对生活质量的要求与年龄没有明显的关系

6.

=13.28>

=12.376,接受H0:

车祸事故的频数与司机单程驾车的路程相互独立

7.

=94.79>

=9.49,接受H1:

子辈职业与父辈职业之间是存在相关关系

8.

=9.61>

=9.21,拒绝H0:

家长对学生延长在校时间的看法与其居住在城市或农村无关

9.

(1)、

(2)略;(3)见下表;(4)由于Fo=0.4697<F0.05(2,12)=3.98,接受H0:

三个商店的地点不同对每天的营业额没有显著的影响;(5)0.0726

SS自由度MS统计量临界值显著性

组间

组内

4.133322.06670.46973.89

52.800124.4000

56.93314

10.

(1)、

(2)略;(3)见下表;(4)由于Fo=0.72<F0.05(2,38)=3.24,接受H0:

不同职业的生育观没有显著的不同;(5)0.0381

SS自由度MS统计量临界值显著性

组间

组内

3.593421.79670.723.24

94.4066382.4843

98.00040

11.t=2.301>t0.025,11=2.201,拒绝H0:

ρ=0

12.

(1)r=0.9991;

(2)t=66.6>t0.025,8=2.306,拒绝H0:

ρ=0;(3)

=0.2310+0.7511X;(4)

=0.9982,r=

;(5)SY/X=0.0638;(6)

=6.2398,6.1148~6.3648

13.

(1)r=0.8436;

(2)t=7.5344>

,拒绝H0:

ρ=0;(3)

;(4)

,则拒绝

两个变量间的线性关系不显著;(5)SY/X=1.9799;(6)2.11405~3.80585

 

问答题

1.对于拟合优度检验,解释统计推断的结果时,应注意些什么?

2.简述相关比率

、积差系数之平方r2和相关指数R之间的关系。

1.答:

首先,当试验规模很小而作出维持原假设决定时,这可能只是数据太少,不是真的表明实际情况切合零假设。

但是,数据少如果否定了零假设,这一否定的可靠性是很大的。

其次,当试验规模极大而得到否定零假设的结果时,需要进一步(使用区间估计等方法)考虑与零假设的偏离有多大,而不能只是宣布一下统计检验的结果就了事。

反之,若试验规模很大而仍能维持原假设,则可视为是对原假设的有力支持。

2.答:

被用于研究定距—定距变量之间的关系时,不仅可以作为线性相关的量度,也可以作为非线性相关的量度。

对线性相关,相关比率

与r2(积差系数之平方)有相同的PRE性质。

R2可以看做

的特例(定距—定距变量)。

对于定距—定距变量,曲线相关要用R来测量。

同一资料通过相关指数R与积差系数r计算的比较,可以判断确定两定距变量的关系是不是直线。

如果同时求出r与R,r等于或略大于R,可说明两变量关系是直线的,用r去测量是合适的;如果r<R,则说明两变量关系可能是曲线的。

计算题

1.若一总体为2、3、5,求下列各值:

(1)N

(2)X

(3)X2(4)X3

(5)Xn(6)

(7)

(8)

(9)

(10)

2.已知某社区50名退休老人的年龄如下:

81、56、76、67、79、62、72、61、77、62

60、73、65、58、70、60、59、69、58、68

80、59、62、59、83、68、63、70、69、59

64、75、66、

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学 > 天文地理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1