统计学习题Word格式文档下载.docx
《统计学习题Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《统计学习题Word格式文档下载.docx(29页珍藏版)》请在冰豆网上搜索。
C、两个整体的平均数代表性同样D、无法判断
10、某单位的生产小组工人薪水资料以下:
90元、100元、110元、120元、128元、148
元、200元,计算结果均值为元,标准差为
A、σ=33B、σ=34C、σ=D、σ=35
11、已知方差为100,算术平均数为4,则标准差系数为
A、10B、C、25D、无法计算
12、有甲乙两组数列,若
A、1<21>2,则乙数列平均数的代表性高
B、1<21>2,则乙数列平均数的代表性低
C、1=21>2,则甲数列平均数的代表性高
D、1=21<2,则甲数列平均数的代表性低
13、某城市男性青年27岁结婚的人最多,该城市男性青年结婚年龄为26.2岁,则该城市男
性青年结婚的年龄分布为
A、右偏B、左偏
C、对称D、不能够作出结论
14、某居民小区准备采用一项新的物业管理措施,为此,随机抽取了100户居民进行检查,
其中表示赞同的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋
势宜采用
A、众数B、中位数C、四分位数D、均值
15、若是你的业务是供应足球运动鞋的号码,哪一种平均指标对你更适用?
A、算术平均数B、几何平均数C、中位数D、众数
三、判断
1、已知分组数据的各组组限为:
10~15,15~20,20~25,取值为15的这个样本被分在第一
组。
()
2、将收集到得的数据分组,组数越多,丧失的信息越多。
3、失散变量既可编制单项式变量数列,也可编制组距式变量数列。
4、从一个整体能够抽取多个样本,所以统计量的数值不是唯一确定的。
5、在给定资料中众数只有一个。
()
6、数字特色偏度、峰度、标准差都与数据的原量纲没关。
7、比较两个整体平均数的代表性,若是标准差系数越大则说明平均数的代表性越好。
8、中位数是处于任意数列中间地址的那个数。
9、算术平均数、调停平均数、几何平均数、众数均受极端两值影响。
10、权数对算术平均数的影响作用只表现为各组出现次数的多少,而与各组次数占总次数的
比重没关。
四、计算题
1、某班的经济学成绩以下表所示:
43
55
56
59
60
67
69
73
75
77
78
79
80
81
82
83
84
86
87
88
89
90
95
97
(1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数
(2)计算该班经济学成绩的众数、四分位差和失散系数。
(3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么?
(4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布?
2、在某一城市所做的一项抽样检查中发现,在所抽取的1000个家庭中,人均月收入在
200~300元的家庭占24%,人均月收入在300~400元的家庭占26%,在400~500元的家庭占
29%,在500~600元的家庭占10%,在600~700元的家庭占7%,在700元以上的占4%。
今后数据分布情况能够判断:
(1)该城市收入数据分布形状如何?
(左偏还是右偏)。
(2)你感觉用均值、中位数、众数中的哪个来描述该城市人均收入情况较好。
原由?
(3)上四分位数和下四分位数所在区间?
3、某厂生产某种机床配件,要经过三道生产工序,现生产一批该产品在各道生产工序上的合格率分别为%、%、%。
依照资料计算三道生产工序的平均合格率。
4、对成年组和青少年组共500人身高资料分组,分组资料列表以下:
成年组青少年组
按身高分组(cm)人数(人)按身高分组(cm)人数(人)
150~1552270~7526
155~16010875~8083
160~1659580~8539
165~1704385~9028
170以上
32
90以上
24
合计
300
200
要求:
(1)分别计算成年组和青少年组身高的平均数、标准差和标准差系数。
(2)说明成年组和青少年组平均身高的代表性哪个大?
为什么?
5、有两个生产小组,都有5个工人,某天的日产量件数以下:
甲组:
810111315
乙组:
1012141516
计算各组的算术平均数、全距、标准差和标准差系数,并说明哪个组的平均数更拥有
代表性。
6、设甲、乙两单位职工的薪水资料以下:
甲单位
乙单位
月薪水(元)
职工人数(人)
600以下
2
1
600-700
4
600-700
700-800
10
700-800
800-900
7
800-900
12
900-1000
6
900-1000
1000-1100
1000-1100
5
30
试比较哪个单位的职工薪水差异程度小。
7、某一牧场主每年饲养600头牛。
现在有人向他介绍一种个头较小的改良品种牛,每头牛
吃草量较少,这样在原来同样面积的牧场上能够多养150头牛。
饲养原品种牛和改良品种牛的利润以下:
净利润(元/头)
原品种牛
改良品种牛
频数
频率(%)
–200
36
185
31
57
400
367
61
40
600
100
(1)牧场主应入选择哪一种品种?
为什么?
(2)改良品种牛的利润和频率可能与上表的计算值有差异。
当饲养改良品种牛的利润有什么变化时,牧场主会改变他在
(1)中所做的选择?
8、一家企业在招收职员时,第一要经过两项能力测试。
在A项测试中,其平均分数是100
分,标准差是15分;
在B项测试中,其平均分数是400分,标准差是50分。
一位应试者
在A项测试中得了115分,在B项测试中得了425分。
与平均分数对照,该位应试者哪一项测试更为理想?
第二章统计量及其分布
一、填空题
1、简单随机抽样样本均值的方差取决于和_________,要使的标准差降低到
原来的50%,则样本容量需要扩大到原来的倍。
2、设是整体的样本,是样本方差,若,则
____________。
(注:
,,)
3、若,则遵从_______分布。
4、已知,则等于___________。
5、中心极限制理是说:
若是整体存在有限的方差,那么,随着的增加,无论这个总
体变量的分布如何,抽样平均数的分布趋近于。
二、选择题
1、中心极限制理可保证在大批观察下
A、样本平均数趋近于整体平均数的趋势B、样本方差趋近于整体方差的趋势
C、样本平均数分布趋近于正态分布的趋势D、样本比率趋近于整体比率的趋势
2、设随机变量,则遵从。
A、正态分布B、卡方分布C、t分布D、F分布
3、依照抽样测定100名4岁男孩身体发育情况的资料,平均身高为95cm,标准差为。
最少以的概率可确信4岁男孩平均身高在93.8cm到96.2cm之间。
A、68.27%B、90%
C、95.45%D、99.73%
4、某品牌袋装糖果重量的标准是(500±
5)克。
为了检验该产品的重量可否吻合标准,现从
某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。
以下说法中错误的选项是
A、样本容量为10B、抽样误差为2
C、样本平均每袋重量是统计量D、498是预计值
5、设整体均值为100,整体方差为25,在大样本情况下,无论整体的分布形式如何,样本平均数的分布都是遵从或近似遵从
A、B、
C、D、
三、判断题
1、全部可能样本平均数的方差等于整体方差。
2、从全部整体单位中依照随机原则抽取部分单位组成样本,只可能组成一个样本。
3、设,则对任何实数均有:
。
4、样本方差就是样本的二阶中心距。
5、设随机变量X与Y满足XN(0,1),Y,则遵从自由度为n的t分布。
1、从正态整体中随机抽取容量为36的样本,要求:
(1)求样本均值的分布;
(2)求落在区间()内的概率;
(3)若要以99%的概率保证,试问样本量最少应取多少?
2、设随机变量,计算
3、依照自由度为4的t分布的密度函数,求出该密度函数的峰值,以及该分布希望与方差。
第三章参数预计
1、、和是对预计量最基本的要求。
2、整体
,
是来自X的一个容量为
3的样本,三个
的无偏估
计量
中,最有效的一个是。
3、在一批货物中,随机抽出
100件发现有
16件次品,这批货物次品率的置信水平为
95%的
置信区间为
。
4、若整体X的一个样本观察值为0,0,1,1,0,1,则整体均值的矩预计值为,整体方
差的矩预计值为。
5、小样本,方差未知,整体均值的区间预计为。
1、在其他条件不变的情况下,若是整体均值置信区间半径要减小成原来的二分之一,则所
需的样本容量()。
A、扩大为原来的4倍B、扩大为原来的2倍
C、减小为原来的二分之一D、减小为原来的四分之一
2、以下哪个不是用公式构造置信区间所需的条件()。
A、整体均值已知B、整体遵从正态分布
C、整体标准差未知D、样本容量小于30
3、某地区职工样本的平均薪水450元,样本平均数的标准差是5元,该地区全部职工平均
薪水落在440—460元之间的预计置信度为()
A、2B、C、3D、
4、假设正态整体方差已知,欲对其均值进行区间预计。
此后中抽取较小样本后使用的统计
量是()
A、正态统计量B、统计量C、t统计量D、F统计量
5、依照一个详尽的样本求出的整体均值的95%的置信区间()
A、以95%的概率包含整体均值B、有5%的可能性包含整体均值
C、必然包含整体均值D、要么包含整体均值,要么不包含整体均值
1、两个正态整体已知,两个整体均值之差的区间预计为:
2、E(X2)是样本二阶原点矩。
3、在其他条件同样的情况下,95%的置信区间比90%的置信区间宽。
4、比较参数的两个矩预计量的有效性时,必定保证它们是无偏预计。
5、F分布百分位点拥有性质。
1、已知某苗圃中树苗高度遵从正态分布,今工作人员从苗圃中随机抽取64株,测得苗高并
求得其均值62厘米,标准差为8.2厘米。
请确定该苗圃中树苗平均高度的置信区间,置信
水平95%。
2、从水平锻造机的一大批产品中随机抽取20件,测得其尺寸平均值=32.58,样本方差
=0.0966。
假设该产品的尺寸,均未知。
试求的置信度为95%的
置信区间。
3、从两个正态整体X,Y中分别抽取容量为16和10的两个样本,算得样本方差分别为
,试求整体方差比的95%置信区间。
第四章假设检验
1、在做假设检验时简单犯的两类错误是
和
2、若是提出的原假设是整体参数等于某一数值,这种假设检验称为
,若提出的原假
设是整体参数大于或小于某一数值,这种假设检验称为
3、假设检验有两类错误,
也叫第一类错误,它是指原假设
H0是
的,
却由于样本缘故做出了
H0的错误;
叫第二类错误,它是指原假设
的,却由于样本缘故做出
H0的错误。
4、在统计假设检验中,控制犯第一类错误的概率不高出某个规定值
α,则α称
为
5、假设检验的统计思想是小概率事件在一次试验中能够认为基本上是不会发生的,该原理
称为
6、从一批部件中抽取
100个测其直径,测得平均直径为
,标准差为,想知道这
批部件的直径可否遵从标准直径
5cm,在显然性水平
α下,否认域为
7、有一批电子部件,质量检查员必定判断可否合格,假设此电子部件的使用时间大于或等
于1000,则为合格,小于1000小时,则为不合格,那么能够提出的假设为
(用
H,H
表示)
8、一般在样本的容量被确定后,犯第一类错误的概率为
,犯第二类错误的概率为
,若
减少
,则
9、某厂家想要检查职工的工作效率,工厂预计的工作效率为最少制作部件
20个/小时,随
机抽样
36位职工进行检查,获取样本均值为
19,样本标准差为6,试在显然水平为
0.05的
要求下,问该工厂的职工的工作效率
(有,没有)达到该标准。
1、假设检验中,犯了原假设
H0实质是不真实的,却由于样本的缘故而做出的接受
H0的错
误,此类错误是(
)
A、α类错误
B、第一类错误
C、取伪错误
D、弃真错误
2、一种部件的标准长度5cm,要检验某天生产的部件可否吻合标准要求,建立的原假设和
备选假设就为()
A、,
B、,
C、,
D、,
3、一个95%的置信区间是指()
A、整体参数有95%的概率落在这一区间内
B、整体参数有5%的概率未落在这一区间内
C、在用同样方法构造的整体参数的多个区间中,有95%的区间包含该整体参数
D、在用同样方法构造的整体参数的多个区间中,有95%的区间不包含该整体参数
4、假设检验中,若是增大样本容量,则犯两类错误的概率()
A、都增大B、都减小C、都不变D、一个增大一个减小
5、一家汽车生产企业在广告中声称“该企业的汽车能够保证在2年或24000公里内无事故”,
但该汽车的一个经销商认为保证“2年”这一项为哪一项不用要的,由于汽车车主在2年专家驶的平
均里程高出24000公里。
假设这位经销商要检验假设,,
取显然水平为α=,并假设为大样本,则此项检验的拒绝域为()
B、
C、
6、某种感冒冲剂规定每包重量为12克,超重或过轻都是严重问题。
从过去的生产数据得知,标准差为2克,质检员抽取25包冲剂称重检验,平均每包的重量
克。
假定产品重量服从正态分布。
取显著
性水平0.05,感冒冲剂的每包重量是否符合标准要求?
(
A、符合
B、不符合
C、无法判断
D、不同情况下有不同结论
1、若是拒绝原假设将会造成企业严重的经济损失时,那么
α的值应获取小一些。
(
2、统计假设总是成对提出的,即既要有原假设
,也要有备择假设
3、犯第二类错误的概率与犯第一类错误的概率是亲近有关的,在样本必然条件下,
α小,β
就增大;
α大,β就减小。
为了同时减小α和β,只有增大样本容量,减小抽样分布的失散
性,这样才能达到目的。
4、随着显然性水平α取值的减小,拒绝假设的原由将变得充分。
5、假设检验是一种决策方法,使用它不犯错误。
四、计算
1、下面是某个随机采用20只部件的装置时间(单位:
分)
设装置时间的整体遵从正态分布,参数均未知,可否认为装置时间的均值为10?
2、某厂家风称其产出的原件使用寿命不低于1000小时,现在从一批原件中随机抽取25件,
测得其寿命的平均值为950小时。
素来这种原件的寿命遵从正态分布,标准差为100小时。
试求在显然性水平为0.05下,确定厂家的声明可否可信?
3、测得两批电子器件的样品的电阻(单位:
)为:
A批(x)
B批(y)
设两批器材电阻整体分别遵从分布均未知,且两样本
独立,问在下,可否认为两批电子器件的电阻相等?
4、在一批产品中抽40件进行检查,发现次品有6件,试按显然水平为0.05来判断该批产品的次品率可否高于10%。
5、某网络企业欲认识甲居民区中的家庭(21户)每个月上网的平均小时数可否比乙居民区中
的家庭(16户)少。
从这两个独立样本中得出的数据为=16.5(小时),(小时),
S1(小时)S2(小时)。
假设两个居民区家庭每个月上网小时数遵从正态分布(α)
第六章回归解析
1、现象之间宽泛存在的互有关系能够概括为两类:
一类是,另一类是。
2、在简单回归解析中,因变量y的总离差能够分解为和。
3、如有关系数为,表示两变量之间呈关系。
4、线性回归方程中,截矩的意义是。
5、线性回归方程中,斜率的意义是。
二、单项选择题
1、当有关系数时,表示()
A、现象之间完好没关B、有关程度较小
C、现象之间完好有关D、无直线有关关系
2、以下回归方程中,必然错误的选项是()
A、B、
C、D、
3、对于有线性有关关系的两变量建立的直线回归方程中,回归系数()
A、可能为0B、可能小于0C、只能是正数D、只能是负数
4、回归预计中,自变量的取值越远离其平均值,求获取y的展望区间()
A、越宽B、越窄C、越正确D、越凑近实质值
5、在回归解析中,F统计量主若是用来检验()
A、有关系数的显然性B、回归系数的显然性
C、线性关系的显然D、参数预计值的显然性
1、在简单线性回归解析中,是的无偏预计。
2、总离差平方和一准时,回归离差平方和越大,残差平方和就越小。
3、回归残差平方和。
4、有关系数r有正负、有大小,所以它反响的是两现象之间详尽的数量变动关系。
5、进行回归解析时,应注意对有关系数和回归直线方程的有效性进行检验。