统计学习题区间估计假设检验.docx
《统计学习题区间估计假设检验.docx》由会员分享,可在线阅读,更多相关《统计学习题区间估计假设检验.docx(17页珍藏版)》请在冰豆网上搜索。
统计学习题区间估计假设检验
第五章抽样与参数估计
一、单项选择题
1、某品牌袋装糖果重量的标准是〔500±5〕克。
为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。
以下说法中错误的选项是〔B〕
A、样本容量为10B、抽样误差为2
C、样本平均每袋重量是估计量D、498是估计值
2、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于〔D〕
A、N〔100,25〕B、N〔100,5/
〕
C、N〔100/n,25〕D、N〔100,25/n〕
3、在其他条件不变的情况下,要使置信区间的宽度缩小一半,样本量应增加〔C〕
A、一半B、一倍C、三倍D、四倍
4、在其他条件不变时,置信度〔1–α〕越大,那么区间估计的〔A〕
A、误差围越大B、准确度越高
C、置信区间越小D、可靠程度越低
5、其他条件一样时,要使抽样误差减少1/4,样本量必须增加〔C〕
A、1/4B、4倍C、7/9D、3倍
6、在整群抽样中,影响抽样平均误差的一个重要因素是〔C〕
A、总方差B、群方差C、群间方差D、各群方差平均数
7、在等比例分层抽样中,为了缩小抽样误差,在对总体进展分层时,应使〔B〕尽可能小
A、总体层数B、层方差C、层间方差D、总体方差
8、一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是〔D〕
A、简单随机抽样B、分层抽样C、等距抽样D、整群抽样
9、为了了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进展比照分析,有关部门需要进展一次抽样调查,应该采用〔A〕
A、分层抽样B、简单随机抽样C、等距〔系统〕抽样D、整群抽样
10、某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品的优质品率进展抽样检验,确定必要的抽样数目时,P应选〔A〕
A、85%B、87.7%C、88%D、90%
二、多项选择题
1、影响抽样误差大小的因素有〔ADE〕
A、总体各单位标志值的差异程度B、调查人员的素质
C、样本各单位标志值的差异程度D、抽样组织方式
E、样本容量
2、某批产品共计有4000件,为了了解这批产品的质量,从中随机抽取200件进展质量检验,发现其中有30件不合格。
根据抽样结果进展推断,以下说确的有〔ADE〕
A、n=200B、n=30C、总体合格率是一个估计量
D、样本合格率是一个统计量E、合格率的抽样平均误差为2.52%
3、用样本成数来推断总体成数时,至少要满足以下哪些条件才能认为样本成数近似于正态分布〔BCE〕
A、np≤5B、np≥5C、n〔1–p〕≥5
D、p≥1%E、n≥30
三、填空题
1、对某大学学生进展消费支出调查,采用抽样的方法获取资料。
请列出四种常见的抽样方法:
、、、,当对全校学生的不好获得时,你认为方法比拟适宜,理由是。
四、简答题
1、分层抽样与整群抽样有何异同?
它们分别适合于什么场合?
2、解释抽样推断的含义。
五、计算题
1、某糖果厂用自动包装机装糖,每包重量服从正态分布,某日开工后随机抽查10包的重量如下:
494,495,503,506,492,493,498,507,502,490〔单位:
克〕。
对该日所生产的糖果,给定置信度为95%,试求:
〔1〕平均每包重量的置信区间,假设总体标准差为5克;
〔2〕平均每包重量的置信区间,假设总体标准差未知;
〔
〕;
2、某广告公司为了估计某地区收看某一新电视节目的居民人数所占比例,要设计一个简单随机样本的抽样方案。
该公司希望有90%的信心使所估计的比例只有2个百分点左右的误差。
为了节约调查费用,样本将尽可能小,试问样本量应该为多大?
3、为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时。
〔1〕试对家庭每天平均看电视时间进展区间估计。
〔2〕假设该市每个家庭看电视时间的标准差为2.5小时,此时假设再进展区间估计,并且将边际误差控制在〔1〕的水平,问此时需要调查多少户才能满足要求?
〔α=0.05〕
答案:
一、B,D,C,A,C;C,B,D,A,A。
二、ADE,ADE,BCE。
三、简单随机抽样,分层抽样,等距抽样,整群抽样,分层抽样,不用调查单位的,以院系为单位,而且各院系的消费差异也大,不宜用整群抽样。
四、1、答:
都要事先按某一标志对总体进展划分的随机抽样。
不同在于:
分层抽样的划分标志与调查标志有关,而整群抽样不是;分层抽样在层随机抽取一局部,而整群抽样对一局部群做全面调查。
分层抽样用于层间差异大而层差异小,以及为了满足分层次管理决策时;而整群抽样用于群间差异小而群差异大时,或只有以群体为抽样单位的抽样框时。
2、答:
简单说,就是用样本中的信息来推断总体的信息。
总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中的一局部单位进展调查,利用调查的结果来推断总体的数量特征。
五、1、解:
n=10,小样本
〔1〕方差,由
±zα/2
得,〔494.9,501.1〕
〔2〕方差未知,由
±tα/2
得,〔493.63,502.37〕
2、解:
n=
=
=1691
3、解:
〔1〕
±tα/2
=6.75±2.131×
=(5.55,7.95)
〔2〕边际误差E=tα/2
=2.131×
=1.2
n=
=
=17
第六章假设检验
练习题
一、单项选择题
1、按设计标准,某自动食品包装及所包装食品的平均每袋中量应为500克。
假设要检验该机实际运行状况是否符合设计标准,应该采用〔C〕。
A、左侧检验B、右侧检验
C、双侧检验D、左侧检验或右侧检验
2、假设检验中,如果原假设为真,而根据样本所得到的检验结论是否认元假设,那么可认为〔C〕。
A、抽样是不科学的B、检验结论是正确的
C、犯了第一类错误D、犯了第二类错误
3、当样本统计量的观察值未落入原假设的拒绝域时,表示〔B〕。
A、可以放心地承受原假设B、没有充足的理由否认与原假设
C、没有充足的理由否认备择假设D、备择假设是错误的
4、进展假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会〔A〕。
A、都减少B、都增大
C、都不变D、一个增大一个减小
5、关于检验统计量,以下说法中错误的选项是〔B〕。
A、检验统计量是样本的函数
B、检验统计量包含未知总体参数
C、在原假设成立的前提下,检验统计量的分布是明确可知的
D、检验同一总体参数可以用多个不同的检验统计量
二、多项选择题
1、关于原假设的建立,以下表达中正确的有〔CD〕。
A、假设不希望否认某一命题,就将此命题作为原假设
B、尽量使后果严重的错误成为第二类错误
C、质量检验中假设对产品质量一直很放心,原假设为“产品合格〔达标〕〞
D、假设想利用样本作为对某一命题强有力的支持,应将此命题的对立命题作为原假设
E、可以随时根据检验结果改换原假设,以期到达决策者希望的结论
2、在假设检验中,α与β的关系是〔CE〕。
A、α和β绝对不可能同时减少
B、只能控制α,不能控制β
C、在其它条件不变的情况下,增大α,必然会减少β
D、在其它条件不变的情况下,增大α,必然会增大β
E、增大样本容量可以同时减少α和β
三、判断分析题〔判断正误,并简要说明理由〕
1、对某一总体均值进展假设检验,H0:
=100,H1:
≠100。
检验结论是:
在1%的显著性水平下,应拒绝H0。
据此可认为:
总体均值的真实值与100有很大差异。
2、有个研究者猜想,某贫困地区失学儿童中女孩数是男孩数的3倍以上〔即男孩数缺乏女孩数的1/3〕。
为了对他的这一猜想进展检验,拟随机抽取50个失学儿童构成样本。
那么原假设可以为:
H0:
P≤1/3。
四、简答题
1、采用某种新生产方法需要追加一定的投资。
但假设根据实验数据,通过假设检验判定该新生方法能够降低产品本钱,那么这种新方法将正式投入使用。
〔1〕如果目前生产方法的平均本钱是350元,试建立适宜的原假设和备择假设。
〔2〕对你所提出的上述假设,发生第一、二类错误分别会导致怎样的后果?
五、计算题
1、某种感冒冲剂的生产线规定每包重量为12克,超重或过轻都是严重的问题。
从过去的资料知σ是0.6克,质检员每2小时抽取25包冲剂称重检验,并做出是否停工的决策。
假设产品重量服从正态分布。
〔1〕建立适当的原假设和备择假设。
〔2〕在α=0.05时,该检验的决策准那么是什么?
〔3〕如果
=12.25克,你将采取什么行动?
〔4〕如果
=11.95克,你将采取什么行动?
答案:
一、1、C2、C3、B4、A5、B
二、1、CD2、CE
三、1、错误。
“拒绝原假设〞只能说明统计上可判定总体均值不等于100,但并不能说明它与100之间的差距大。
2、错误。
要检验的总体参数应该是一个比重,因此应该将男孩和女孩的人数的比率转换为失学儿童中女孩所占的比例P〔或男孩所占的比例P*〕所以原假设为:
H0:
P=3/4(或P≤3/4);H1:
P>3/4。
也可以是:
H0:
P*=1/4(或P≥1/4);H1:
P*<1/4。
四、1、〔1〕H0:
≥350;H1:
<350。
〔2〕针对上述假设,犯第一类错误时,说明新方法不能降低生产本钱,但误认为其本钱较低而被投入使用,所以此决策错误会增加本钱。
犯第二类错误时,说明新方法确能降低生产本钱,但误认为其本钱不低而未被投入使用,所以此决策错误将失去较低本钱的时机。
五、1、〔1〕H0:
μ=120;H1:
μ≠12。
〔2〕检验统计量:
Z=
。
在α=0.05时,临界值zα/2=1.96,故拒绝域为|z|>1.96。
〔3〕当
=12.25克时,Z=
=
=2.08。
由于|z|=2.08>1.96,拒绝H0:
μ=120;应该对生产线停产检查。
〔4〕当
=11.95克时,Z=
=
=-0.42。
由于|z|=-0.42<1.96,不能拒绝H0:
μ=120;不应该对生产线停产检查。
第七章相关与回归分析
一、单项选择题
1、下面的关系中不是相关关系的是〔D〕
A、身高与体重之间的关系B、工资水平与工龄之间的关系
C、农作物的单位面积产量与降雨量之间的关系
D、圆的面积与半径之间的关系
2、具有相关关系的两个变量的特点是〔A〕
A、一个变量的取值不能由另一个变量唯一确定
B、一个变量的取值由另一个变量唯一确定
C、一个变量的取值增大时另一个变量的取值也一定增大
D、一个变量的取值增大时另一个变量的取值肯定变小
3、下面的假定中,哪个属于相关分析中的假定〔B〕
A、两个变量之间是非线性关系
B、两个变量都是随机变量
C、自变量是随机变量,因变量不是随机变量
D、一个变量的数值增大,另一个变量的数值也应增大
4、如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,那么称这两个变量之间为〔A〕
A、完全相关关系B、正线性相关关系
C、非线性相关关系D、负线性相关关系
5、根据你的判断,下面的相关系数取值哪一个是错误的〔C〕
A、–0.86B、0.78C、1.25D、0
6、设产品产量与产品单位本钱之间的线性相关关系为–0.87,这说明二者之间存在着〔A〕绝对值大于0.8
A、高度相关B、中度相关C、低相关D、极弱相关
7、在回归分析中,描述因变量y如何依赖于自变量x和误差项ε的方程称为〔B〕
A、回归方程B、回归模型C、估计回归方程D、经历回归方程
8、在回归模型y=
中,ε反映的是〔C〕
A、由于x的变化引起的y的线性变化局部
B、由于y的变化引起的x的线性变化局部
C、除x和y的线性关系之外的随机因素对y的影响
D、由于x和y的线性关系对y的影响
9、如果两个变量之间存在负相关关系,以下回归方程中哪个肯定有误〔B〕
A、
=25–0.75xB、
=–120+0.86x
C、
=200–2.5xD、
=–34–0.74x
10、说明回归方程拟合优度的统计量是〔C〕
A、相关系数B、回归系数C、判定系数D、估计标准误差
11、判定系数R2是说明回归方程拟合度的一个统计量,它的计算公式为〔A〕
A、
B、
C、
D、
12、回归平方和SSR=4854,残差平方和SSE=146,那么判定系数R2=〔A〕4854/(4854+146)
A、97.08%B、2.92%C、3.01%D、33.25%
13、一个由100名年龄在30~60岁的男子组成的样本,测得其身高与体重的相关系数r=0.45,那么以下述中不正确的选项是〔D〕
A、较高的男子趋于较重B、身高与体重存在低度正相关
C、体重较重的男子趋于较高D、45%的较高的男子趋于较重
14、以下回归方程中哪个肯定有误〔A〕
A、
=15–0.48x,r=0.65B、
=–15-1.35x,r=-0.81
C、
=-25+0.85x,r=0.42D、
=120–3.56x,r=-0.96
15、假设变量x与y之间的相关系数r=0.8,那么回归方程的判定系数R2为〔C〕
A、0.8B、0.89C、0.64D、0.40
16、对具有因果关系的现象进展回归分析时〔A〕
A、只能将原因作为自变量B、只能将结果作为自变量
C、二者均可作为自变量D、没有必要区分自变量
二、多项选择题
1、以下现象不具有相关关系的有〔ABD〕
A、人口自然增长率与农业贷款B、存款期限与存款利率
C、降雨量与农作物产量D、存款利率与利息收入
E、单位产品本钱与劳动生产率
2、一个由500人组成的成人样本资料,说明其收入水平与受教育程度之间的相关系数r为0.6314,这说明〔E〕中度
A、二者之间具有高度的正线性相关关系
B、二者之间只有63.14%的正线性相关关系
C、63.14%的高收入者具有较高的受教育程度
D、63.14%的较高受教育程度者有较高的收入
E、通常来说受教育程度较高者有较高的收入
三、判断分析题〔判断正误,并简要说明理由〕
1、一项研究显示,医院的大小〔用病床数x反映〕和病人住院天数的中位数y之间是正相关,这说明二者之间有一种必然的联系。
〔〕
2、应用回归方程进展预测,适宜于插预测而不适宜于外推预测。
〔〕
四、简答题
1、解释相关关系的含义,说明相关关系的特点。
2、简述狭义的相关分析与回归分析的不同。
五、计算题
1、研究结果说明受教育时间与个人的薪金之间呈正相关关系。
研究人员搜集了不同行业在职人员的有关受教育年数和年薪的数据,如下:
受教育年数
x
年薪〔万元〕
y
受教育年数
x
年薪〔万元〕
y
8
3.00
7
3.12
6
2.00
10
6.40
3
0.34
13
8.54
5
1.64
4
1.21
9
4.30
4
0.94
3
0.51
11
4.64
〔1〕做散点图,并说明变量之间的关系;
〔2〕估计回归方程的参数;
〔3〕当受教育年数为15年时,试对其年薪进展置信区间和预测区间估计〔α=0.05〕
〔
〕;
2、一国的货币供给量与该国的GDP之间应保持一定的比例关系,否那么就会引起通货膨胀。
为研究某国家的一段时间通货膨胀状况,研究人员搜集了该国家的货币供给量和同期GDP的历史数据,如下表:
单位:
亿元
年份
货币供给量
该国GDP
1991
2.203
6.053
1992
2.276
6.659
1993
2.454
8.270
1994
2.866
8.981
1995
2.992
11.342
1996
3.592
11.931
1997
4.021
12.763
1998
4.326
12.834
1999
4.392
14.717
2000
4.804
15.577
2001
5.288
15.689
2002
5.348
15.715
〔1〕试以货币供给量为因变量y,该国家的GDP为自变量x,建立回归模型;
〔2〕假设该国家的GDP到达16.0,那么货币供给量的置信区间和预测区间如何,取α=0.05。
答案:
一、D,A,B,A,C;A,B,C,B,C。
A,A,B,A,C;A
二、ABD,AE。
三、1、×,这种正相关是因为二者同时受到疾病的严重程度的影响所致。
2、√,因为用最小平方法在现有资料围配合的最正确方程,推到资料围外,就不一定是最正确方程。
四、1、答:
变量之间存在的不确定的数量关系为相关关系,可能还会有其他很多较小因素影响;特点是一个变量的取值不能由另一个变量唯一确定。
2、答:
变量性质不同,相关分析不必区分自变量和因变量,而回归分析必须区分;作用不同,相关分析用于测度现象之间有无相关关系、关系方向、形态及密切程度,而回归分析是要提醒变量之间的数量变化规律。
五、1、解:
〔1〕
〔2〕建立线性回归方程
,根据最小二乘法得:
由此可得
=0.732,
=-2.01,那么回归方程是
=-2.01+0.732x
〔3〕当受教育年数为15年时,其年薪的点估计值为:
=-2.01+0.732×15=8.97〔万元〕
估计标准误差:
Sy=
=
=
=
=0.733
置信区间为:
=8.97±2.228×0.733×
=8.97±1.290
预测区间为:
=8.97±2.228×0.733×
=8.97±2.081
2、解:
〔1〕建立线性回归方程
,根据最小二乘法得:
由此可得
=0.0093,
=0.316,那么回归方程是
=0.0093+0.316x
〔3〕当GDP到达16时,其货币供给量的点估计值为:
=0.0093+0.316×16=5.065亿元
估计标准误差:
Sy=
=
=
=
=0.305
置信区间为:
=5.065±2.228×0.305×
=5.065±0.318亿元
预测区间为:
=5.065±2.228×0.305×
=5.065±0.750亿元