抽样复习的题目下2Word文档格式.docx
《抽样复习的题目下2Word文档格式.docx》由会员分享,可在线阅读,更多相关《抽样复习的题目下2Word文档格式.docx(9页珍藏版)》请在冰豆网上搜索。
优点:
操作简单,调查数据的处理较容易,省时,省费用。
概率抽样:
根据随机原则,按照事先设计的程序,从总体抽取部分单元的抽样方法(要求每一个样本单元被选中入样的概率是已知的)
1.6抽样调查的特点。
1、节约费用2、时效性强3、完成全面调查不能胜任的项目4、有助于提高数据质量
抽样调查基本原理
2.1试说明以下术语或概念之间的关系与区别;
1.总体、样本与个体;
总体:
是指所要研究对象的全体,它由研究对象中所有性质相同的个体组成,组成总体的各个个体称为总体单元或单位。
抽样总体:
是指从中抽取样本的总体。
2.总体与抽样框;
总体与抽样框应保持一致
抽样框:
是一份包含所有抽样单元的名单,给每一个抽样单元编上一个号码,就可以按照一定的随机化程序进行抽样。
抽样总体的具体表现是抽样框。
3.个体、抽样单元与抽样框。
抽样单元是构成抽样框的基本要素,抽样单元可以只包含一个个体,也可以包含若干个个体,抽样单元还可以分级。
2.2试说明以下术语或概念之间的关系与区别;
1.均方误差、方差与偏倚;
方差:
偏倚:
均方误差:
2.方差、标准差与标准误;
3.无偏估计、祥和估计量与可用估计量;
4.绝对误差限、置信限(置信区间)与置信度。
2.3从某个总体抽取一个n=50的独立同分布样本,样本数据如下:
567601665732366937462619279287
690520502312452562557574350875
834203593980172287753259276876
69237188764139944292744291811
17841640521058797746153644476
1.计算样本均值y与样本方差s2;
2.若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;
3.根据上述样本数据,如何估计v(y)?
4.假定y的分布是近似正态的,试分别给出总体均值μ的置信度为90%,95%,的(近似)置信区间。
2.4样本可能数目及其意义;
绝对误差
相对误差
均值估计时样本量n的确定
(1)按绝对误差d决定样本n
(2)按相对误差r决定样本n
比例估计时样本量n的确定
(2)按相对误差r决定样本n
2.5影响抽样误差的因素;
答:
抽样误差:
抽样误差是由于抽取样本的随机性造成的样本值与总体值之间的差异。
估计量方差及估计量标准差都为抽样误差的表现形式。
2.6抽样分布及其意义;
简单随机抽样
3.1设总体N=5,其指标值为{3,5,6,7,9}
1.从中抽取n=2的随机样本,分别计算不放回抽样的方差
;
3.按不放回抽样的分别列出所有可能的样本并计算
,验证
=
4.按不放回抽样的所有可能的样本,计算其方差
,并与公式计算的结果进行比较;
5.对所有的可能样本计算样本方差s2,并验证在不放回的情况下:
E(s2)=S2。
3.2在一森林抽样调查中,某林场共有1000公顷林地,随机布设了50块面积为0.06公顷的方形样地,测得这50块样地的平均储蓄量为9m3,标准差为1.63m3,试以95%的置信度估计该林场的木材储蓄量。
3.3某居民区共有10000户,现用抽样调查的方法估计该区居民的用水量。
采用简单随机抽样抽选了100户,得ý
=12.5,s2=1252。
估计该居民区的总用水量95%的置信区间。
若要求估计的相对误差不超过20%,试问应抽多少户做样本?
3.4某工厂欲制定工作定额,估计所需平均操作时间,从全厂98名从事该项作业的工人中随机抽选8人,其操作时间分别为4.2,5.1,7.9,3.8,5.3,4.6,5.1,4.1(单位:
分),试以95%的置信度估计该项作业平均所需时间的置信区间(有限总体修正系数可忽略)。
3.5从一叠单据中用简单随机抽样方法抽取了250张,发现其中有50张单据出现错误,试以95%的置信度估计这批单据中有错误的比例。
若已知这批单据共1000张,你的结论有何变化?
若要求估计的绝对误差不超过1%,则至少抽取多少张单据作样本?
3.6欲调查二种疾病的发病率,疾病A的发病率较高,预期为50%;
疾病B的发病率预期为1%。
若要得到相同的标准差0.5%,采用简单随机抽样各需要多大的样本量?
试对上述不同的结果加以适当的说明。
3.7简单随机抽样中样本量确定的原则及主要考虑因素;
3.8总体方差的预先确定思路。
分层抽样
4.1一公司希望估计某一个月内由于事故引起的工时损失。
因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。
已知下列资料:
工人
技术人员
行政管理人员
N1=132
N2=92
N3=27
S12=36
S22=25
S32=9
若样本量n=30,试用奈曼分配确定各层的样本量。
4.2上题中若实际调查了18个工人,10个技术人员,2个行政人员,其中损失的工时数如下:
8,24,0,0,16,32,
6,0,16,7,4,4,9,5,8,18,2,0
4,5,0,24,8,12,3,2,1,8
1,8
试估计总的工时损失数并给出它的置信度为95%的置信区间。
4.3调查某个地区的养牛头数,以村作为抽样单元。
根据村的海拔高度和人口密度划分成四层,每层取10个村作为样本单元,经过调查获得下列数据
层
村总数
样本村养牛头数
12345678910
1
2
3
4
1411
4705
2558
14997
438498010440124130
5014762878415817010456160
228262110232139178334063220
173425343602571531
要求:
(1)估计该地区养牛总头数Y及其估计量的相对标准误差
(2)讨论分层抽样与不分层抽样比较效率有否提高。
(3)若样本量不变采用乃曼分配可以减少方差多少?
4.5用下面的工厂分组资料
按工人人数分组
工厂数目
每工厂产值(万元)
标准差
1—49
50—99
100—249
250—999
1000人以上
18260
4315
2233
1057
567
100
250
500
1760
2250
80
200
600
1900
2500
若欲抽取3000个工厂作样本来估计产值,试比较下列各种分配的效率:
(1)按工厂数多少分配样本;
(2)按奈曼分配。
4.6设费用函数具有形式
其中
,
(h=1,…,L)均为已知数。
试证明当总的费用固定时,为了使
达到最小,
必与
成比例。
4.7怎样分层能提高精度?
4.8总样本量在各层间分配的方法有哪些?
按比例分配、按最优分配、按奈曼分配
4.9分层的原则及其意义。
若分层的目的为了便于组织或估计子总体的参数,则分层按自然或单元的类型来划分。
若分层的目的为了提高抽样效率,则分层的主要原则为:
层内方差尽量小,而层间方差尽量大。
比估计与回归估计
5.1对以下假设总体(N=6)
U1U2U3U4U5U6
Xi
Yi
0135810
1311182946
(1)用简单随机抽样抽取n=2的样本,列出所有可能的样本计算每个样本的R。
R是不是无偏的?
若有偏,偏倚多大?
(2)若用n=2的简单样本去估计总体总量Y,试比较比估计与简单估计的方差。
5.2欲估计某小区居民的食品支出占总收入的比重,该地区共有150户,现用简单随机抽样抽取14户为样本,经调查每户的食品支出yi与总收入xi的数据如下表:
样本户
总收入xi
食品支出yi
5
6
7
8
9
10
11
12
13
14
25100
32200
29600
35000
34400
26500
28700
28200
34600
32700
31500
30600
27700
28500
3800
5100
4200
6200
5800
4100
3900
3600
4500
4000
要求估计食品支出占收入比重的95%置信度的置信区间。
5.3某乡欲估计今年的小麦总产量,全县共有123个村,按简单随机抽样抽取13个村作为样本,取得资料如下:
样本村
去年的小麦产量(百斤)
今年的小麦产量(百斤)
550
720
1500
1020
620
980
928
1200
1350
1750
670
729
1530
610
780
1600
1030
1050
977
1440
1570
2210
865
1710
(1)若已知去年的小麦总产量为128200(百斤),采用比估计法估计今年的小麦总产量和置信度为95%的置信区间。
(2)估计每个村的平均小麦产量及估计的相对标准差。
5.6回归估计、比估计与简单估计间的区别;
5.7辅助变量的选择原则;
5.8分别比估计与联合比估计间的区别;
5.9分别回归估计与联合回归估计间的区别;