1、A. 层数多一些比较好 B. 层数少一些比较好 C. 层数一般以不超过6为宜D. 层数一般以4 层为最好 E. 应该充分考虑费用和精度要求等因素来确定层数6.下面哪种样本量分配方式属于奈曼分配? ( CD )A. B. C. D. E. 7.事后分层的适用场合有(ABCD ) A. 各层的抽样框无法得到B. 几个变量都适宜于分层,而要进行事先的多重交叉分层存在一定困难C. 一个单位到底属于哪一层要等到样本数据收集到以后才知道D. 总体规模太大,事先分层太费事E. 一般场合都可以适用三、名次解释1. 分层随机抽样 2. 自加权 3. 最优分配四、简答题1. 简述分层随机抽样相对于简单随机抽样的优
2、点。2. 请列举出样本量在各层的三种分配方法,并说明各种方法的主要思想。3. 怎样分层能提高精度?4. 总样本量在各层间分配的方法有哪些?5. 分层的原则及其意义。五、计算题1. 抽查一个城市的家庭,目的是评估平均每个住户很容易变换为现款的财产金额。住户分为高房租和低房租的两层。高房租这一层每家拥有的财产被看作是低房租层每家所拥有财产的倍,与第层的均值的平方根成正比。高房租层有4000个住户,低房租层有2000个住户。请问:(1)包含1000个住户的样本应该如何在这两层中分配?(2) 若调查的目的是估计这两层平均每个住户拥有财产的差额,样本应如何分配(假定各层的单位调查费用相等)?2. 一个县
3、内所有农场按规模大小分层,各层内平均每个年农场谷物(玉米)的英亩数列在下表中。农场规模(英亩)农场数平均每一农场的玉米面积标准差0404180811201211601612002012403944613913341691131485.416.324.334.542.150.163.88.313.315.119.824.526.035.2总和或均值201026.3-现要抽出一个包含100个农场的样本,目的是估计该县平均每个农场的玉米面积,请问:(1)按比例分配时,各层的样本量为多少?(2)按最优分配时,各层的样本量为多少?(假定各层的单位调查费用相等)(3)分别将比例分配、最优分配的精度与简单随
4、机抽样的精确度比较。3. 设费用函数具有形式,其中及均为已知数,请证明当总费用固定时,为了使达到最小值,必与成比例。并求出下述条件中,一个含量为1000的样本所对应的。层1230.40.34564. 在一个商行内,62%的雇员是熟练的或不熟练的男性,31%是办事的女性,7%是管理人员。从商行内抽取由400人组成的一个样本,目的是估计使用某些娱乐设备的人所占的比例。按照粗略的猜测,这些设备40%到50%是由男性使用的,20%到30%是由女性使用的,5%到10%是由管理人员使用的。 (1)你如何把样本单位分配在这三组人之间? (2)若真正使用者占的比例分别是48%,21%和4%,则估计比例的标准误
5、是多少? (3)n=400的简单随机样本算得的p的标准误是多少?5. 为调查某个高血压发病地区青少年与成年人高血压患病率,对14岁以上的人分四个年龄组进行分层随机抽样,调查结果见下表。求总体高血压患病率P的估计及其标准差的估计。高血压患病率调查数据年龄组层权层样本量1425岁2640岁4160岁61岁以上0.2810.3220.2130.8144006506003500.0830.1740.3100.4640.9170.8260.6900.5366. 设计某一类商店销售额的调查,n=550,三层中的两层有以前调查的资料可用来得到的较好的估计值。第三层是一些新开设的商店和以前调查中没有销售额的商
6、店,因此,的值只好加以猜测。若的实际值是10,当被猜作(a)5, (b) 20时,请分别计算一下由奈曼分配所得的估计量的并请证明在这两种情况下,与真正的最优值相比,方差中按比例的增量稍大于2%。真值估计的(1)(2)0.60.13020107. 调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成四层,每层抽取10个村作为样本单元,经过调查获得下列数据:村总数样本村养牛头数7891411438498441241347055014762871581701045616025582282621102321391786322014997173425361531 请估计该地区养牛总
7、头数Y及其估计量的相对标准差8. 一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,故采用分层随机抽样。已知下列资料:工人技术人员行政管理人员=132=36=92=25=27=9 若总样本量n=30,试用奈曼分配确定各层的样本量。9. 上题中若实际调查了18个工人、10个技术人员、2个行政人员,其损失的工时数如下:8,24,0,0,16,32,6,0,16,7,4,4,9,5,8,18,2,04,5,0,24,8,12,3,2,1,81,8 试估计总的工时损失数并给出它的置信度为95%的置信区间。10. 某县欲调查某种农作物的产量,由于平原和山区的产量
8、有差别,故拟划分为平原和山区两层采用分层抽样。同时当年产量和去年产量之间有相关关系,故还计划采用比估计方法。已知平原共有120个村,去年总产量为24500(百斤),山区共有180个村,去年总产出为21200(百斤)。现从平原用简单随机抽样抽取6个村,从山区抽取9个村,两年的产量资料列在下表中。试用分别比估计与联合比估计分别估计当年的总产量,给出估计量的标准误,并对上面的两种结果进行比较和分析。平原样本去年产量(百斤)当年产量(百斤)2042101438275256280275300198190山区137150189200119125601031071001591809011. 一公司希望估计某
9、一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。N1=132 N2=92N3=27S12=36 S22=25S32=9若样本量n=30,试用你乃曼分配确定各层的样本量。12. 上题中若实际调查了18个工人,10个技术人员,2个行政人员,其中损失的工时数如下:8,24,0,0,16,32,6,0,16,7,4,4,9,5,8,18,2,0试估计总的工时损失数并给出它的置信度为95%的置信区间。13. 在估计比例问题时:(1) 假设P=0.5,W1=W2=0.5,则P1和P2为何值时可以使按比例分配的分层抽样精度可以得益20%(即=0.8)(2) 若P
10、=4%,其中W1=0.05,P1=45%;W2=0.2,P2=5%; W3=0.75, P3=1%.则采用按比例分配的分层抽样比简单随机抽样精度得益有多大?14. 调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成四层,每层取10个村作为样本单元,经过调查获得下列数据1 2 3 4 5 6 7 8 9 10 43 84 98 0 10 44 0 124 13 050 147 62 87 84 158 170 104 56 160228 262 110 232 139 178 334 0 63 22017 34 25 34 36 0 25 7 15 31要求:(1) 估计
11、该地区养牛总头数Y及其估计量的相对标准误差(2) 讨论分层抽样与不分层抽样比较效率有否提高。(3) 若样本量不变采用乃曼分配可以减少方差多少?15. 用下面的工厂分组资料按工人人数分组工厂数目每工厂产值(万元)14950991002492509991000人以上18260431522331057567250500176022508019002500(1) 若欲抽取3000个工厂作样本来估计产值,试比较下列各种分配的效率:(2) 按工厂数多少分配样本;按最优(奈曼)分配。16. 一个样本为1000的简单随机样本,其结果可分为三层,相应的=10.2,12.6,17.1,=10.82(各层相同),=17.66,估计的层权是=0.5,0.3,0.2,已知这些权数有误差,但误差在5%以内,最不好的情况是=0.525,0.285,0.
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1