第1节 抽样方法.docx
《第1节 抽样方法.docx》由会员分享,可在线阅读,更多相关《第1节 抽样方法.docx(17页珍藏版)》请在冰豆网上搜索。
第1节抽样方法
第1节 抽样方法
考试要求 1.理解随机抽样的必要性和重要性;2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.会用随机抽样的基本方法解决一些简单的实际问题.
知识梳理
1.简单随机抽样
(1)定义:
设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样的方法:
抽签法和随机数法.
(3)应用范围:
总体中的个体数较少.
2.系统抽样
(1)定义:
系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样.
(2)系统抽样的操作步骤
假设要从容量为N的总体中抽取容量为n的样本.
①先将总体的N个个体编号;
②确定分段间隔k,对编号进行分段,当
(n是样本容量)是整数时,取k=
(否则,先剔除一些个体);
③在第1段用简单随机抽样确定第一个个体编号l(l≤k);
④按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),……,依次进行下去,直到获取整个样本.
(3)应用范围:
总体中的个体数较多.
3.分层抽样
(1)定义:
在抽样时,将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本,这种抽样方法叫作分层抽样,有时也称为类型抽样.
(2)应用范围:
当总体是由差异明显的若干类型组成时,往往选用分层抽样.
[常用结论与微点提醒]
1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
2.系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔k的整数倍.
3.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.
诊断自测
1.判断下列结论正误(在括号内打“√”或“×”)
(1)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( )
(2)系统抽样在起始部分抽样时采用简单随机抽样.( )
(3)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( )
(4)要从1002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( )
答案
(1)×
(2)√ (3)× (4)×
2.(老教材必修3P5讲解引申改编)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是( )
A.总体B.个体
C.样本的容量D.从总体中抽取的一个样本
解析 由题目条件知,5000名居民的阅读时间的全体是总体;其中每1名居民的阅读时间是个体;从5000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.
答案 A
3.(老教材必修3P12例3改编)一个公司共有N名员工,下设一些部门,要采用等比例分层抽样的方法从全体员工中抽取样本容量为n的样本,已知某部门有m名员工,那么从该部门抽取的员工人数是________.
解析 每个个体被抽到的概率是
,
设这个部门抽取了x个员工,
则
=
,∴x=
.
答案
4.(2020·吉安一模)总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为( )
附:
第6行至第9行的随机数表如下:
26357900337091601620388277574950
32114919730649167677873399746732
27486198716441487086288885191620
74770111163024042979799196835125
A.3B.16C.38D.20
解析 按随机数表法,从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,超出00~49及重复的不选,则编号依次为33,16,20,38,49,32,…,则选出的第3个个体的编号为20,故选D.
答案 D
5.(2019·兰州二模)某学校为响应“平安出行”号召,拟从2019名学生中选取50名学生加入“交通志愿者”,若采用以下方法选取:
先用简单随机抽样方法剔除19名学生,剩下的2000名再按照系统抽样的方法抽取,则每名学生入选的概率( )
A.不全相等B.均不相等
C.都相等,且为
D.都相等,且为
解析 先用简单随机抽样方法剔除19名学生,剩下的2000名再按照系统抽样的方法抽取,则每名学生入选的概率相等,且为p=
,故选D.
答案 D
6.(2018·全国Ⅲ卷)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.
解析 因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价.
答案 分层抽样
考点一 简单随机抽样及其应用
【例1】
(1)下面的抽样方法是简单随机抽样的是( )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见
D.用抽签方法从10件产品中选取3件进行质量检验
(2)假设要考察某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,将800袋牛奶按000,001,…,799进行编号,若从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是________(下面摘取了随机数表第7行至第9行).
解析
(1)A,B不是简单随机抽样,因为抽取的个体间的间隔是固定的;C不是简单随机抽样,因为总体中的个体有明显的层次;D是简单随机抽样.故选D.
(2)由随机数表知,前4个样本的个体编号分别是331,572,455,068.
答案
(1)D
(2)068
规律方法 1.简单随机抽样需满足:
(1)被抽取的样本总体的个体数有限;
(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.
2.简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).
【训练1】
(1)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
A.08B.07C.02D.01
(2)在简单随机抽样中,某一个个体被抽到的可能性( )
A.与第n次有关,第一次可能性最大
B.与第n次有关,第一次可能性最小
C.与第n次无关,与抽取的第n个样本有关
D.与第n次无关,每次可能性相等
解析
(1)从第1行第5列和第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.
(2)∵在简单随机抽样中,每个个体被抽到可能性都相等,与第n次无关,∴D正确.
答案
(1)D
(2)D
考点二 系统抽样及其应用
【例2】
(1)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )
A.50B.40C.25D.20
(2)将高一·九班参加社会实践编号为1,2,3,…,48的48名学生,采用系统抽样的方法抽取一个容量为4的样本,已知5号,29号,41号学生在样本中,则样本中还有一名学生的编号是________.
解析
(1)由系统抽样的定义知,分段间隔为
=25.
(2)根据系统抽样的概念,所抽取的4个样本的编号应成等差数列,因为这组数中的间距应为41-29=12,所以所求的编号为5+12=17.
答案
(1)C
(2)17
规律方法 1.如果总体容量N能被样本容量n整除,则抽样间隔为k=
,否则,可随机地从总体中剔除余数,然后按系统抽样的方法抽样,特别注意,每个个体被抽到的机会均是
.
2.系统抽样中依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.
【训练2】
(1)(2019·全国Ⅰ卷)某学校为了解1000名新生的身体素质,将这些学生编号为1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( )
A.8号学生B.200号学生
C.616号学生D.815号学生
(2)在一次马拉松比赛中,35名运动员的成绩(单位:
分钟)的茎叶图如图所示:
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.
解析
(1)根据题意,系统抽样是等距抽样,
所以抽样间隔为
=10.
因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616.故选C.
(2)依题意,可将编号为1~35号的35个数据分成7组,每组有5个数据,从每组中抽取一人.
成绩在区间[139,151]上共有20个数据,分在4个小组内,每组抽取1人,共抽取4人.
答案
(1)C
(2)4
考点三 分层抽样及其应用
多维探究
角度1 求某层入样的个体数
【例3-1】(2019·郴州二模)已知我市某居民小区户主人数和户主对户型结构的满意率分别如图1和图2所示,为了解该小区户主对户型结构的满意程度,用分层抽样的方法抽取30%的户主进行调查,则样本容量和抽取的户主对四居室满意的人数分别为( )
A.240,18B.200,20
C.240,20D.200,18
解析 样本容量n=(250+150+400)×30%=240,抽取的户主对四居室满意的人数为150×30%×40%=18.
答案 A
规律方法 1.分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:
层内样本的差异要小,两层之间的样本差异要大,且互不重叠.
2.求某层应抽个体数量:
按该层所占总体的比例计算.
角度2 求总体或样本容量
【例3-2】
(1)(2020·东北三省四校联考)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n等于( )
A.12B.18C.24D.36
(2)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.
解析
(1)根据分层抽样方法知
=
,解得n=36.
(2)由题设,抽样比为
=
.
设甲设备生产的产品为x件,则
=50,∴x=3000.
故乙设备生产的产品总数为4800-3000=1800.
答案
(1)D
(2)1800
规律方法 1.已知某层个体数量,求总体容量或反之:
根据分层抽样就是按比例抽样,列比例式进行计算.
2.进行分层抽样的相关计算时,常用到的两个关系
(1)
=
;
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
【训练3】
(1)(角度1)(2020·河南名校联考)《九章算术》第三章“衰分”中有如下问题:
“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?
”其意为:
“今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则丙应出________钱(所得结果四舍五入,保留整数).
(2)(角度1)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:
人).
篮球组
书画组
乐器组
高一
45
30
a
高二
15
10
20
学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________.
(3)(角度2)(2020·长沙模拟)某机构对青年观众是否喜欢跨年晚会进行了调查,人数如表所示:
不喜欢
喜欢
男性青年观众
30
10
女性青年观众
30
50
现要在所有参与调查的人中用分层抽样的方法抽取n人做进一步的调研,若在“不喜欢”的男性青年观众中抽取了6人,则n=( )
A.12B.16C.24D.32
解析
(1)按照钱的多少按比例出钱,所以丙应该出钱为
×100=
≈17.
(2)由分层抽样得
=
,解得a=30.
(3)由分层抽样的性质得
=
,解得n=24.故选C.
答案
(1)17
(2)30 (3)C
A级 基础巩固
一、选择题
1.(2020·永州模拟)现从已编号(1~50)的50位同学中随机抽取5位以了解他们的数学学习状况,用选取的号码间隔一样的系统抽样方法确定所选取的5位同学的编号可能是( )
A.5,10,15,20,25B.3,13,23,33,43
C.1,2,3,4,5D.2,10,18,26,34
解析 抽样间隔为
=10,只有选项B合题意.
答案 B
2.(2019·长春一模)完成下列两项调查:
①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调查社会购买能力的某项指标;②从某中学的15名艺术特长生中选出3名调查学习负担情况.宜采用的抽样方法依次是( )
A.①简单随机抽样,②系统抽样
B.①分层抽样,②简单随机抽样
C.①系统抽样,②分层抽样
D.①②都用分层抽样
答案 B
3.在一个容量为N的总体中抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )
A.p1=p2<p3B.p2=p3<p1
C.p1=p3<p2D.p1=p2=p3
解析 由随机抽样的知识知,三种抽样中,每个个体被抽到的概率都相等,故选D.
答案 D
4.从30个个体(编号为00~29)中抽取10个样本,现给出某随机数表的第11行到第15行(见下表),如果某人选取第12行的第6列和第7列中的数作为第一个数并且由此数向右读,则选取的前4个的号码分别为( )
92644607202139207766381732561640
58587766317005002593054553707814
28896628675782311589006200473815
51318186370945216665532553832702
90557196217232071114138443594488
A.76,63,17,00B.16,00,02,30
C.17,00,02,25D.17,00,02,07
解析 在随机数表中,将处于00~29的号码选出,满足要求的前4个号码为17,00,02,07.故选D.
答案 D
5.下列抽取样本的方式属于简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本.
②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
③从20件玩具中一次性抽取3件进行质量检验.
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
A.0B.1C.2D.3
解析 ①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样.因为它是有放回抽样;③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样.因为不是等可能抽样.故选A.
答案 A
6.某中学400名教师的年龄分布情况如图,现要从中抽取40名教师作样本,若用分层抽样方法,则40岁以下年龄段应抽取( )
A.40人B.200人
C.20人D.10人
解析 由图知,40岁以下年龄段的人数为400×50%=200,若采用分层抽样应抽取200×
=20(人).
答案 C
7.(一题多解)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100B.150C.200D.250
解析 法一 由题意可得
=
,解得n=100.
法二 由题意,抽样比为
=
,总体容量为3500+1500=5000,故n=
5000×
=100.
答案 A
8.用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )
A.
,
B.
,
C.
,
D.
,
解析 在抽样过程中,个体a每一次被抽中的概率是相等的,因为总体容量为10,故个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性均为
,故选A.
答案 A
二、填空题
9.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.
解析 因为样本容量n=60,样本总体N=200+400+300+100=1000,所以抽取比例为
=
=
.
因此应从丙种型号的产品中抽取300×
=18(件).
答案 18
10.将参加英语口语测试的1000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个样本编号为________.
解析 由题意可知,第一组随机抽取的编号为015,分段间隔数k=
=
=20,由题意知抽出的这些号码是以15为首项,20为公差的等差数列,则抽取的第35个样本编号为15+(35-1)×20=695.
答案 695
11.某商场有四类食品,食品类别和种数见下表:
类别
粮食类
植物油类
动物性食品类
果蔬类
种数
40
10
30
20
现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样方法抽取样本,则抽取的植物油类与果蔬类食品种数之和为________.
解析 因为总体的个数为40+10+30+20=100,所以根据分层抽样的定义可知,抽取的植物油类食品种数为
×10=2,抽取的果蔬类食品种数为
×20=4,所以抽取的植物油类与果蔬类食品种数之和为2+4=6.
答案 6
12.(2019·湖北重点中学模拟)某校高三年级共有30个班,学校心理咨询室为了了解同学们的心理状况,将每个班编号,依次为1到30,现用系统抽样的方法抽取5个班进行调查,若抽到的编号之和为75,则抽到的最小的编号为________.
解析 系统抽样的抽取间隔为
=6.设抽到的最小编号为x,则x+(6+x)+(12+x)+(18+x)+(24+x)=75,所以x=3.
答案 3
B级 能力提升
13.从一群游戏的小孩中抽出k人,一人一个苹果,让他们返回继续游戏,一段时间后,再从中任取m人,发现其中有n人曾分过苹果,则可估计这群小孩共有( )
A.k·
人B.k·
人
C.(k+m-n)人D.(k+m+n)人
解析 设这群小孩共有x人,则
=
,解得x=
.
答案 B
14.某公司员工对户外运动分别持“喜欢”“不喜欢”和“一般”三种态度,其中持“一般”态度的比持“不喜欢”态度的多13人,按分层抽样方法从该公司全体员工中选出部分员工座谈户外运动,如果选出的人有6人对户外运动持“喜欢”态度,有2人对户外运动持“不喜欢”态度,有3人对户外运动持“一般”态度,那么这个公司全体员工中对户外运动持“喜欢”态度的人数有( )
A.26B.39C.78D.13
解析 设持“喜欢”“不喜欢”“一般”态度的人数分别为6x,2x,3x,由题意可得3x-2x=13,x=13,∴持“喜欢”态度的有6x=78(人).
答案 C
15.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数减少1人,在采用系统抽样时,需要在总体中先剔除2个个体,则n=________.
解析 总体容量为6+12+18=36,
当样本容量为n时,由题意知,系统抽样的间隔为
,分层抽样的比例是
,抽取的工程师人数为
×6=
,技术员人数为
×12=
,技工人数为
×18=
,
所以n应是6的倍数,36的约数,即n=6,12,18.
当样本容量为(n-1)时,总体容量剔除以后是34人,系统抽样的间隔为
,因为
必须是整数,
所以n只能取18,即样本容量n=18.
答案 18
16.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为________.
解析 由系统抽样的特点,知抽取号码的间隔为
=30,抽取的号码依次为9,39,69,…,939,落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n项,显然有729=459+(n-1)×30,解得n=10.所以做问卷B的有10人.
答案 10
C级 创新猜想
17.(多填题)一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定:
如果在第1组随机抽取的号码为m,那么在第k组(k≥2)中抽取的号码个位数字与m+k的个位数字相同,若m=8,则k的值为________,在第8组中抽取的号码是________.
解析 由题意知m=8,k=8,则m+k=16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.
答案 8 76