(2)最常用的简单随机抽样的方法:
抽签法和随机数表法.
2.系统抽样
(1)定义:
将总体平均分成几个部分,然后按照一定的规则,从每个部分中抽取一个个体作为样本,这样的抽样方法称为系统抽样.
(2)假设要从容量为N的总体中抽取容量为n的样本,系统抽样的步骤为:
①采用随机的方式将总体中的N个个体编号.
②将编号按间隔k分段,当
是整数时,取k=
;当
不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N′能被n整除,这时取k=
,并将剩下的总体重新编号;
(3)在第一段中用简单随机抽样确定起始的个体编号l;
(4)按照一定的规则抽取样本,通常将编号为l,l+k,l+2k,…,l+(n-1)k的个体抽出.
3.分层抽样
(1)定义:
一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样,所分成的各个部分称为“层”.
(2)分层抽样的步骤是:
①将总体按一定标准分层;
②计算各层的个体数与总体的个体数的比;
③按各层个体数占总体的个体数的比确定各层应抽取的样本容量;
④在每一层进行抽样(可用简单随机抽样或系统抽样).
(3)分层抽样的应用范围:
当总体由差异明显的几个部分组成时,往往选用分层抽样.
1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)
(1)简单随机抽样中每个个体被抽到的机会不一样,与先后有关.( )
(2)系统抽样在起始部分抽样时采用简单随机抽样.( )
(3)要从1002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( )
(4)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( )
[答案]
(1)×
(2)√ (3)× (4)×
2.(教材改编)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是________.
总体 [从5000名居民某天的阅读时间中抽取200名居民的阅读时间,样本容量是200,抽取的200名居民的阅读时间是一个样本,每名居民的阅读时间就是一个个体,5000名居民的阅读时间的全体是总体.]
3.(2015·广东高考改编)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为________.
25 [根据系统抽样的特点分段间隔为
=25.]
4.(2015·四川高考改编)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是________.
分层抽样法 [根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.]
5.(2017·徐州模拟)某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.
25 [设男生抽取x人,则有
=
,解得x=25.]
简单随机抽样
(1)下列抽取样本的方式不属于简单随机抽样的有________.(填序号)
①盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;
②从20件玩具中一次性抽取3件进行质量检验;
③某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
(2)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为________.
7816
6572
0802
6314
0762
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
(1)①②③
(2)01 [
(1)①②③中都不是简单随机抽样,这是因为:
①是放回抽样,②中是“一次性”抽取,而不是“逐个”抽取,③中“指定个子最高的5名同学”,不存在随机性,不是等可能抽样.
(2)由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01.]
[规律方法] 1.简单随机抽样是从含有N(有限)个个体的总体中,逐个不放回地抽取样本,且每次抽取时总体内的各个个体被抽到的机会都相等.
2.
(1)一个抽样试验能否用抽签法,关键看两点:
一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
(2)随机数法适用于总体中个体数较多的情形.其中随机数表法的操作要点:
编号,选起始数,读数,获取样本.
[变式训练1] 下面的抽样方法是简单随机抽样的为________.
①在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖;
②某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格;
③某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见;
④用抽签方法从10件产品中选取3件进行质量检验.
④ [①,②选项中为系统抽样,③为分层抽样.]
系统抽样及其应用
(1)(2015·湖南高考)在一次马拉松比赛中,35名运动员的成绩(单位:
分钟)的茎叶图如图521所示.
图521
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.
(2)从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为5的样本,若编号为28的产品在样本中,则该样本中产品的最大编号为________.
(1)4
(2)76 [
(1)抽样间隔为35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在4个小组中,每组取1人,共取4人.
(2)由系统抽样知,抽样间隔k=
=16,
因为样本中含编号为28的产品,
则与之相邻的产品编号为12和44.
故所取出的5个编号依次为12,28,44,60,76,即最大编号为76.]
[规律方法] 1.如果总体容量N能被样本容量n整除,则抽样间隔为k=
,否则,可随机地从总体中剔除余数,然后按系统抽样的方法抽样.特别注意,每个个体被抽到的机会均是
.
2.系统抽样中依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.
[变式训练2]
(1)为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是________.
(2)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为________.
【导学号:
62172288】
(1)20
(2)10 [
(1)由系统抽样的原理知抽样的间隔为
=13,故抽取的样本的编号分别为7,7+13,7+13×2,7+13×3,即抽取的编号为7,20,33,46.
(2)抽取号码的间隔为
=30,落入区间[451,750]的“段”数有
=10.
故做问卷B的应有10人.]
分层抽样及应用
(1)(2015·北京高考改编)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师有________人.
类别
人数
老年教师
900
中年教师
1800
青年教师
1600
合计
4300
(2)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为________.
(1)180
(2)100 [
(1)设该样本中的老年教师人数为x,由题意及分层抽样的特点得
=
,故x=180.
(2)法一:
由题意可得
=
,解得n=100.
法二:
由题意,抽样比为
=
,总体容量为3500+1500=5000,故n=5000×
=100.]
[规律方法] 1.分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:
层内样本的差异要小,两层之间的样本差异要大,且互不重叠.
2.为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即ni∶Ni=n∶N.分层抽样的有关计算,转化为按比例列方程或算式求解.
[变式训练3] 甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.【导学号:
62172289】
1800 [由题设,抽样比为
=
.
设甲设备生产的产品为x件,则
=50,∴x=3000.
故乙设备生产的产品总数为4800-3000=1800.]
[思想与方法]
1.三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性.若样本容量为n,总体容量为N,每个个体被抽到的概率是
.
2.系统抽样抽取的个体编号从小到大成等差数列.
3.分层抽样:
适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.
[易错与防范]
1.简单随机抽样中易忽视样本是从总体中逐个抽取,是不放回抽样.
2.系统抽样中,易忽视抽取的样本数也就是分段的段数,当
不是整数时,注意剔除,剔除的个体是随机的.
3.分层抽样中,易忽视每层抽取的个体的比例是相同的.
课时分层训练(五十二)
A组 基础达标
(建议用时:
30分钟)
1.为了了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是________.
按学段分层抽样 [不同的学段在视力状况上有所差异,所以应该按照学段分层抽样.]
2.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射试验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是________.(填序号)【导学号:
62172290】
①5,10,15,20,25;②3,13,23,33,43;③1,2,3,4,5;④2,4,6,16,32.
② [间隔距离为10,故可能编号是3,13,23,33,43.]
3.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=________.
13 [依题意得
=
,故n=13.]
4.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则p1,p2,p3的大小关系为________.
p1=p2=p3 [由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3.]
5.将参加英语口语测试的1000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为________.【导学号:
62172291】
695 [由题意可知,第一组随机抽取的编号a1=15,
分段间隔数k=
=
=20,则抽取的第35个编号为a35=15+(35-1)×20=695.]
6.某防疫站对学生进行身体健康调查,欲采用分层抽样的办法抽取样本.某中学共有学生2000名,抽取了一个容量为200的样本,已知样本中女生比男生少6人,则该校共有女生________人.
970 [由题意可知抽样比为
=
,
设样本中女生有x人,则x+(x+6)=200,
所以x=97,该校共有女生
=970人.]
7.(2017·南京模拟)某大学为了了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.
60 [根据题意,应从一年级本科生中抽取的人数为
×300=60.]
8.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为
,则在整个抽样过程中,每个个体被抽到的概率为________.
[根据题意,
=
,解得n=28.故每个个体被抽到的概率为
=
.]
9.(2017·扬州模拟)用系统抽样法从160名学生中抽取容量为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为123,则第2组中应抽出个体的号码是________.【导学号:
62172292】
11 [由题意可知,系统抽样的组数为20,间隔为8,设第1组抽出的号码为x,则由系统抽样的法则可知,第n组抽出个体的号码应该为x+(n-1)×8,所以第16组应抽出的号码为x+(16-1)×8=123,解得x=3,所以第2组中应抽出个体的号码为3+(2-1)×8=11.]
10.央视春晚直播不到20天的时候,某媒体报道,由六小龄童和郭富城合演的《猴戏》节目被毙,为此,某网站针对“是否支持该节目上春晚”对网民进行调查,得到如下数据:
网民态度
支持
反对
无所谓
人数(单位:
人)
8000
6000
10000
若采用分层抽样的方法从中抽取48人进行座谈,则持“支持”态度的网民抽取的人数为________.
16 [持“支持”态度的网民抽取的人数为48×
=48×
=16.]
11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图522所示,则该校女教师的人数为________人.
图522
137 [初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1-60%)=60,该校女教师的人数为77+60=137.]
12.(2017·泰州期末)某校共有教师200人,男学生800人,女学生600人,现用分层抽样的方法从所有师生中抽取一个容量为n的样本,已知从男学生中抽取的人数为100人,那么n=________.
200 [由分层抽样的特点可知:
=
,即n=200.]
B组 能力提升
(建议用时:
15分钟)
1.(2017·常州期末)某地区有高中学校10所,初中学校30所,小学学校60所,现采用分层抽样的方法从这些学校中抽取20所学校对学生进行体质健康检查,则应抽取初中学校________所.
6 [由分层抽样的特点可知初中学校应抽取20×
=6(所).]
2.某工厂的三个车间在12月份共生产了3600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从第一、二、三车间抽取的产品数分别为a,b,c,且a,b,c均成等差数列,则第二车间生产的产品数为________.
1200 [因为a,b,c成等差数列,
所以2b=a+c,
所以
=b,所以第二车间抽取的产品数占抽样产品总数的
.根据分层抽样的性质,可知第二车间生产的产品数占总数的
,即为
×3600=1200.]
3.(2017·苏州模拟)将参加夏令营的600名学生编号为001,002,…,600,采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300住在第Ⅰ营区,从301到495住在第Ⅱ营区,从496到600住在第Ⅲ营区,三个营区被抽中的人数依次为________.
25,17,8 [由系统抽样的特点知,从号码003开始每间隔
=12人抽出1个,
设抽出的第n个号码为an,则an=3+12(n-1),
由an≤300知n≤25;由an≤495知n≤42,
所以第Ⅰ营区被抽取的人数为25,第Ⅱ营区被抽取的人数为42-25=17,第Ⅲ营区被抽取的人数为50-42=8.]
4.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取________人.
8 [设样本容量为N,则N×
=6,∴N=14,
∴高二年级所抽学生人数为14×
=8.]
5.已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中学学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________,________.
① ②
图523
200 20 [易知,样本容量为(3500+4500+2000)×2%=200.
又样本中高中学生共有2000×2%=40(人).
利用图②知,高中学生的近视率为50%.
因此所抽样本中高中学生的近视人数为40×50%=20(人).]
6.(2017·无锡模拟)一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同,若m=8,则在第8组中抽取的号码是________.
76 [由题意知,m=8,k=8,则m+k=16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.]