答案 D
解析 因为采取简单随机抽样、系统抽样和分层抽样抽取样本时,总体中每个个体被抽中的概率相等.故选D.
(4)(2018·全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.
答案 分层抽样
解析 由于从不同年龄段客户中抽取,故采用分层抽样.
题型 简单随机抽样
1.下列抽样检验中,适合用抽签法的是( )
A.从某厂生产的5000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
D.从某厂生产的5000件产品中抽取10件进行质量检验
答案 B
解析 A,D中总体的个体数较多,不适宜用抽签法,C中,一般甲、乙两厂的产品质量有区别,也不适宜用抽签法.故选B.
2.(2018·河北模拟)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
A.08B.07C.02D.01
答案 D
解析 选出的5个个体的编号依次是08,02,14,07,01.故选D.
3.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的概率为( )
A.B.
C.D.
答案 C
解析 根据题意,=,解得n=28.
故在整个抽样过程中每个个体被抽到的概率为=.
1.简单随机抽样的特点
(1)抽取的个体数较少.
(2)是逐个抽取.(3)是不放回抽取.(4)是等可能抽取.只有四个特点都满足的抽样才是简单随机抽样.
2.抽签法与随机数法的适用情况
(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.
(2)一个抽样试验能否用抽签法,关键看两点:
一是抽签是否方便;二是号签是否易搅匀.
1.下面的抽样方法是简单随机抽样的为( )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见
D.用抽签方法从10件产品中选取3件进行质量检验
答案 D
解析 A,B是系统抽样,C是分层抽样,D是简单随机抽样.
2.某班对期中考试成绩进行分析,利用随机数法从全班64名同学中抽取7人进行分析,先将64名同学按01,02,03,…,64进行编号,然后从所给随机数表第1行第8列的数开始向右读,则选出的7名同学的编号为________.
6301637859'1695556719'9810507175
1286735807'4439523879
3321123429'7864560782'5242074438
1551001342'9966027954
答案 55,56,05,07,17,51,28
解析 从随机数表第1行第8列的数字8开始向右读,选出的7名同学的编号为55,56,05,07,17,51,28.
题型 系统抽样
(2019·徐州模拟)从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为5的一个样本,若编号为42的产品在样本中,则该样本中产品的最小编号为( )
A.8B.10C.12D.16
答案 B
解析 从80件产品中用系统抽样的方法抽取5件,则可将这80件产品分成5组,每组16件,每组抽取1件,而编号为42的产品在第3组,所以第1组所抽取产品的编号为42-16×2=10.故选B.
条件探究1 把举例说明中条件“若编号为42的产品在样本中”改为“已知编号为10,a,42,b,74号在样本中”,求a+b.
解 由举例说明中解析易知编号构成首项为10,公差为16的等差数列,易求得a=26,b=58,故a+b=84.
条件探究2 把举例说明中条件“若编号为42的产品在样本中”改为“抽到产品的编号之和为185”,则抽到的最小编号是多少?
解 利用等差数列前n项和公式S5=5a1+×16=185,得a1=5.
系统抽样的注意点
(1)系统抽样适用的条件是总体容量较大,样本容量也较大.
(2)若不改变抽样规则,则所抽取的号码构成一个等差数列,其首项为第一组所抽取的号码,公差为样本间隔.故问题可转化为等差数列问题解决.
(3)抽样规则改变,应注意每组抽取一个个体这一特性不变.
(4)如果总体容量N不能被样本容量n整除,可随机地从总体中剔除余数,然后再按系统抽样的方法抽样,其中起始编号的确定应用简单随机抽样的方法.
1.(2018·湖北黄冈中学模拟)某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为( )
A.16B.17C.18D.19
答案 C
解析 ∵从1000名学生中抽取一个容量为40的样本,
∴系统抽样的分段间隔为=25.
设第一组随机抽取一个号码为x,
则第18组的抽取编号为x+17×25=443,∴x=18.
2.某校高三年级共有30个班,学校心理咨询室为了了解同学们的心理状况,将每个班编号,依次为1到30,现用系统抽样的方法抽取5个班进行调查,若抽到的编号之和为75,则抽到的最小的编号为________.
答案 3
解析 系统抽样的抽取间隔为=6.
设抽到的最小编号为x,
则x+(6+x)+(12+x)+(18+x)+(24+x)=75,所以x=3.
题型 分层抽样
角度1 求总体容量
1.2016年1月1日我国全面二孩政策实施后,某中学的一个学生社团组织了一项关于生育二孩意愿的调查活动.已知该中学所在的城镇符合二孩政策的已婚女性中,30岁以下的约2400人,30岁至40岁的约3600人,40岁以上的约6000人.为了解不同年龄层的女性对生育二孩的意愿是否存在显著差异,该社团用分层抽样的方法从中抽取了一个容量为N的样本进行调查,已知从30岁至40岁的女性中抽取的人数为60,则N=________.
答案 200
解析 由题意可得=,故N=200.
角度2 求每层中的样本数量
2.(2018·吉林通化模拟)分层抽样是将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,组成一个样本的抽样方法.在《九章算术》第三章“衰分”中有如下问题:
“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱多少衰出之,问各几何?
”其译文为:
今有甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带钱多少的比例进行交税,问三人各应付多少税?
则下列说法错误的是( )
A.甲应付51钱
B.乙应付32钱
C.丙应付16钱
D.三者中甲付的钱最多,丙付的钱最少
答案 B
解析 依题意由分层抽样可知,100÷(560+350+180)=,
则甲应付:
×560=51(钱);
乙应付:
×350=32(钱);
丙应付:
×180=16(钱).
分层抽样问题类型及解题思路
(1)求某层应抽个体数量:
按该层所占总体的比例计算.
(2)已知某层个体数量,求总体容量或反之:
根据分层抽样就是按比例抽样,列比例式进行计算.
(3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比==”.
提醒:
分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取ni=n·(i=1,2,…,k)个个体(其中i是层数,n是抽取的样本容量,Ni是第i层中个体的个数,N是总体容量).
1.(2018·南昌模拟)某校为了解学生学习的情况,采用分层抽样的方法从高一1000人,高二1200人,高三n人中,抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n=( )
A.860B.720C.1020D.1040
答案 D
解析 由已知条件得,抽样比为=,从而=,解得n=1040.
2.某防疫站对学生进行身体健康调查,欲采用分层抽样的办法抽取样本.某中学共有学生2000名,抽取了一个容量为200的样本,已知样本中女生比男生少6人,则该校共有女生( )
A.1030人B.97人C.950人D.970人
答案 D
解析 由题意可知抽样比为=,
设样本中女生有x人,则x+(x+6)=200,
所以x=97,该校共有女生=970人.
第2讲 用样本估计总体
[考纲解读] 1.了解频率分布直方图的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,并体会它们各自的特点.(重点)
2.理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征,并作出合理的解释.
3.会用样本的频率分布估计总体分布,用样本的基本数字特征估计总体的基本数字特征.(难点)
4.会用随机抽样的基本方法和样本估计总体的思想解决实际问题.
[考向预测] 从近三年高考情况来看,本讲是高考中的一个热点.预测2020年将会考查用样本估计总体,主要体现在利用频率分布直方图或茎叶图估计总体,利用样本数字特征估计总体.题型以客观题呈现,试题难度不大,属中、低档题型.频率分布直方图与茎叶图也可能出现于解答题中,与概率等知识综合命题.
1.用样本的频率分布估计总体分布
(1)频率分布:
样本中所有数据(或者数据组)的频数和样本容量的比,就是该数据的频率,所有数据(或者数据组)的频率的分布变化规律叫做频率分布.
(2)作频率分布直方图的步骤:
①求极差,即一组数据中的最大值与最小值的差;②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.
在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.
(3)频率分布折线图和总体密度曲线
①频率分布折线图:
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
②总体密度曲线:
随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线.
(4)茎叶图:
统计中还有一种被用来表示数据的图叫茎叶图,茎是指中间一列数,叶是从茎的旁边生长出来的数.
2.样本的数字特征
(1)众数、中位数、平均数
(2)方差和标准差
方差:
s2=[(x1-)2+(x2-)2+…+(xn-)2],
标准差:
s=.
(3)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
3.各种统计表的优点与不足
1.概念辨析
(1)一组数据的方差越大,说明这组数据的波动越大.( )
(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( )
(3)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越高.( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )
答案
(1)√
(2)√ (3)√ (4)×
2.小题热身
(1)(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:
kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数
答案 B
解析 因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.
(2)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5B.91.5和92
C.91和91.5D.92和92
答案 A
解析 由茎叶图可知,这组数据的中位数是×(91+92)=91.5,平均数是×(87+89+90+91+92+93+94+96)=91.5.
(3)如图所示是一样本的频率分布直方图.若样本容量为100,则样本数据在[15,20]内的频数是( )
A.50
B.40
C.30
D.14
答案 C
解析 因为[15,20]对应的小矩形的面积为1-0.04×5-0.1×5=0.3,所以样本落在[15,20]的频数为0.3×100=30.故选C.
(4)已知一组数据87,89,90,91,93,则该组数据的方差是________.
答案 4
解析 该组数据的平均值为×(87+89+90+91+93)=90,所以该组数据的方差为×[(87-90)2+(89-90)2+(90-90)2+(91-90)2+(93-90)2]=4.
题型 样本数字特征的计算及应用
1.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为165,那么由此求出的平均数与实际平均数的差是( )
A.2.5B.-2C.2D.-2.5
答案 C
解析 将105输入为165,多输入了60,60÷30=2,所以求出的平均数与实际平均数的差是2.
2.(2018·九江二模)已知一组数据x1,x2,…,xn的方差为2,若数据ax1+b,ax2+b,…,axn+b(a>0)的方差为8,则a的值为( )
A.1B.
C.2D.4
答案 C
解析 根据方差的性质可知,a2×2=8,解得a=2.
3.一组数据1,10,5,2,x,2,且2答案 9
解析 根据题意知,该组数据的众数是2,
则中位数是2÷=3,
把这组数据从小到大排列为1,2,2,x,5,10,
则=3,解得x=4,
所以这组数据的平均数为=×(1+2+2+4+5+10)=4,
方差为s2=×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.
条件探究 把举例说明2中的“方差”改为“平均数”,“b”改为“2”,其他条件不变,试求a的值.
解 因为x1,x2,…,xn的平均数是2,所以ax1+2,ax2+2,…,axn+2的平均数是a·2+2=8,解得a=3.
众数、中位数、平均数、方差的意义及常用结论
(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.
(2)方差的简化计算公式:
s2=[(x+x+…+x)-n2]或写成s2=(x+x+…+x)-2,即方差等于原数据平方的平均数减去平均数的平方.
(3)平均数、方差的公式推广
①若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
②数据x1,x2,…,xn的方差为s2.
a.数据x1+a,x2+a,…,xn+a的方差也为s2;
b.数据ax1,ax2,…,axn的方差为a2s2.
1.已知样本数据x1,x2,…,x10,其中x1,x2,x3的平均数为a;x4,x5,x6,…,x10的平均数为b,则样本数据的平均数为( )
A.B.
C.D.
答案 B
解析 依题意可得x1+x2+x3=3a,x4+x5+x6+…+x10=7b,所以样本数据的平均数为
=
==,故选B.
2.已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a,b的取值分别是________.
答案 10.5,10.5
解析 ∵中位数为10.5,∴=10.5,即a+b=21.
∵==10,
∴s2=[(2-10)2+(3-10)2×2+(7-10)2+(a-10)2+(b-10)2+(12-10)2+(13.7-10)2+(18.3-10)2+(20-10)2].
令y=(a-10)2+(b-10)2=2a2-42a+221
=22+,
当a=10.5时,y取最小值,方差s2也取最小值.
∴a=10.5,b=10.5.
题型 茎叶图及其应用
1.(2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:
件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.3,5B.5,5C.3,7D.5,7
答案 A
解析 甲组数据的中位数为65,由甲、乙两组数据的中位数相等得y=5.又甲、乙两组数据的平均值相等,∴×(56+65+62+74+70+x)=×(59+61+67+65+78),∴x=3.故选A.
2.某良种培育基地正在培育一小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:
千克)如下:
品种A:
357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.
品种B:
363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430.
(1)作出数据的茎叶图;
(2)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
解
(1)画出茎叶图如图所示:
(2)通过观察茎叶图可以看出:
①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.
1.茎叶图的画法步骤
第一步:
将每个数据分为茎(高位)和叶(低位)两部分;
第二步:
将最小茎与最大茎之间的数按大小次序排成一列,写在左(右)侧;有两组数据时,写在中间;
第三步:
将各个数据的叶依次写在其茎的右(左)侧.
2.茎叶图的应用
(1)茎叶图的绘制需注意:
①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.
(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.
1.甲、乙两位射击运动员的5次比赛成绩(单位:
环)如茎叶图所示,若两位运动员平均成绩相同,则成绩较稳定(方差较小)的那位运动员成绩的方差为( )
A.2B.4C.6D.8
答案 A
解析 根据茎叶图中的数据知,甲、乙二人的平均成绩相同,即×(87+89+90+91+93)=×(88+89+90+91+90+x),解得x=2,所以平均数为=90;
根