1、专题91 获取数据的基本途径及抽样方法届高考数学一轮复习学霸提分秘籍解析版第九篇 统计专题9.01 获取数据的基本途径及抽样方法【考试要求】1.知道获取数据的基本途径;2.了解总体、样本、样本容量的概念,了解数据的随机性;3.了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法和随机数法;4.了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法.【知识梳理】1.获取数据的基本途径获取数据的基本途径包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等.(1)统计报表是指各级企事业、行政单位按规定的表格形式、内容、时间要求报送程序
2、,自上而下统一布置,提供统计资料的一种统计调查方式.(2)年鉴是以全面、系统、准确地记述上年度事物运动、发展状况为主要内容的资料性工具书.汇辑一年内的重要时事、文献和统计资料,按年度连续出版的工具书.2.总体、样本、样本容量要考察的对象的全体叫做总体,每一个考察对象叫做个体,从总体中被抽取的考察对象的集体叫做总体的一个样本,样本中个体的数目叫做样本容量.3.简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.4.分层抽
3、样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.【微点提醒】1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.2.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.3.统一性是统计报表的基本特点.具体表现为:(1)统计报表的内容和报送的时间是由国家强制规定的,以保证调查资料的统一性.(2)统计报表的指标含义,计算方法、口径是全国统一的.【疑误辨析】1.判断下列结论正误(在括号内打“”或“”
4、)(1)简单随机抽样每个个体被抽到的机会不一样,与先后有关.()(2)统计报表是我国取得国民经济和社会发展情况基本统计资料的一种重要手段.()(3)统计报表既可以越级汇总,也可以层层上报、逐级汇总,以便满足各级管理部门对主管系统和区域统计资料的需要.()(4)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()【答案】(1)(2)(3)(4)【解析】根据统计报表及抽样方法的概念易得。【教材衍化】2.(必修3P100 A1改编)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是()A
5、.总体 B.个体C.样本的容量 D.从总体中抽取的一个样本【答案】A【解析】由题目条件知,5 000名居民的阅读时间的全体是总体;其中每1名居民的阅读时间是个体;从5 000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.3.(必修3P100A2(2)改编)一个公司共有N名员工,下设一些部门,要采用等比例分层抽样的方法从全体员工中抽取样本容量为n的样本,已知某部门有m名员工,那么从该部门抽取的员工人数是_.【答案】【解析】每个个体被抽到的概率是,设这个部门抽取了x个员工,则,x.【真题体验】4.(2019东营月考)为了解高三年级400名学生的身高情
6、况,从中抽取40名学生进行测量,这40名学生的身高是()A.总体的一个样本 B.个体C.总体 D.样本容量【答案】A【解析】根据样本及总体的概念易得。5.(2019天津河东区调研)某公司有员工500人,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为()A.33,34,33 B.25,56,19C.20,40,30 D.30,50,20【答案】B【解析】因为1258095255619,所以抽取人数分别为25,56,19.6.(2018全国卷改编)某公司有大量客户,且不同年龄段客户对其服务
7、的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样,则最合适的抽样方法是_.【答案】分层抽样【解析】因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价.【考点聚焦】考点一总体、样本、样本容量【例1】 为了解普陀区高中二年级学生的身高,有关部门从高二年级中抽200名学生测量他们的身高,然后根据这一部分学生的身高去估计普陀区所有高二学生的平均身高.写出总体、个体、样本和样本容量.【答案】见解析【解析】总体是普陀区高二年级学生每人身高的全体,每名学生的身高是个体;从中抽取的200
8、名学生的每人身高的集体是总体的一个样本,样本容量是200.【规律方法】要考察的对象的全体叫做总体,每一个考察对象叫做个体,抽取的考察对象的集体叫做样本.所有的个体构成了总体,样本取决于总体,样本是总体的一部分,没有个体就没有总体,样本的特征反映了总体的相应特征.【训练1】 为了解我省高考数学考试的情况,抽取2 000名考生的数学试卷进行分析,2 000叫做()A.个体 B.样本C.样本容量 D.总体【答案】C【解析】根据样本及样本容量的概念易得。考点二简单随机抽样及其应用【例2】 (1)下列抽取样本的方式属于简单随机抽样的个数为()从无限多个个体中抽取100个个体作为样本.盒子里共有80个零件
9、,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.从20件玩具中一次性抽取3件进行质量检验.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.A.0 B.1 C.2 D.3(2)总体由编号为01,02,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08 B.07 C.02 D.01【答案】(1)A(2)D【解析】(1)不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;不是简单随机抽样.因为它是
10、有放回抽样;不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取;不是简单随机抽样.因为不是等可能抽样.故选A.(2)从第1行第5列和第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.【规律方法】1.简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.2.简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).【训练2】 假设要考察某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,将
11、800袋牛奶按000,001,799进行编号,若从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是_(下面摘取了随机数表第7行至第9行).【答案】068【解析】由随机数表知,前4个样本的个体编号分别是331,572,455,068.考点三分层抽样及其应用角度1求某层入样的个体数【例31】 (2017江苏卷)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取_件.【答案】18【解析】因为样本容量n60,样本总体N2004003001001 0
12、00,所以抽取比例为.因此应从丙种型号的产品中抽取30018(件).角度2求总体或样本容量【例32】 (1)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n等于()A.12 B.18 C.24 D.36(2)(2019青岛调研)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为_件.【答案】(1)D(2)1 800【解析】(1)根据分层抽样方法知,解得n36.(2)由题设,抽样比为.设甲设
13、备生产的产品为x件,则50,x3 000.故乙设备生产的产品总数为4 8003 0001 800.【规律方法】1.分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.2.进行分层抽样的相关计算时,常用到的两个关系(1);(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.【训练3】 (1)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人).篮球组书画组乐器组高一4530a高二151020学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮
14、球组被抽出12人,则a的值为_.(2)一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画出了如图所示的频率分布直方图,现要从这10 000人中用分层抽样的方法抽取100人作进一步调查,则月收入在2 500,3 000)(元)内应抽取_人.【答案】(1)30(2)25【解析】(1)由分层抽样得,解得a30.(2)由频率分布直方图可得在2 500,3 000)收入段共有10 0000.000 55002 500人,按分层抽样应抽出2 50025人.【反思与感悟】1.统计报表有三个显著优点:来源可靠、回收率高、方式灵活.2.年鉴集辞典、手册、年表、图录、书目、索引、文摘、表谱、
15、统计资料、指南、便览于一身,具有资料权威、反应及时、连续出版、功能齐全的特点.3.两种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这两种抽样方法的客观性和公平性.若样本容量为n,总体容量为N,每个个体被抽到的概率是.4.分层抽样适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样.【易错防范】1.正确分清考察对象是抽取样本的关键,样本容量没有单位.2.简单随机抽样中易忽视样本是从总体中逐个抽取,是不放回抽样.3.分层抽样中,易忽视每层抽取的个体的比例是相同的.【分层训练】【基础巩固题组】(建议用时:35分钟)一、选择题1.为了考察某班
16、学生的身高情况,从中抽取20名学生进行身高测算,下列说法正确的是()A.这个班级的学生是总体B.抽测的20名学生是样本C.抽测的20名学生的身高的全体就是总体D.样本容量是20【答案】D【解析】根据样本、样本容量、总体、总体容量的概念易得。2.下列抽样试验中,适合用抽签法的为()A.从某厂生产的5 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D.从某厂生产的5 000件产品中抽取10件进行质量检验【答案】B【解析】因为A,D中总体的个体数较大,不适合用抽签法;C中甲、乙两厂生
17、产的产品质量可能差别较大,因此未达到搅拌均匀的条件,也不适合用抽签法;B中总体容量和样本容量都较小,且同厂生产的产品可视为搅拌均匀了.3.(一题多解)(2019青岛测试)某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100 B.150 C.200 D.250【答案】A【解析】法一由题意可得,解得n100.法二由题意,抽样比为,总体容量为3 5001 5005 000,故n5 000100.4.总体由编号为01,02,03,49,50的50个个体组成,利用随机数表(以下选取了随机数
18、表中的第1行和第2行)选取5个个体,选取方法是从随机数表第1行的第9列和第10列数字开始由左向右读取,则选出来的第4个个体的编号为()66 67 40 67 14 64 05 71 95 86 11 05 65 09 68 76 83 20 37 9057 16 00 11 66 14 90 84 45 11 75 73 88 05 90 52 83 20 37 90A.05 B.09 C.11 D.20【答案】B【解析】从随机数表第1行的第9列和第10列数字开始由左向右读取,符合条件的数有14,05,11,05,09因为05出现了两次,所以选出来的第4个个体的编号为09.5.我国古代数学名著
19、九章算术有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石 B.169石 C.338石 D.1 365石【答案】B【解析】由随机抽样的含义,该批米内夹谷约为1 534169(石).6.在检测一批相同规格共500 kg航空耐热垫片的品质时,随机抽取了280片,检测到有5片非优质品,则这批垫片中非优质品约为()A.2.8 kg B.8.9 kg C.10 kg D.28 kg【答案】B【解析】由题意,这批垫片中非优质品约为5008.9 kg.7.某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查
20、教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师1 800青年教师1 600合计4 300A.90 B.100 C.180 D.300【答案】C【解析】设该样本中的老年教师人数为x,由题意及分层抽样的特点得,故x180.8.某地区高中分三类,A类学校共有学生2 000人,B类学校共有学生3 000人,C类学校共有学生4 000人,若采取分层抽样的方法抽取900人,则A类学校中的学生甲被抽到的概率为()A. B. C. D.【答案】A【解析】利用分层抽样,每个学生被抽到的概率是相同的,故所求的概率为.二、填空题9.从300名学生(其
21、中男生180人,女生120人)中按性别用分层抽样的方法抽取50人参加比赛,则应该抽取男生人数为_.【答案】30【解析】因为男生与女生的比例为18012032,所以应该抽取男生人数为5030.10.某班的数学老师要对该班一模考试的数学成绩进行分析,利用随机数法抽取样本时,先将该班70名同学按00,01,02,69进行编号,然后从随机数表第9行第9列的数开始向右读,则选出的10个样本中第8个样本的编号是_.(注:以下是随机数表的第8行和第9行)第8行:63 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 79第9行:
22、33 21 12 34 2978 64 56 07 8252 42 07 44 3815 51 00 13 4299 66 02 79 54【答案】38【解析】由随机数表知选出的10个样本依次是29,64,56,07,52,42,44,38,15,51,第8个样本编号是38.11.(2019南京联合体学校调研)为检验某校高一年级学生的身高情况,现采用先分层抽样后简单随机抽样的方法,抽取一个容量为210的样本,已知每个学生被抽到的概率为0.3,且男女生的比是43,则该校高一年级女生的人数是_.【答案】300【解析】抽取的高一年级女生的人数为21090,则该校高一年级女生的人数为900.3300.
23、12.某高中在校学生有2 000人,为了响应“阳光体育运动”的号召,学校开展了跑步和登山比赛活动.每人都参与而且只参与其中一项比赛,各年级参与比赛的人数情况如表:高一年级高二年级高三年级跑步abc登山xyz其中abc235,全校参与登山的人数占总人数的.为了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取_.【答案】36【解析】根据题意可知样本中参与跑步的人数为200120,所以从高二年级参与跑步的学生中应抽取的人数为12036.【能力提升题组】(建议用时:15分钟)13.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、
24、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()A.101 B.808 C.1 212 D.2 012【答案】B【解析】甲社区每个个体被抽到的概率为,样本容量为12212543101,所以四个社区中驾驶员的总人数N808.14.用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是()A., B.,C., D.,【答案】A【解析】在抽样过程中,个体a每一次被抽中的
25、概率是相等的,因为总体容量为10,故个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性均为,故选A.15.某工厂的三个车间在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从第一、二、三车间抽取的产品数分别为a,b,c,且a,b,c构成等差数列,则第二车间生产的产品数为_.【答案】1 200【解析】因为a,b,c成等差数列,所以2bac.所以b.所以第二车间抽取的产品数占抽样产品总数的.根据分层抽样的性质,可知第二车间生产的产品数占总数的,即为3 6001 200.16.已知某居民小区户主人数和户主对户型结构的满意率分别如图1和如图2所示,为了解该小区户主对户型结构的满意程度,用分层抽样的方法抽取20%的户主进行调查,则样本容量和抽取的户主对四居室满意的人数分别为_.【答案】100,8【解析】样本容量为(150250100)20%100,所以抽取的户主对四居室满意的人数为10040%8.
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1