高考数学理科二轮专题复习专题七 第3讲统 计文档格式.docx
《高考数学理科二轮专题复习专题七 第3讲统 计文档格式.docx》由会员分享,可在线阅读,更多相关《高考数学理科二轮专题复习专题七 第3讲统 计文档格式.docx(19页珍藏版)》请在冰豆网上搜索。
[(x1-
)2+(x2-
)2+…+(xn-
)2].
标准差:
s=
热点一 抽样方法
例1
(1)(2013·
陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为________.
(2)某学校共有师生3200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________.
思维启迪
(1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;
(2)分层抽样最重要的是各层的比例.
答案
(1)12
(2)200
解析
(1)由
=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为
=
=12.
(2)本题属于分层抽样,设该学校的教师人数为x,所以
,所以x=200.
思维升华
(1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;
(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;
分层抽样满足:
各层抽取的比例都等于样本容量在总体容量中的比例.
(1)某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取49人做问卷调查,将高一、高二、高三学生依次随机按1,2,3,…,1470编号,若第1组有简单随机抽样方法抽取的号码为23,则高二应抽取的学生人数为________.
(2)(2014·
广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________.
答案
(1)17
(2)200,20
解析
(1)由系统抽样方法,知按编号依次每30个编号作为一组,共分49组,高二学生的编号为496到988,在第17组到第33组内,第17组抽取的编号为16×
30+23=503,为高二学生,第33组抽取的编号为32×
30+23=983,为高二学生,故共抽取高二学生人数为33-16=17.
(2)该地区中、小学生总人数为
3500+2000+4500=10000,
则样本容量为10000×
2%=200,其中抽取的高中生近视人数为2000×
2%×
50%=20.
热点二 用样本估计总体
例2
(1)(2014·
山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:
kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为___________________________________________________________________.
(2)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:
毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是________.
甲
乙
2
0.04
1
3
6
9
0.05
0.06
0.07
4
0.08
7
0.09
思维启迪
(1)根据第一组与第二组的人数和对应频率估计样本总数,然后利用第三组的频率和无疗效人数计算;
(2)直接根据公式计算方差.
答案
(1)12
(2)甲
解析
(1)志愿者的总人数为
=50,
所以第三组人数为50×
0.36=18,
有疗效的人数为18-6=12.
(2)
=(0.042+0.053+0.059+0.061+0.062+0.066+0.071+0.073+0.073+0.084+0.086+0.097)÷
12≈0.0689,
=(0.041+0.042+0.043+0.046+0.059+0.062+0.069+0.079+0.087+0.092+0.094+0.096)÷
12≈0.0675,
[(0.042-0.0689)2+(0.053-0.0689)2+…+(0.097-0.0689)2]≈0.000212.
[(0.041-0.0675)2+(0.042-0.0675)2+…+(0.096-0.0675)2]≈0.000429.
所以甲、乙两地浓度的方差较小的是甲地.
思维升华
(1)反映样本数据分布的主要方式:
频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等.
(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.
(1)某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.
陕西)设样本数据x1,x2,…,x10的均值和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为________.
答案
(1)10
(2)1+a,4
解析
(1)由频率分布直方图可知:
,所以x=10.
=1,yi=xi+a,
所以y1,y2,…,y10的均值为1+a,方差不变仍为4.
热点三 概率与统计的综合应用
例3 某高校组织自主招生考试,共有2000名优秀同学参加笔试,成绩均介于195分到275分之间,从中随机抽取50名同学的成绩进行统计,将统计结果按如下方式分成8组:
第1组[195,205),第2组[205,215),……,第8组[265,275].如图是按上述分组方法得到的频率分布直方图,且笔试成绩在260分(含260分)以上的同学进入面试.
(1)估计所有参加笔试的2000名同学中,参加面试的同学人数;
(2)面试时,每位同学抽取两个问题,若两个问题全答错,则不能取得该校的自主招生资格;
若两个问题均回答正确且笔试成绩在270分以上,则获A类资格;
其他情况下获B类资格.现已知某中学有两人获得面试资格,且仅有一人笔试成绩为270分以上,在回答两个面试问题时,两人对每一个问题正确回答的概率均为
,求恰有一名同学获得该高校B类资格的概率.
思维启迪
(1)据频率分布直方图,先计算成绩在260分以上的同学的概率,再确定面试方面的人数;
(2)列举两名同学的所有答题情况.
解
(1)设第i(i=1,2,…,8)组的频率为fi,则由频率分布直方图知f7=1-(0.004+0.01+0.01+0.02+0.02+0.016+0.008)×
10=0.12.
所以成绩在260分以上的同学的概率P≈
+f8=0.14,2000×
0.14=280,
故这2000名同学中,取得面试资格的约为280人.
(2)不妨设两名同学分别为M、N,且M的笔试成绩在270分以上,则对于M,答题的可能有M11,M10,M01,M00,对于N,答题的可能有N11,N10,N01,N00,其中角标中的1表示正确,0表示错误,如N10表示N同学第一题正确,第二题错误.
将两名同学的答题情况列表如下:
M11
M10
M01
M00
N11
AB
BB
CB
N10
N01
N00
AC
BC
CC
表中AB表示M获A类资格,N获B类资格;
BC表示M获B类资格,N没有获得资格.
所以恰有一名同学获得该高校B类资格的概率为
思维升华 解概率统计的综合问题的关键是从文字语言中提取数学信息,找出概率问题中的基本事件,列举基本事件总数,再利用古典概型的解法求解概率.
某企业为了增强自身竞争力,计划对职工进行技术培训,以提高产品的质量,为了解某车间对技术培训的态度与性别的关系,对该车间所有职工进行了问卷调查得到了如下的列联表:
赞成
不赞成
合计
男职工
22
8
30
女职工
12
20
50
(1)用分层抽样的方法在不赞成的职工中抽5人进行调查,其中男职工、女职工各抽取多少人?
(2)在上述抽取的5人中选2人,求至少有一名男职工的概率.
解
(1)在不赞成的职工中抽5人,
则抽取比例为
,
所以男职工应该抽取8×
=2(人),女职工应该抽取12×
=3(人).
(2)上述抽取的5人中,男职工2人记为a,b,女职工3人记为c,d,e,则从5人中选2人的所有情况为(a,b),(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),(c,d),(c,e),(d,e),共10种情况.
其中至少有一名男职工的情况有(a,b),(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),共7种情况.
故从上述抽取的5人中选2人,至少有一名男职工的概率为P=
1.随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体中的个体数量明显较多时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽样.系统抽样最重要的特征是“等距”,分层抽样最重要的是各层的“比例”.
2.用样本估计总体
(1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为1.
(2)众数、中位数及平均数的异同:
众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;
当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布.
①总体期望的估计,计算样本平均值
xi.②总体方差(标准差)的估计:
方差=
(xi-
)2,标准差=
,方差(标准差)较小者较稳定.
真题感悟
1.(2014·
江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:
cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.
答案 24
解析 底部周长在[80,90)的频率为0.015×
10=0.15,
底部周长在[90,100)的频率为0.025×
10=0.25,
样本容量为60,所以树木的底部周长小于100cm的株数为(0.15+0.25)×
60=24.
2.(2014·
重庆)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:
分)
甲组
乙组
x
5
y
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为________.
答案 5,8
解析 由于甲组中有5个数,比中位数小的有两个数为9,12,比中位数大的也有两个数24,27,所以10+x=15,x=5.又因
=16.8,所以y=8.
押题精练
1.某教育出版社在高三期末考试结束后,从某市参与考试的考生中选取600名学生对在此期间购买教辅资料的情况进行调研,得到如下数据:
购买图
书情况
只买试题类
只买讲解类
试题类和讲解类都买
人数
240
200
160
若该教育出版社计划用分层抽样的方法从这600人中随机抽取60人进行座谈,则只买试题类的学生应抽取的人数为________.
解析 只买试题类的学生应抽取的人数为60×
=24.
2.某地区对某路段公路上行驶的汽车速度实施监控,从中抽取50辆汽车进行测速分析,得到如图所示的时速的频率分布直方图,根据该图,时速在70km/h以下的汽车有________辆.
答案 20
解析 时速在70km/h以下的汽车所占的频率为0.01×
10+0.03×
10=0.4,共有0.4×
50=20(辆).
3.如图是一次选秀节目上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数为85,则a2+b2的最小值是________.
答案 32
解析 方法一 根据题意,得
=5,得a+b=8,则b=8-a,a2+b2=a2+(8-a)2=2a2-16a+64,其中a,b满足0≤a≤9,0≤b≤9,所以0≤a≤9,0≤8-a≤9,即0≤a≤8且a是整数.设函数f(a)=2a2-16a+64,分析知当a=4时,f(a)取得最小值32,所以a2+b2的最小值是32.
方法二 由a+b=8,且a,b≥0,得8≥2
,故ab≤16,则a2+b2=(a+b)2-2ab≥64-32=32,当且仅当a=b=4时等号成立,所以a2+b2的最小值是32.
(推荐时间:
50分钟)
一、填空题
湖南)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则p1,p2,p3的大小关系是________.
答案 p1=p2=p3
解析 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3.
2.某中学高中一年级有400人,高中二年级有320人,高中三年级有280人,现从中抽取一个容量为200人的样本,则高中二年级被抽取的人数为________.
答案 64
解析 由已知,得样本容量为400+320+280=1000,
所以,高中二年级被抽取的人数为
×
320=64.
3.(2013·
江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为________.
7816
6572
0802
6314
0702
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
答案 01
解析 从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:
08,02,14,07,01,所以第5个个体编号为01.
4.为了了解某城市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为120,则抽取的学生人数是_____________________________________________.
答案 480
解析 由频率分布直方图知:
学生的体重在65~75kg的频率为(0.0125+0.0375)×
5=0.25,
则学生的体重在50~65kg的频率为1-0.25=0.75.
从左到右第2个小组的频率为0.75×
=0.25.
所以抽取的学生人数是120÷
0.25=480.
5.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:
学生
1号
2号
3号
4号
5号
甲班
乙班
以上两组数据的方差中较小的一个为s2,则s2=______________________________________
__________________________________.
答案
解析
甲=7,s2甲=
[(6-7)2+(7-7)2+(7-7)2+(8-7)2+(7-7)2]=
乙=7,s
[(6-7)2+(7-7)2+(6-7)2+(7-7)2+(9-7)2]=
所以s
<
s
由两组数据中方差较小的一个为s2,即s2=
6.超速行驶已成为马路上最大杀手之一,已知某路段属于限速路段,规定通过该路段的汽车时速不超过70km/h,否则视为违规.某天,有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图如图所示,则违规的汽车大约有________辆.
答案 110
解析 由题意,知时速超过70km/h的为违规汽车,由频率分布直方图可以得出超过70km/h的频率为0.011×
10=0.11,所以违规的汽车大约有1000×
0.11=110(辆).
7.某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,并用茎叶图表示出了两组数据,对两块地抽取树苗的高度的平均数
甲,
乙和中位数y甲,y乙进行比较,结论是____________________.
甲<
乙,y甲<
y乙
8.从某中学高一年级中随机抽取100名同学,将他们的成绩(单位:
分)数据绘制成频率分布直方图(如图).则这100名学生成绩的平均数、中位数分别为________.
答案 125,124
解析 由图可知(a+a-0.005)×
10=1-(0.010+0.015+0.030)×
10,解得a=0.025,则
=105×
0.1+115×
0.3+125×
0.25+135×
0.2+145×
0.15=125.中位数在120~130之间,设为x,则0.01×
10+0.025×
(x-120)=0.5,解得x=124.
9.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是__________.
答案 1
解析 当x≥4时,
≠91,
∴x<
4,∴
=91,
∴x=1.
10.(2013·
辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.
答案 10
解析 设5个班级中参加的人数分别为x1,x2,x3,x4,x5,则由题意知
=7,
(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=20,
五个整数的平方和为20,则必为0+1+1+9+9=20,
由|x-7|=3可得x=10或x=4.
由|x-7|=1可得x=8或x=6.
由上可知参加的人数分别为4,6,7,8,10,
故最大值为10.
二、解答题
11.为了了解2014年某校高三学生的视力情况,随机抽查了一部分学生的视力,将调查结果分组,分组区间为(3.9,4.2],(4.2,4.5],…,(5.1,5.4].经过数据处理,得到如下频率分布表:
分组
频数
频率
(3.9,4.2]
(4.2,4.5]
0.12
(4.5,4.8]
25
(4.8,5.1]
z
(5.1,5.4]
n
1.00
(1)求频率分布表中未知量n,x,y,z的值;
(2)从样本中视力在(3.9,4.2]和(5.1,5.4]的学生中随机抽取2人,求2人的视力差的绝对值低于0.5的概率.
解
(1)由表,可知样本容量为n,由
=0.04,得n=50.
所以x=
=0.5,y=50-3-6-25-2=14,z=
=0.28.
(2)设样本中视力在(3.9,4.2]的3人为a,b,c,
样本视力在(5.1,5.4]的2人为d,e.
由题意得从5人任取2人的所有基本事件有:
(a,d),(a,e),(b,d),(b,e),(c,d),(c,e),(a,b),(a,c),(b,c),(d,e)共10个.
设事件A表示“抽取的2人视力差的绝对值低于0.5”,则事件A包括4个基本事件.
(a,b),(a,c),(b,c),(d,e).所以P(A)=
故抽取的2人的视力差的绝对值低于0.5的概率为
12.某驾校在招收新学员时,从一批报名者中随机抽取了10名,用对数视力表检查得到每个学员视力状况的茎叶图(小数点前一位的数字为茎,小数点后一位的数字为叶),如图所示.若视力不低于5.0,则称该学员“视力过关”.
(1)若该组数据的平均数为4.82,求其中位数;
(2)若从这10人中随机选取2人,求至少有1人视力过关的概率.
解
(1)由茎叶图,知该组数据的平均数为
=4.82.解得x=9.
所以该组数据的中位数为
=4.85.
(2)记视力不过关的人为1,2,3,4,5,6,视力过关的人为a,b,c,d.则事件的总体结果为
(1,2),(1,3),(1,4),(1,5),(1,6),(1,a),(1,b),(1,c),(1,d),共9种(其中至少一人过关的有4种);
(2,3),(2,4),(2,5),(2,6),(2,a),(2,b),(2,c),(2,d),共8种(其中至少一人过关的有4种);