高考数学专题六 第1讲.docx
《高考数学专题六 第1讲.docx》由会员分享,可在线阅读,更多相关《高考数学专题六 第1讲.docx(28页珍藏版)》请在冰豆网上搜索。
高考数学专题六第1讲
第1讲 统计与统计案例
高考定位 1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率,回归分析与概率是近年命题的热点,2015年,2016年和2017年在解答题中均有考查.
真题感悟
1.(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:
kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数
解析 刻画评估这种农作物亩产量稳定程度的指标是标准差.
答案 B
2.(2016·全国Ⅲ卷)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是( )
A.各月的平均最低气温都在0℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20℃的月份有5个
解析 根据雷达图可知全年最低气温都在0℃以上,故A正确;一月平均最高气温是6℃左右,平均最低气温2℃左右,七月平均最高气温22℃左右,平均最低气温13℃左右,所以七月的平均温差比一月的平均温差大,B正确;三月和十一月的平均最高气温都是10℃,三月和十一月的平均最高气温基本相同,C正确;平均最高气温高于20℃的有七月和八月,D项不正确.
答案 D
3.(2017·山东卷)为了研究某班学生的脚长x(单位:
厘米)和身高y(单位:
厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为
=
x+
.已知
xi=225,
yi=1600,
=4.该班某学生的脚长为24,据此估计其身高为( )
A.160B.163C.166D.170
解析 由已知得x=22.5,y=160,
∵回归直线方程过样本点中心(x,y),且
=4,
∴160=4×22.5+
,解得
=70.
∴回归直线方程为
=4x+70,当x=24时,
=166.故选C.
答案 C
4.(2017·全国Ⅱ卷)淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:
kg),其频率分布直方图如下:
(1)设两种养殖方法的箱产量相互独立,记A表示事件:
旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg
箱产量≥50kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
附:
K2=
解
(1)记B表示事件“旧养殖法的箱产量低于50kg”,
C表示事件“新养殖法的箱产量不低于50kg”.
由题意知,P(A)=P(BC)=P(B)P(C).
旧养殖法的箱产量低于50kg的频率为
(0.012+0.014+0.024+0.034+0.040)×5=0.62,
故P(B)的估计值为0.62.
新养殖法的箱产量不低于50kg的频率为
(0.068+0.046+0.010+0.008)×5=0.66,
故P(C)的估计值为0.66.
因此,事件A的概率估计值为0.62×0.66=0.4092.
(2)根据箱产量的频率分布直方图得列联表
箱产量<50kg
箱产量≥50kg
旧养殖法
62
38
新养殖法
34
66
K2=
≈15.705.
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
(3)因为新养殖法的箱产量的频率分布直方图中,箱产量低于50kg的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,
箱产量低于55kg的直方图面积为
(0.004+0.020+0.044+0.068)×5=0.68>0.5,
故新养殖法箱产量的中位数的估计值为
50+
≈52.35(kg).
考点整合
1.抽样方法
抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围.
2.统计中的四个数据特征
(1)众数:
在样本数据中,出现次数最多的那个数据.
(2)中位数:
样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
(3)平均数:
样本数据的算术平均数,即
=
(x1+x2+…+xn).
(4)方差与标准差.
s2=
[(x1-
)2+(x2-
)2+…+(xn-
)2],
s=
.
3.直方图的两个结论
(1)小长方形的面积=组距×
=频率.
(2)各小长方形的面积之和等于1.
4.回归分析与独立性检验
(1)回归直线
=
x+
经过样本点的中心点(
,
),若x取某一个值代入回归直线方程
=
x+
中,可求出y的估计值.
(2)独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表是:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
n
则K2=
(其中n=a+b+c+d为样本容量).
热点一 抽样方法
【例1】
(1)(2015·北京卷)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )
类别
人数
老年教师
900
中年教师
1800
青年教师
1600
总计
4300
A.90B.100C.180D.300
(2)(2017·长沙雅礼中学质检)在一次马拉松比赛中,35名运动员的成绩(单位:
分钟)的茎叶图如图所示
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.
解析
(1)设该样本中的老年教师人数为x,由题意及分层抽样的特点得
=
,故x=180.
(2)依题意,可将编号为1~35号的35个数据分成7组,每组有5个数据.
在区间[139,151]上共有20个数据,分在4个小组内,每组抽取1人,共抽取4人.
答案
(1)C
(2)4
探究提高 1.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体容量的比值.
2.在系统抽样的过程中,要注意分段间隔,需要抽取n个个体,样本就需要分成n个组,则分段间隔即为
(N为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.
【训练1】
(1)(2017·郑州模拟)为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( )
A.13B.19C.20D.51
(2)(2017·江苏卷)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.
解析
(1)由系统抽样的原理知,抽样的间隔为52÷4=13,故抽取的样本的编号分别为7,7+13,7+13×2,7+13×3,即7号,20号,33号,46号.
∴样本中还有一位同学的编号为20号.
(2)因为样本容量n=60,样本总体N=200+400+300+100=1000,所以抽取比例为
=
=
.
因此应从丙种型号的产品中抽取300×
=18(件).
答案
(1)C
(2)18
热点二 用样本估计总体
命题角度1 数字特征与茎叶图的应用
【例2-1】(2017·北京东城质检)某班男女生各10名同学最近一周平均每天的锻炼时间(单位:
分钟)用茎叶图记录如下:
假设每名同学最近一周平均每天的锻炼时间是互相独立的.
①男生每天锻炼的时间差别小,女生每天锻炼的时间差别大;
②从平均值分析,男生每天锻炼的时间比女生多;
③男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差;
④从10个男生中任选一人,平均每天的锻炼时间超过65分钟的概率比同样条件下女生锻炼时间超过65分钟的概率大.
其中符合茎叶图所给数据的结论是( )
A.①②③B.②③④C.①②④D.①③④
解析 由茎叶图知,男生每天锻炼时间差别小,女生差别大,①正确.
男生平均每天锻炼时间超过65分钟的概率P1=
=
,女生平均每天锻炼时间超过65分钟的概率P2=
=
,P1>P2,因此④正确.
设男生、女生两组数据的平均数分别为
甲,
乙,标准差分别为s甲,s乙.
易求
甲=65.2,
乙=61.8,知
甲>
乙,②正确.
又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散,
∴s甲
因此符合茎叶图所给数据的结论是①②④.
答案 C
命题角度2 用样本的频率分布估计总体分布
【例2-2】(2016·四川卷)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:
吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
解
(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.
由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.
(2)由
(1)可知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.
(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,
而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85.
所以2.5≤x<3.
由0.3×(x-2.5)=0.85-0.73,解得x=2.9.
所以,估计月用水量标准为2.9吨时,85%的居民