届高考数学文科二轮分类突破训练第二篇考点四 考查角度1 统计案例Word文件下载.docx
《届高考数学文科二轮分类突破训练第二篇考点四 考查角度1 统计案例Word文件下载.docx》由会员分享,可在线阅读,更多相关《届高考数学文科二轮分类突破训练第二篇考点四 考查角度1 统计案例Word文件下载.docx(12页珍藏版)》请在冰豆网上搜索。
![届高考数学文科二轮分类突破训练第二篇考点四 考查角度1 统计案例Word文件下载.docx](https://file1.bdocx.com/fileroot1/2022-10/11/015a9e2e-b609-4231-97b2-c5f4aea15e37/015a9e2e-b609-4231-97b2-c5f4aea15e371.gif)
(3)计算质量指标值不低于85的面包所占比例的估计值,再做出判断.
解+析
(1)画图.
(2)质量指标值的样本平均数为
=80×
0.08+90×
0.22+100×
0.37+110×
0.28+120×
0.05=100.
所以这种面包质量指标值的平均数的估计值为100.
(3)质量指标值不低于85的面包所占比例的估计值为0.22+0.37+0.28+0.05=0.92,
由于该估计值大于0.9,故可以认为该食品厂生产的这种面包符合“质量指标值不低于85的面包至少要占全部面包90%的规定”.
方法技巧在频率分布直方图中,小矩形的高表示“频率/组距”,而不是频率;
利用频率分布直方图求平均数时,平均数是频率分布直方图的“重心”,可以估计为频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
分类透析二 线性回归的综合应用
例2某市为了引导居民合理用水,居民生活用水实行二级阶梯式水价计算办法,具体如下:
第一阶梯,每户居民月用水量不超过12吨,价格为4元/吨;
第二阶梯,每户居民月用水量超过12吨,超过部分的价格为8元/吨.为了了解全市居民月用水量的分布情况,通过抽样获得了100户居民的月用水量(单位:
吨),将数据按照[0,2],(2,4],…,(14,16](全市居民月用水量均不超过16吨)分成8组,制成了如图①所示的频率分布直方图.
(1)求频率分布直方图中字母a的值,并求该组的频率.
(2)通过频率分布直方图,估计该市居民每月的用水量的中位数m的值(保留两位小数).
(3)图②是该市居民张某2018年1~6月份的月用水费y(元)与月份x的散点图,其拟合的线性回归方程是=2x+33.若张某2018年1~7月份水费总支出为312元,试估计张某7月份的用水吨数.
分析
(1)根据矩形面积和为1可得结果;
(2)利用m左右面积都是列方程可得结果;
(3)根据回归直线过样本点的中心,算出前六个月平均费用,总费用减去前六个月的费用和即可得结果.
解+析
(1)∵(0.02+0.04+0.08+a+0.13+0.08+0.03+0.02)×
2=1,
∴a=0.10.
故第四组的频率为0.1×
2=0.2.
(2)∵0.02×
2+0.04×
2+0.08×
2+0.10×
2+(m-8)×
0.13=0.5,
∴m=8+≈8.15.
(3)∵==3.5,且=2x+33,
∴=2×
3.5+33=40.
∴张某7月份的用水费用为312-6×
40=72(元),
设张某7月份的用水x吨,
∵12×
4=48<
72,
∴12×
4+(x-12)×
8=72,解得x=15.
则张某7月份用水15吨.
方法技巧
(1)要能够从统计图表中获取数据来解决问题.
(2)若已知回归直线方程,则可以直接将数值代入求得特定要求下的预测值;
若回归直线方程有待定参数,则根据回归直线方程恒过点(,)求参数.
分类透析三 独立性检验的综合应用
例3某校工会对全校教职工在平昌冬季奥运会期间每天收看比赛转播的时间做了一次调查,得到如下频数分布表:
收看时间
(单位:
小时)
[0,1)
[1,2)
[2,3)
[3,4)
[4,5)
[5,6]
收看人数
14
30
16
20
12
(1)若将每天收看比赛转播时间不低于3小时的教职工定义为“体育达人”,否则定义为“非体育达人”,请根据频数分布表补全2×
2列联表:
男
女
合计
体育达人
40
非体育达人
并判断能否有90%的把握认为该校教职工是否为“体育达人”与“性别”有关.
(2)在全校“体育达人”中按性别分层抽样抽取6名,再从这6名“体育达人”中任意选取2名做冬奥会知识讲座.求取出的2名“体育达人”中至少有1名女职工的概率.
附表及公式:
P(K2
≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
附:
K2=(其中n=a+b+c+d为样本容量).
分析
(1)根据表格中的数据,计算K2,对照附表,做出判断;
(2)先利用分层抽样方法抽取6名“体育达人”,并确定其中男女职工人数,再利用概率知识求解即可.
解+析
(1)由题意得下表:
60
70
50
120
k==>
2.706.
所以有90%的把握认为该校教职工是否为“体育达人”与“性别”有关.
(2)由题意知抽取的6名“体育达人”中有4名男职工(记作a,b,c,d),2名女职工(记作m,n),
则从这6名“体育达人”中任意选取2名有ab,ac,ad,am,an,bc,bd,bm,bn,cd,cm,cn,dm,dn,mn,共15种取法,取出的2名“体育达人”中至少有1名女职工有am,an,bm,bn,cm,cn,dm,dn,mn,共9种取法,所以所求概率P==.
方法技巧独立性检验的方法的解题步骤
①构造2×
2列联表;
②计算K2的观测值k;
③查表确定有多大的把握判定两个变量有关联.
1.(2018年全国Ⅲ卷,文18改编)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,一般情况下PM2.5浓度越大,大气环境质量越差.我国PM2.5的标准是:
24小时PM2.5的平均浓度在0~35μg/m3范围内,则空气质量是优,在35~75μg/m3范围内,则空气质量是良好,在75~115μg/m3范围内,则空气质量是轻度污染.在115~150μg/m3范围内,则空气质量是中度污染.甲、乙两座城市2016年底经评估PM2.5的年平均浓度均在80μg/m3左右,空气质量是轻度污染,甲、乙两座城市采取不同的环境综合治理方式,通过各个监测站的大数据汇总得到2017年每个月PM2.5的平均浓度数据如下(单位:
μg/m3).
甲城市:
83,74,55,62,47,65,58,61,56,50,54,46.
乙城市:
82,68,61,65,68,68,71,67,82,70,66,72.
(1)根据以上统计数据判断2017年哪座城市的大气环境质量总体较好?
并说明理由.
(2)求两座城市24个PM2.5的平均浓度的中位数,并将两座城市超过和不超过中位数的月份数填入下面的列联表:
不超过
超过
甲城市
乙城市
(3)根据
(2)中的列联表,能否有99%的把握认为甲、乙两座城市的大气环境质量与该城市综合治理的方式有关?
附:
K2=,
P(K2≥k0)
解+析
(1)甲城市的大气环境质量总体较好.
理由如下:
=×
(83+74+55+62+47+65+58+61+56+50+54+46)==59.25,
(82+68+61+65+68+68+71+67+82+70+66+72)==70,所以<
所以甲城市的大气环境质量总体较好.
(2)把24个数据由小到大排序可得中位数为m==66.5.
列联表如下:
10
2
(3)由于k=≈10.667>
6.635,
所以有99%的把握认为甲、乙两座城市的大气环境质量与他们综合治理的方式有关.
2.(2018年全国Ⅱ卷,文18改编)一只药用昆虫的产卵数y(单位:
个)与一定范围内的温度x(单位:
℃)有关,现收集了该种药用昆虫的6组观测数据如下表所示.
温度x/℃
21
23
24
27
29
32
产卵y/个
6
11
57
77
经计算得=xi=26,=yi=33,(xi-)(yi-)=557,(xi-)2=84,(yi-)2=3930,线性回归模型的残差平方和(yi-)2=236.64,e8.0605≈3167,其中xi,yi分别为观测数据中的温度和产卵数,i=1,2,3,4,5,6.
(1)若用线性回归模型拟合,求y与x的回归方程=bx+a(结果准确到0.1).
(2)若用非线性回归模型拟合求得y与x的回归方程为=0.06e0.2303x,且相关指数R2=0.9522.
①试用
(1)中的回归模型相比,用R2说明哪种模型的拟合效果更好.
②用拟合效果好的模型预测当温度为35℃时,该种药用昆虫的产卵数(结果取整数).
一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线=bx+a的斜率和截距的最小二乘估计分别为b==,a=-b;
R2=1-.
解+析
(1)由题意得,b==≈6.6,
所以a=33-×
26=-139.4,
所以y关于x的线性回归方程为=6.6x-139.4.
(2)①由所给数据求得的线性回归方程为=6.6x-139.4,相关指数为
R2=1-=1-≈0.9398.
因为0.9398<
0.9522,
所以回归方程=0.06e0.2303x比线性回归方程=6.6x-139.4拟合效果更好.
②由①得当温度x=35℃时,=0.06e0.2303×
35=0.06e8.0605≈0.06×
3167≈190(个).
即当温度x=35℃时,该种药用昆虫的产卵数估计为190个.
3.(2018全国Ⅰ卷,文19改编)某超市计划销售某种食品,现邀甲、乙两个商家进场试销5天.两个商家提供的返利方案如下:
甲商家每天固定返利60元,且每卖出一件食品商家再返利2元;
乙商家无固定返利,卖出30件以内(含30件)的食品,每件食品商家返利4元,超出30件的部分每件返利6元.经统计,两个商家的试销情况茎叶图如下:
(1)现从甲商家试销的5天中抽取两天,求这两天的销售量都小于30的概率;
(2)超市拟在甲、乙两个商家中选择一家长期销售,如果仅从日平均返利额的角度考虑,请利用所学的统计学知识为超市做出选择,并说明理由.
解+析
(1)记“抽取的两天销售量都小于30”为事件A,
则5天中抽取两天的情况有(29,28),(29,29),(29,32),
(29,32),(28,29),(28,32),(28,32),(29,32),(29,32),(32,32),共10种,
两天的销售量都小于30的情况有(29,28),(29,29),(28,29),共3种,
所以P(A)=.
(2)依题意,
甲商家的日平均销售量为×
(29+28+29+32+32)=30.
所以甲