届高考数学二轮复习文数概率与统计专题七 第2讲学案含答案全国通用.docx
《届高考数学二轮复习文数概率与统计专题七 第2讲学案含答案全国通用.docx》由会员分享,可在线阅读,更多相关《届高考数学二轮复习文数概率与统计专题七 第2讲学案含答案全国通用.docx(30页珍藏版)》请在冰豆网上搜索。
届高考数学二轮复习文数概率与统计专题七第2讲学案含答案全国通用
第2讲 统计与统计案例
1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等.
2.在概率与统计的交汇处命题,以解答题中档难度出现.
热点一 抽样方法
1.简单随机抽样特点是从总体中逐个抽取.适用范围:
总体中的个体数较少.
2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:
总体中的个体数较多.
3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:
总体由差异明显的几部分组成.
例1
(1)(2017·山东省实验中学一模)用系统抽样的方法从300名学生中抽取容量为20的样本,将300名学生从1~300编号,按编号顺序平均分组.若第16组应抽出的号码为232,则第一组中抽出的号码是( )
A.5B.6
C.7D.8
答案 C
解析 设第一组中抽出的号码是x,列方程有
x+
×15=232⇒x=7,
即第一组中抽出的号码是7.故选C.
(2)某高级中学高一、高二、高三年级的学生人数分别为600,700,700,为了解不同年级学生的眼睛近视情况,现用分层抽样的方法抽取了容量为100的样本,则高三年级应抽取的学生人数为________.
答案 35
解析 由题意结合抽样比可得,高三年级应抽取的学生人数为100×
=35.
思维升华
(1)随机抽样的各种方法中,每个个体被抽到的概率都是相等的.
(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同.
(3)分层抽样满足:
各层抽取的比例都等于样本容量在总体容量中的比例.
跟踪演练1
(1)(2017·葫芦岛协作体模拟)福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个二位号码中选取,小明利用如图所示的随机数表选取红色球的6个号码,选取方法是从第1行、第9列和第10列的数字开始从左到右依次选取两个数字,则第四个被选中的红色球号码为( )
8147236863931790126986816293506091337585613985
0632359246225410027849821886704805468815192049
A.12B.33
C.06D.16
答案 C
解析 被选中的红色球号码依次为17,12,33,06,所以第四个被选中的红色球号码为06,故选C.
(2)(2017届江西重点中学协作体联考)高三某班有学生36人,现将所有同学随机编号,用系统抽样的方法,抽取一个容量为4的样本,已知5号、23号、32号学生在样本中,则样本中还有一个学生的编号为( )
A.13B.14
C.18D.26
答案 B
解析 ∵高三某班有学生36人,用系统抽样的方法,抽取一个容量为4的样本,
∴样本组距为36÷4=9,则5+9=14,
即样本中还有一个学生的编号为14,故选B.
热点二 用样本估计总体
1.频率分布直方图中横坐标表示组距,纵坐标表示
,频率=组距×
.
2.频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数
利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
例2
(1)(2017·全国Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:
kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
答案 B
解析 因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.
故选B.
(2)某高校调查了200名学生每周的自习时间(单位:
小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图可知,这200名学生中每周的自习时间不足22.5小时的人数是________.
答案 45
解析 阅读频率分布直方图可得,这200名学生中每周的自习时间不足22.5小时的人数是200×(0.02+0.07)×2.5=45.
思维升华
(1)反映样本数据分布的主要方式:
频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的平均数、众数、中位数和方差等.
(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.
跟踪演练2
(1)(2017届江西南昌二模)某人到甲、乙两市各7个小区调查空置房情况,调查得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙市空置房套数的中位数之差为( )
A.4B.3
C.2D.1
答案 B
解析 由茎叶图可以看出甲、乙两市的空置房的套数的中位数分别是79,76,因此其差是79-76=3,故选B.
(2)学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n的值为( )
A.300B.200
C.150D.100
答案 D
解析 根据频率分布直方图的面积和为1,可得[50,60)的频率为P=1-10×(0.01+0.024+0.036)=0.3,
又由P=
=0.3,解得n=100.故选D.
热点三 统计案例
1.线性回归方程
方程
=
x+
称为线性回归方程,其中
=
,
=
-
,(
,
)称为样本点的中心.
2.随机变量
K2=
,其中n=a+b+c+d.
例3
(1)(2017届山西太原三模)已知某产品的广告费用x(单位:
万元)与销售额y(单位:
万元)具有线性相关关系,其统计数据如下表:
x
3
4
5
6
y
25
30
40
45
附:
=
=
,
=
-
.
由上表可得线性回归方程
=
x+
,据此模型预测广告费用为8万元时的销售额是( )
A.59.5万元B.52.5万元
C.56万元D.63.5万元
答案 A
解析 由题意可得
=
=
,
=
=35,
则
=
=
=7,
=
-
=3.5,所以线性回归方程为
=7x+3.5,
据此模型预报广告费用为8万元时的销售额是y=7×8+3.5=59.5(万元).
故选A.
(2)(2017·四川成都九校联考)某学校为了解该校学生对于某项运动的爱好是否与性别有关,通过随机抽查110名学生,得到如下2×2的列联表:
喜欢该项运动
不喜欢该项运动
总计
男
40
20
60
女
20
30
50
总计
60
50
110
由公式K2=
,得K2≈7.82.
附表:
P(K2≥k0)
0.025
0.01
0.005
k0
5.024
6.635
7.879
参照附表,以下结论正确是( )
A.有99.5%以上的把握认为“爱好该项运动与性别有关”
B.有99.5%以上的把握认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
答案 C
解析 由题意知本题所给的观测值K2≈7.82>6.635,
∴这个结论有0.01的机会出错,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.
思维升华
(1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值;回归直线过样本点的中心(
,
),应引起关注.
(2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入公式求解K2即可.
跟踪演练3
(1)(2017·雅安三诊)某小卖部为了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
杯数
24
34
38
64
由表中数据算得线性回归方程
=
x+
中的
=-2,预测当气温为-5℃时,热茶的销售量为( )
A.70B.50
C.60D.80
答案 A
解析 由题意可知
=
=10,
=
=40,
将
=-2及样本点中心(10,40)代入线性回归方程可得
=60,
∴当x=-5时,y=(-2)×(-5)+60=70.
故选A.
(2)(2017·湛江二模)某同学利用课余时间做了一次社交软件使用习惯调查,得到2×2列联表如下:
偏爱微信
偏爱QQ
合计
30岁以下
4
8
12
30岁以上
16
2
18
合计
20
10
30
附表:
P(K2≥k0)
0.01
0.005
0.001
k0
6.635
7.879
10.828
则下列结论正确的是( )
A.在犯错的概率不超过0.005的前提下认为社交软件使用习惯与年龄有关
B.在犯错的概率超过0.005的前提下认为社交软件使用习惯与年龄有关
C.在犯错的概率不超过0.001的前提下认为社交软件使用习惯与年龄有关
D.在犯错的概率超过0.001的前提下认为社交软件使用习惯与年龄有关
答案 A
解析 K2=
=10,由于7.879<10<10.828,可以认为在犯错的概率不超过0.005的前提下认为社交软件使用习惯与年龄有关,故选A.
真题体验
1.(2017·山东改编)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:
件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为__________.
答案 3,5
解析 甲组数据的中位数为65,由甲、乙两组数据的中位数相等得y=5.又甲、乙两组数据的平均值相等,
∴
×(56+65+62+74+70+x)=
×(59+61+67+65+78),∴x=3.
2.(2017·山东改编)为了研究某班学生的脚长x(单位:
厘米)和身高y(单位:
厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其线性回归方程为
=
x+
.已知
xi=225,
yi=1600,
=4.该班某学生的脚长为24,据此估计其身高为________.
答案 166
解析 ∵
xi=225,∴
=
xi=22.5.
∵
yi=1600,∴
=
yi=160.
又
=4,∴
=
-
=160-4×22.5=70.
∴线性回归方程为
=4x+70.
将x=24代入上式,得
=4×2