word完整版高考数学总复习统计与统计案例.docx
《word完整版高考数学总复习统计与统计案例.docx》由会员分享,可在线阅读,更多相关《word完整版高考数学总复习统计与统计案例.docx(20页珍藏版)》请在冰豆网上搜索。
word完整版高考数学总复习统计与统计案例
第三节统计与统计案例
考纲解读
1.理解随机抽样的必要性和重要性。
2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法。
3.了解分布的意义和作用,会列频率分布表,会画出频率分布直方图、频率折线图、茎叶图,理解它们各自的特点。
4.理解样本数据标准差的意义和作用,会计算数据标准差。
5.能从样本的频率分布估计总体分布,会用样本的基本数字牲估计总体的基本数字特征,理解用样本估计总体的思想。
6.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。
7.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系。
8.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
9.了解常见的统计方法,并能应用这些方法解决一些实际问题。
(1)独立性检验
了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用。
(2)回归分析
了解回归分析的基本思想、方法及其简单应用。
命题趋势探究
1.本节内容是高考必考内容,以选择题、填空题为主。
2.命题内容为:
(1)三种抽样(以分层抽样为主);
(2)频率分布表和频率分布直方图的制作、识图及运用。
(1)
(2)有结合趋势,考题难度中下。
3.统计案例为新课标教材新增内容,考查考生解决实际问题的能力。
知识点精讲
一、抽样方法
三种抽样方式的对比,如表13-7所示。
类型
共同点
各自特点
相互关系
使用范围
简单随机抽样
抽样过程都是不放回抽样,每个个体被抽到的机会均等,总体容量N,样本容量n,每个个体被抽到的概率
从总体中随机逐个抽取
总体容量较小
系统抽样
总体均分几段,每段T个,
第一段取a1,
第二段取a1+T,
第三段取a1+2T,
……
第一段简单随机抽样
总体中的个体个数较多
分层抽样
将总体分成n层,每层按比例抽取
每层按简单随机抽样或系统抽样
总体由差异明显的几部分组成
二、样本分析
(1)样本平均值:
。
(2)样本众数:
样本数据中出现次数最多的那个数据。
(3)样本中位数:
将数据按大小排列,位于最中间的数据或中间两个数据的平均数。
(4)样本方差:
。
众数、中位数、平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动情况的特征数。
三、频率分布直方图的解读
(1)频率分布直方图的绘制
①由频率分布表求出每组频数ni;
②求出每组频率(n为样本容量);
③列出样本频率分布表;
④画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标为每组频率与组距比值,各小长方形的面积即为各组频率,各小长方形的面积总和为1。
(2)样本估计总体
步骤:
总体→抽取样本→频率分布表→频率分布直方图→估计总体频率分布。
样本容量越大,估计越精细,样本容量无限增大,频率分布直方图无限无限趋近概率分布密度曲线。
(3)用样本平均数估计总体平均数,用样本标准差估计总体标准差。
公式:
,s2(aX+b)=a2s2(X)。
四、线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法。
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的求法为
其中,,,(,)称为样本点的中心。
步骤:
画散点图,如散点图中的点基本分布在一条直线附近,则这条直线叫这两个变量的回归直线,直线斜率k>0,称两个变量正相关;k<0,称两个变量负相关。
五、独立性
独立性检验是判断两个分类变量是否存在相关关系的案例分析方法。
步骤为列出2´2列联表(如表13-8所示),求出,并判断:
表13-8
A1
A2
合计
B1
a
c
a+c
B2
b
d
b+d
合计
a+b
c+d
n=a+b+c+d
若K2>10.828,有99.9%把握称“A取A1或A2”对“B取B1,B2”有关系;
若10.828K2>6.635,有99%把握称“A取A1或A2”对“B取B1,B2”有关系;
若6.635K2>3.841,有95%把握称“A取A1或A2”对“B取B1,B2”有关系;
若K23.841,没有把握称A与B相关。
题型归纳及思路提示
题型181抽样方式
思路提示
根据所抽取的对象与要求,若抽取的对象中有明显差异,考虑用分层抽样,否则选择简单随机抽样或系统抽样。
当总体中的个体较少时,常采用简单随机抽样;当总体中的个体较多时,常采用系统抽样。
例13.16(2012天津理9)
某地区有小学150所,中学75所,大学25所。
现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调査,应从小学中抽取所学校,中学中抽取所学校。
解析:
本地区共有学校150+75+25=250(所),所以从小学中应抽取(所),从中学中抽取(所)。
变式1(2012山东理4)
采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9。
抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C。
则抽到的人中,做问卷B的人数为()。
A.7B.9C.10D.15
变式2某校共有学生2000名,各年级男、女生人数如表13-9所示,已知在全校学生中任取一名,抽到二年级女生的概率为0.19,现用分层抽样的方法,在全校抽取64名学生,则应在三年级抽取的学生人数为()。
表13-9
一年级
二年级
三年级
女生
373
x
y
男生
377
370
z
变式3某企业三月中旬生产A,B,C三种产品其3000件,根据分层抽样的结果,企业统计员制作了统计表格,如表13-10所示,由于不小心,表格中的A,C产品的有的有关数据被污染看不清楚,统计员记得A产品样本容量比C产品的样本容量多10,由此可得C产品数量为_______。
表13-10
产品类型
A
B
C
产品数量(件)
1300
产品样本数量(件)
130
题型182样本分析——用样本估计总体
思路提示
对样本进行分析并用样本估计总体,包括用样本数字特征估计总体数字特征和用样本的频率分布估计总体的频率分布。
在进行样本分析时,应从统计图表中获取数据。
体现在以下几个方面:
(1)在频率分布直方图中,长方形面积=组距=频率,即随机变量的概率;
(2)对于频数、频率、样本容量,已知其二必可求第三个;(3)随机变量在各组数据内的频数之和为样本容量。
例13.17(2013广东理17)
某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图13-16所示,其中茎为十位数,叶为个位数。
(1)根据茎叶图计算样本均值;
(2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人;
(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率。
分析:
阅读茎叶图得出样本数据,利用平均数公式计算出样本均值。
(2)根据样本算出优秀工人的比例,再估计12人中优秀工人的个数。
(3)用组合数公式求出所有可能的组合的个数和符合条件“恰有1名优秀工人”的组合的个数,利用古典概型概率公式进行计算。
解析:
(1)由茎叶图可知,样本数据为17,19,20,21,25,30,则样本均值,故样本均值为22。
(2)日加工零件个数大于样本均值的工人有2名,故优秀工人的频率为,该车间12名工人中优秀工人大约有(名),故该车间约有4名优秀工人。
(3)记“恰有1名优秀工人”为事件A,其包含的基本事件个数为CC=32,所有基本事件的总数为C=66,由古典概型概率公式,得。
所以恰有1名优秀工人的概率为。
变式1(2012陕西理6)
从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图13-17所示),设甲乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则()。
A.甲<乙,m甲>m乙B.甲<乙,m甲C.甲>乙,m甲>m乙D.甲>乙,m甲变式2某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验。
选取两大块地,每大块地分成n小块地,在总共2n小块地中,随机选n小块地种植品种甲,另外n小块地种植品种乙。
(1)假设n=4,在第一大块地中,种植品种甲的小块地的数目记为X,求X的分布列和数学期望;
(2)试验时每大块地分成8小块,即n=8,试验结束后得到品种甲和品种乙在各小块地上的每公顷产量(单位:
kg/hm2)如表13-11所示。
表13-11
品种甲
403
397
390
404
388
400
412
406
品种乙
419
403
412
418
408
423
400
413
分别求品种甲和品种乙的每公顷产量的样本平均数和样本方差;根据试验结果你认为应该种植哪一品种?
附:
样本数据x1,x2,…,xn的样本方差,其中为样本平均数。
例13.18某次有1000人参加的数学摸底考试,其成绩的频率分布直方图如图13-18所示,规定85分及其以上为优秀。
(1)表13-12所示的是这次考试成绩的频数分布表,求正整数a,b的值;
表13-12
区间
[75,80)
[80,85)
[85,90)
[90,95)
[95,100]
人数
50
a
350
300
b
(2)现在要用分层抽样的方法从这1000人中抽取40人的成绩进行分析,求其中成绩为优秀的学生人数;
(3)在
(2)中抽取的40名学生中,要随机选取2名学生参加座谈会,记“其中成绩为优秀的人数”为X,求X的分布列与数学期望。
0.07
0.06
0.05
0.04
0.03
0.02
0.01
07580859095100分数
图13-18
频率
组距
解析:
(1)由频率分布直方图可知,a=0.451000=200,b=0.0251000=100。
(2)设抽取的40人中成绩为优秀的学生人数为x,则,解得x=30,即其中成绩为优秀的学生人数为30名。
(3)依题意,随机变量X的可能取值为:
0,1,2。
且,,,所以X的分布列为:
X
0
1
2
P
数学期望为。
变式1某班50名同学在一次百米测试中的成绩全部介于13秒和19秒之间,将测试结果按如下方式分成六组:
第一组,成绩大于等于13秒且小于14秒;
第二组,成绩大于等于14秒且小于15秒;
……
第六组,成绩大于等于18且小于19秒。
如图13-19所示是由上述分组方法得到的频率分布直方图,设成绩小于17秒的学生占全班总人数的百分比为x,成绩大小等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为()。
A.0.9,35B.0.9,45C.0.1,35D.0.1,45
变式2(2012安徽理5)
甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图13-20所示,则()。
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
题型183线性