第19讲 用样本估计总体及线性相关关系.docx
《第19讲 用样本估计总体及线性相关关系.docx》由会员分享,可在线阅读,更多相关《第19讲 用样本估计总体及线性相关关系.docx(11页珍藏版)》请在冰豆网上搜索。
第19讲用样本估计总体及线性相关关系
普通高中课程标准实验教科书—数学[人教版]
高三新数学第一轮复习教案(讲座19)—用样本估计总体及线性相关关系
一.课标要求:
1.用样本估计总体
①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点;
②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差;
③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;
④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性;
⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异;
⑥形成对数据处理过程进行初步评价的意识。
2.变量的相关性
①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;
②经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
二.命题走向
“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布。
预测2007年高考对本讲的考察是:
1.以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力;
2.热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
三.要点精讲
1.用样本的数字特征估计总体的数字特征
(1)众数、中位数
在一组数据中出现次数最多的数据叫做这组数据的众数;
将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;
(2)平均数与方差
如果这n个数据是,那么叫做这n个数据平均数;
如果这n个数据是,那么叫做这n个数据方差;同时叫做这n个数据的标准差。
2.频率分布直方图、折线图与茎叶图
样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率。
所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示。
频率分布直方图:
具体做法如下:
(1)求极差(即一组数据中最大值与最小值的差);
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图。
注:
频率分布直方图中小正方形的面积=组距×=频率。
折线图:
连接频率分布直方图中小长方形上端中点,就得到频率分布折线图。
总体密度曲线:
当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。
3.线性回归
回归分析:
对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。
回归直线方程:
设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在某一条直线的附近,就可以认为y对x的回归函数的类型为直线型:
。
其中,。
我们称这个方程为y对x的回归直线方程。
四.典例解析
题型1:
数字特征
例1.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:
(1)在这个问题中,总体、个体、样本和样本容量各是什么?
(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径.
解析:
(1)总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取的20颗手榴弹的杀伤半径;样本容量是20。
(2)在20个数据中,10出现了6次,次数最多,所以众数是10(米)。
20个数据从小到大排列,第10个和第11个数据是最中间的两个数,分别为9(米)和10(米),所以中位数是(9+10)=9.5(米)。
样本平均数(米)
所以,估计这批手榴弹的平均杀伤半径约为9.4米。
点评:
(1)根据总体、个体、样本、样本容量的概念答题.要注意:
总体、个体和样本所说的考察对象是一种数量指标,不能说成考察的对象是手榴弹,而应说是手榴弹的杀伤半径。
(2)读懂表格的意义,利用概念求众数、中位数,用样本平均数估计这批手榴弹的平均杀伤半径.另外在这里要会简便计算有多个重复数据的样本的平均数。
例2.为估计一次性木质筷子的用量,1999年从某县共600家高、中、低档饭店抽取10家作样本,这些饭店每天消耗的一次性筷子盒数分别为:
0.63.72.21.52.8
1.71.22.13.21.0
(1)通过对样本的计算,估计该县1999年消耗了多少盒一次性筷子(每年按350个营业日计算);
(2)2001年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是10个样本饭店,每个饭店平均每天使用一次性筷子2.42盒.求该县2000年、2001年这两年一次性木质筷子用量平均每年增长的百分率(2001年该县饭店数、全年营业天数均与1999年相同);
(3)在
(2)的条件下,若生产一套学生桌椅需木材0.07m3,求该县2001年使用一次性筷子的木材可以生产多少套学生桌椅。
计算中需用的有关数据为:
每盒筷子100双,每双筷子的质量为5g,所用木材的密度为0.5×103kg/m3;
(4)假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去做,简要地用文字表述出来。
解析:
(1)
所以,该县1999年消耗一次性筷子为2×600×350=420000(盒)。
(2)设平均每年增长的百分率为X,则2(1+X)2=2.42,
解得X1=0.1=10%,X2=-2.1(不合题意,舍去)。
所以,平均每年增长的百分率为10%;
(3)可以生产学生桌椅套数为(套)。
(4)先抽取若干个县(或市、州)作样本,再分别从这些县(或市、州)中抽取若干家饭店作样本,统计一次性筷子的用量.
点评:
本题是一道统计综合题,涉及的知识点很多,需要灵活运用各种知识分析解决问题.对于第
(1)小题,可先求得样本平均数,再利用样本估计总体的思想来求得问题的解.对于第
(2)小题,实际是一个增长率问题的应用题,可通过设未知数列方程的方法来解.对于第(3)小题,用到了物理公式m=ρv, 体现了各学科知识之间的联系,让学生触类旁通,在解决实际问题时能综合运用多种知识灵活地解决问题.第(4)小题只要能够运用随机抽样方法,能体会到用样本估计总体的统计思想就可解决,在文字表述上要注意简洁、明了、正确。
题型2:
数字特征的应用
例3.(2002年全国高考天津文科卷(15))甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:
t/hm2)
品种
第1年
第2年
第3年
第4年
第5年
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
其中产量比较稳定的小麦品种是甲。
解析:
甲=(9.8+9.9+10.1+10+10.2)=10.0,乙=(9.4+10.3+10.8+9.7+9.8)=10.0;
s=(9.82+…+10.22)–102=0.02,s=(9.42+…+9.82)–102=0.244>0.02。
点评:
方差与平均数在反映样本的特征上一定要区分开。
例4.(2005江苏7)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:
9.48.49.49.99.69.49.7
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为
(A)9.4,0.484(B)9.4,0.016(C)9.5,0.04(D)9.5,0.016
答案:
D;
解析:
7个数据中去掉一个最高分和一个最低分后,余下的5个数为:
9.4,9.4,9.6,9.4,9.5。
则平均数为:
,即。
方差为:
即,故选D。
点评:
一定要根据实际的题意解决问题,并还原实际情景。
题型3:
频率分布直方图与条形图
例5.为检测,某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,而极品8件,三级品13件,次品14件.
(1)列出样本频率分布表;
(2)画出表示样本频率分布的条形图;
(3)根据上述结果,估计辞呈商品为二极品或三极品的概率约是多少
解析:
(1)样本的频率分布表为
产品
频数
频率
一级晶
5
0.17
二级晶
8
0.27
三级晶
13
0.43
次品
4
0.13
(2)样本频率分布的条形图为:
(3)此种产品为二极品或三极品的概率约为0.27+0.43=0.7。
点评:
条形图中纵坐标一般是频数或频率。
例6.(2006重庆理,6)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:
根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是
(A)20(B)30
(C)40(D)50
答案:
C;
解析:
根据运算的算式:
体重在〔56.5,64.5〕学生的累积频率为2×0.03+2×0.05+2×0.05+2×0.07=0.4,则体重在〔56.5,64.5〕学生的人数为0.4×100=40。
点评:
熟悉频率、频数、组距间的关系式。
例7.某中学对高三年级进行身高统计,测量随机抽取的40名学生的身高,其结果如下(单位:
cm)
分组
[140,145)
[145,150)
[150,155)
[155,160)
[160,165)
[165,170)
[170,175)
[175,180)
合计
人数
1
2
5
9
13
6
3
1
40
(1)列出频率分布表;
(2)画出频率分布直方图;
(3)估计数据落在[150,170]范围内的概率。
解析:
(1)根据题意可列出频率分布表:
分 值
频 数
频 率
[140,145]
1
0.025
[145,150]
2
0.050
[150,155]
5
0.125
[155,160]
9
0.225
[160,165]
13
0.325
[165,170]
6
0.15
[170,175]
3
0.075
[175,180]
1
0.025
合 计
40
1.00
(2)频率分布直方图如下:
(3)数据落在[150,170]范围内的概率约为0.825。
题型4:
茎叶图
例8.观看下面两名选手全垒打数据的茎叶图,对他们的表现进行比较。
1961年扬基队外垒手马利斯打破了鲁斯的一个赛季打出60个全垒打的记录。
下面是扬基队的历年比赛中的鲁斯和马利斯每年击出的全垒打的比较图:
鲁斯马利斯
08
1346
522368
54339
9766114
9445
061
解析:
鲁斯的成绩相对集中,稳定在46左右;马利斯成绩相对发散,成绩稳定在26左右。
题型5:
线性回归方程
例9.由施肥量x与水稻产量y试验数据的关系,画出散点图,并指明相关性。
解析:
散点图为:
通过图象可