新教材人教B版数学必修第二册教师用书第5章 514 用样本估计总体.docx
《新教材人教B版数学必修第二册教师用书第5章 514 用样本估计总体.docx》由会员分享,可在线阅读,更多相关《新教材人教B版数学必修第二册教师用书第5章 514 用样本估计总体.docx(14页珍藏版)》请在冰豆网上搜索。
新教材人教B版数学必修第二册教师用书第5章514用样本估计总体
5.1.4 用样本估计总体
学习目标
核心素养
1.会求样本的平均数、标准差、方差.(重点)
2.理解用样本的数字特征估计总体的数字特征的方法.(重点)
3.会应用相关知识解决实际统计问题.(难点)
1.通过样本数字特征的学习,体现了数据分析的核心素养.
2.借助用样本的数字特征解决实际问题,提升数学运算的核心素养.
1.用样本的数字特征估计总体的数字特征
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.
大数定律可以保证,当样本的容量越来越大时,估计的误差很小的可能性将越来越大.在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
2.用样本的分布估计总体的分布
如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多.特别地,每一组的频率与总体对应的频率相差不会太大.
同数字特征的估计一样,分布的估计一般也有误差.如果总体在每一个分组的频率记为π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,pn,一般来说,
(πi-pi)2=
[(π1-p1)2+(π2-p2)2+…+(πn-pn)2]
不等于零.同样,大数定律可以保证,当样本的容量越来越大时,上式很小的可能性将越来越大.
1.如图是总体密度曲线,下列说法正确的是( )
A.组距越大,频率分布折线图越接近于它
B.样本容量越小,频率分布折线图越接近于它
C.阴影部分的面积代表总体在(a,b)内取值的百分比
D.阴影部分的平均高度代表总体在(a,b)内取值的百分比
C [当样本容量越大,组距越小时,频率分布折线图越接近总体密度曲线,但它永远达不到总体密度曲线.在总体密度曲线中,阴影部分的面积代表总体在(a,b)内取值的百分比.]
2.对于数据3,3,2,3,6,3,10,3,6,3,2,有下列结论:
①这组数据的众数是3;
②这组数据的众数与中位数的数值不相等;
③这组数据的中位数与平均数的数值相等;
④这组数据的平均数与众数的数值相等.
其中正确结论的个数为( )
A.1 B.2 C.3 D.4
A [在这一组数据中,3出现次数最多,有6次,故众数是3;将数据按从小到大顺序排列后,最中间的数据是3,故中位数是3;平均数
=
=4,故只有①正确.]
3.为了解中学300名男生的身高情况,随机抽取若干名男生进行身高测量,将所得数据整理后,画出频数分布直方图(如图).估计该校男生的身高在169.5cm~174.5cm之间的人数有( )
A.12 B.48
C.72D.96
C [根据图形,身高在169.5cm~174.5cm之间的人数的百分比为:
×100%=24%,
∴该校男生的身高在169.5cm~174.5cm之间的人数有300×24%=72(人).故选C.]
4.从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图所示,则甲、乙两组的最高成绩分别是________,________,从图中看,________班的平均成绩较高.
96 92 乙 [由茎叶图可知,甲班的最高分是96,乙班的最高分是92.甲班的成绩集中在60~80之间,乙班成绩集中在70~90之间,故乙班的平均成绩较高.]
用样本对总体进行估计
【例1】 甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:
(1)填写下表:
平均数
方差
中位数
命中9环及以上
甲
7
1.2
1
乙
5.4
3
(2)请从四个不同的角度对这次测试进行分析:
①从平均数和方差结合分析偏离程度;
②从平均数和中位数结合分析谁的成绩好些;
③从平均数和命中9环以上的次数相结合看谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
[解]
(1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10,所以
乙=
(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是
=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:
平均数
方差
中位数
命中9环及以上
甲
7
1.2
7
1
乙
7
5.4
7.5
3
(2)①甲、乙的平均数相同,均为7,但s
<s
,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.
②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好.
③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.
在日常生活中,当面对一组数据时,相比每一个观测值,有时我们更关心的是能反映这组数据特征的一些值,例如上述数据,我们可以从平均数、中位数、百分位数、众数、极差、方差、标准差等角度进行比较.
1.某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:
岁):
甲群:
13,13,14,15,15,15,15,16,17,17;
乙群:
54,3,4,4,5,6,6,6,6,56.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?
其中哪个统计量能较好地反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?
其中哪个统计量能较好地反映乙群市民的年龄特征?
[解]
(1)甲群市民年龄的平均数为
=15(岁),中位数为15岁,众数为15岁.
平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数为
=15(岁),中位数为6岁,众数为6岁.
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.
方差与标准差
【例2】 某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:
甲
127
138
130
137
135
131
乙
133
129
138
134
128
136
求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛.
[解] 设甲、乙二人成绩的平均数分别为
甲、
乙,方差分别为s
、s
.
则
甲=130+
(-3+8+0+7+5+1)
=133,
乙=130+
(3-1+8+4-2+6)
=133,
s
=
[(-6)2+52+(-3)2+42+22+(-2)2]=
,
s
=
[02+(-4)2+52+12+(-5)2+32]=
.
因此,甲、乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应选乙参加竞赛较合适.
极差、方差与标准差的区别与联系,数据的离散程度可以通过极差、方差或标准差来描述.
(1)极差是数据的最大值与最小值的差,它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.
(2)方差或标准差则反映了一组数据围绕平均数波动的大小,为了得到以样本数据的单位表示的波动幅度通常用标准差,即样本方差的算术平方根,是样本数据到平均数的一种平均距离.
2.甲、乙、丙、丁四名射手在选拔赛中所得的平均环数
及其方差s2如下表所示,则选送决赛的最佳人选应是( )
甲
乙
丙
丁
7
8
8
7
s2
6.3
6.3
7
8.7
A.甲 B.乙
C.丙D.丁
B [∵
乙=
丙>
甲=
丁,且s
=s
,故应选择乙进入决赛.]
频率分布直方图与数字特征的综合应用
[探究问题]
1.观察频率分布直方图,能获得样本数据的原始信息吗?
[提示] 把样本数据做成频率分布直方图后就失去了原始数据.
2.给出样本数据的频率分布直方图,可以求出数据的众数,中位数和平均数吗?
[提示] 可以近似求出.
【例3】 统计局就某地居民的月收入(元)情况调查了10000人,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示月收入在[500,1000)内.
(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10000人中用分层抽样的方法抽出100人作进一步分析,则月收入在[2000,2500)内的应抽取多少人?
(2)根据频率分布直方图估计样本数据的中位数;
(3)根据频率分布直方图估计样本数据的平均数.
[思路探究] 结合频率分布直方图求解.
[解]
(1)因为(0.0002+0.0004+0.0003+0.0001)×500=0.5,所以a=
=0.0005,月收入在[2000,2500)内的频率为0.25,所以100人中月收入在[2000,2500)内的人数为0.25×100=25.
(2)因为0.0002×500=0.1,
0.0004×500=0.2.
0.0005×500=0.25.
0.1+0.2+0.25=0.55>0.5,
所以样本数据的中位数是
1500+
=1900(元).
(3)样本平均数为(750×0.0002+1250×0.0004+1750×0.0005+2250×0.0005+2750×0.0003+3250×0.0001)×500=1900(元).
(变结论)本例条件不变.
(1)若再从这10000人中用分层抽样的方法抽出若干人,分析居民收入与幸福指数的关系,已知月收入在[2000,2500)内的抽取了40人.则月收入在[3000,3500]内的该抽多少人?
(2)根据频率分布直方图估计样本数据的众数.
[解]
(1)因为(0.0002+0.0004+0.0003+0.0001)×500=0.5.
所以a=
=0.0005.
故月收入在[2000,2500)内的频率为0.0005×500=0.25.
∴新抽样本容量为
=160(人).
∴月收入在[3000,3500]内的该抽:
160×(0.0001×500)=8(人).
(2)由题图知众数为2000元.
1.利用频率分布直方图求数字特征
(1)众数是最高的矩形的底边的中点;
(2)中位数左右两侧直方图的面积相等;
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.
(教师独具)
1.本节课的重点是方差、标准差的计算,难点是利用频率分布直方法对总体进行估计的应用.
2.学习本节课需要掌握的规律方法
(1)利用样本数据求方差.
(2)利用频率分布直方图求出的众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.
3.本节课的易错点
(1)计算标准差或方差时易将公式记错而致误.
(2)利用频率分布直方图求数字特征时易出现理解错误而致错.
1.思考辨析
(1)在一组样本数据中,众数一定是唯一的.( )
(2)中位数是样本数据中最中间的那个数.( )
(3)方差的值越小,数据的离散程度越小.( )
[答案]
(1)×
(2)× (3)√
2.数据101,98,102,100,99的标准差为( )
A.
B.0
C.1D.2
A [
=
(101+98+102+100+99)=100.
∴s=
=
.]
3.在某市2019年“创建文明城市”知识竞赛中,考评组从中抽取200份试卷进行分析,其分数的频率分布直方图如图所示,则分数在区间[60,70)上的人数大约有________.
80 [根据频率分布直方图,分数在区间[60,70)上的频率为0.04×10=0.4,∴分数在区间[60,70)上的人数为200×0.4=80.]
4.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?
样本容量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
[解]
(1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为
=0.08.
又因为第二小组的频率=
,
所以样本容量=
=
=150.
(2)由频率分布直方图可估计,该校高一年级学生的达标率为:
×100%=88%.