版高中数学第二章统计221用样本的频率分布估计总体的分布一学案新人教B版必修3.docx
《版高中数学第二章统计221用样本的频率分布估计总体的分布一学案新人教B版必修3.docx》由会员分享,可在线阅读,更多相关《版高中数学第二章统计221用样本的频率分布估计总体的分布一学案新人教B版必修3.docx(14页珍藏版)》请在冰豆网上搜索。
版高中数学第二章统计221用样本的频率分布估计总体的分布一学案新人教B版必修3
2.2.1 用样本的频率分布估计总体的分布
(一)
学习目标
1.体会分布的意义和作用.2.学会用频率分布表,画频率分布直方图表示样本数据.3.能通过频率分布表或频率分布直方图对数据做出总体统计.
知识点一 用样本估计总体
思考 还记得我们抽样的初衷吗?
梳理 用样本的____________估计总体的分布.
知识点二 频率分布表与频率分布直方图
思考1 要做频率分布表,需要对原始数据做哪些工作?
思考2 如何决定组数与组距?
思考3 同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?
梳理 一般地,频数指某组中包含的个体数,各组频数和=样本容量;频率=
,各组频率和等于1.
在频率分布直方图中,纵轴表示____________,数据落在各小组内的频率用________________来表示,各小长方形的面积的总和等于____.
类型一 频率分布直方图
例1 关于频率分布直方图,下列说法正确的是( )
A.直方图中小长方形的高表示取某数的频率
B.直方图中小长方形的高表示该组上的个体在样本中出现的频率
C.直方图中小长方形的高表示该组上的个体在样本中出现的频数与组距的比值
D.直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值
反思与感悟 由频率的定义不难得出,各组数据的频率之和为1,因为各组数据的个数之和为样本容量.在列频率分布表时,可以利用这种方法检查是否有数据的丢失.
跟踪训练1 一个容量为20的样本数据,将其分组如下表:
分组
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70]
频数
2
3
4
5
4
2
则样本在区间(-∞,50)上的频率为( )
A.0.5B.0.25
C.0.6D.0.7
类型二 频率分布直方图的绘制
例2 某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:
分):
48 64 52 86 71 48 64 41 86 79
71 68 82 84 68 64 62 68 81 57
90 52 74 73 56 78 47 66 55 64
56 88 69 40 73 97 68 56 67 59
70 52 79 44 55 69 62 58 32 58
根据上面的数据,回答下列问题:
(1)这次测验成绩的最高分和最低分分别是多少?
(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;
(3)分析频率分布直方图,你能得出什么结论?
反思与感悟 组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.
跟踪训练2 一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:
cm):
6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6
5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8
6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5
6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4
6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4
6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6
5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0
5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7
5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0
6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
根据上面的数据列出频率分布表、绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35cm之间的麦穗所占的百分比.
类型三 频率分布表及频率分布直方图的应用
例3 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:
小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:
组号
分组
频数
1
[0,2)
6
2
[2,4)
8
3
[4,6)
17
4
[6,8)
22
5
[8,10)
25
6
[10,12)
12
7
[12,14)
6
8
[14,16)
2
9
[16,18]
2
合计
100
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;
(2)求频率分布直方图中的a,b的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).
反思与感悟 在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.
跟踪训练3 某学校组织学生参加数学测试,某班学生的成绩频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生总人数是( )
A.45B.50
C.55D.60
1.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为( )
A.20B.30C.40D.50
2.已知样本数据:
10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的是( )
A.[5.5,7.5)B.[7.5,9.5)
C.[9.5,11.5)D.[11.5,13.5]
3.如图是将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的优秀(120分及以上为优秀)率为________.
4.根据国家质量监督检验检疫总局发布的《车辆驾驶人员血液、呼气酒精含量阈值与检验》(GB19522~2004)中规定车辆驾驶人员血液酒精含量:
“饮酒驾车”的临界值为20mg/100mL;“醉酒驾车”的临界值为80mg/100mL.某地区交通执法部门统计了5月份的执法记录数据(每个分组包括最小值不包括最大值):
血液酒精含量(单位:
mg/100mL)
0~20
20~40
40~60
60~80
80~100
人数
180
11
5
2
2
根据上述表格,可估计该地区全年“饮酒驾车”发生的频率等于________.
5.暑假期间某班为了增强学生的社会实践能力,把该班学生分成四个小组到一果园帮果农测量果树的产量,某小组来到一片种植苹果的山地,他们随机选取20株作为样本测量每一株的果实产量(单位:
kg),获得的数据按照区间[40,45),[45,50),[50,55),[55,60]进行分组,得到如下频率分布表:
分组
[40,45)
[45,50)
[50,55)
[55,60]
合计
频率
0.3
a
0.1
b
c
已知样本中产量在区间[45,50)内的株数是产量在区间[50,60]内的株数的
倍.
(1)分别求出a,b,c的值;
(2)作出频率分布直方图.
1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.
2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.
3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.
答案精析
问题导学
知识点一
思考 用样本去估计总体,为决策提供依据.
梳理 频率分布
知识点二
思考1 分组,频数累计,计算频数和频率.
思考2 若
为整数,则
=组数.
若
不为整数,则
+1=组数.
注意:
[x]表示不大于x的最大整数.
思考3 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响.
梳理 频率/组距 小长方形的面积 1.
题型探究
类型一
例1 D [注意频率分布直方图和条形图的区别,在直方图中,纵轴(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的小长方形的面积.]
跟踪训练1 D [样本在区间(-∞,50)上的频率为
=
=0.7.]
类型二
例2 解
(1)这次测验成绩的最低分是32分,最高分是97分.
(2)根据题意,列出样本的频率分布表如下:
分组
频数
频率
[30,40)
1
0.02
[40,50)
6
0.12
[50,60)
12
0.24
[60,70)
14
0.28
[70,80)
9
0.18
[80,90)
6
0.12
[90,100]
2
0.04
合计
50
1.00
频率分布直方图如图所示.
(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.
跟踪训练2 解
(1)计算极差:
7.4-4.0=3.4;
(2)决定组距与组数:
若取组距为0.3,因为
≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12;
(3)决定分点:
使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55;
(4)列频率分布表:
分组
频数
频率
[3.95,4.25)
1
0.01
[4.25,4.55)
1
0.01
[4.55,4.85)
2
0.02
[4.85,5.15)
5
0.05
[5.15,5.45)
11
0.11
[5.45,5.75)
15
0.15
[5.75,6.05)
28
0.28
[6.05,6.35)
13
0.13
[6.35,6.65)
11
0.11
[6.65,6.95)
10
0.10
[6.95,7.25)
2
0.02
[7.25,7.55]
1
0.01
合计
100
1.00
(5)绘制频率分布直方图如图.
从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35cm之间的麦穗约占41%.
类型三
例3 解
(1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-
=0.9.
故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.
(2)课外阅读时间落在组[4,6)内的有17人,频率为0.17,所以a=
=
=0.085.课外阅读时间落在组[8,10)内的有25人,频率为0.25,所以b=
=
=0.125.
(3)样本中的100名学生该周课外阅读时间的平均数在第4组.
跟踪训练3 B [结合频率分布直方图,得分低于60分的人数占总人数的频率为20×(0.005+0.01)=0.30,所以总人数为
=50,故选B.]
当堂训练
1.B [样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.]
2.D [列出频率分布表,依次对照就可以找到答案,频率分布表如下:
分组
频数
频率
[5.5,7.5)
2
0.1
[7.5,9.5)
6
0.3
[9.5,11.5)
8
0.4
[11.5,13.5]
4
0.2
合计
20
1.0
从表中可以看出频率为0.2的是[11.5,13.5],故选D.]
3.30%
解析 优秀率为10×(0.0225+0.005+0.0025)=0.3=30%.
4.0.09
解析 5月份“饮酒驾车”发生的频率等于
=0.09.可估计全年“饮酒驾车”发生的频率为0.09.
5.解
(1)易得c=1.0.由题意得
∴a=0.4,b=0.2.
(2)根据频率分布表画出频率分布直方图,如图所示.