用样本的频率分布估计总体的分布学案.docx
《用样本的频率分布估计总体的分布学案.docx》由会员分享,可在线阅读,更多相关《用样本的频率分布估计总体的分布学案.docx(11页珍藏版)》请在冰豆网上搜索。
用样本的频率分布估计总体的分布学案
用样本的频率分布估计总体的分布学案
学案4用样本的频率分布估计总体的分布
【标导航】
(1)通过实例体会分布的意义和作用.
(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.
(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.
重点:
会列频率分布表,画频率分布直方图、频率折线图和茎叶图.
难点:
能通过样本的频率分布估计总体的分布.【知识导引】
在NBA的2011赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕
甲运动员得分﹕12,1,20,2,31,31,36,36,37,39,44,49,0
乙运动员得分﹕8,13,14,16,23,26,28,38,39,1,31,29,33
请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?
如何根据这些数据作出正确的判断呢?
【自学导拨】
1.频率分布表
当总体很大或不便获得时,可以用样本的频率分布估计总体的频率分布,我们把反映的表格称为频率分布表.
2.绘制频率分布直方图的一般步骤为:
(1)计算,即一组数据中最大值与最小值的差;
(2)决定;
○1组距与组数的确定没有确切的标准,将数据分组时组数应力求合适,以使数据的发布规律能较清楚地呈现出.
○2组数与样本容量有关,一般样本容量越大,分的组数也越多,当样本容量为100时,常分8~12组.
○3组距的选择.组距=,组距的选择力求取整,如果极差不利于分组(不能被组数整除)可适当增大极差,如在左右两端各增加适当的范围(尽量使两端增加的量相同).
(3)决定;
(4)列;一般为四列:
分组、个数累计、频数、频率最后一行是合计,其中频数合计应是,频率合计是
()绘制频率分布直方图.为将频率分布直方图中的结果直观形象的表示出,画图时,应以横轴表示分组,纵轴表示,其相应组距上的频率等于该组上的长方形的面积,即每个,且各小长方形的面积的总和等于..
3.频率分布折线图
连接频率分布直方图中的中点,就得到频率分布折线图.
4.总体密度曲线
随着样本容量的增加,作图时所分的组数也在增加,组距减小,相应的图会越越接近于一条,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.
.茎叶图
当样本数据时,用茎叶图表示数据效果较好,它不但可以便于记录,而且统计图上没有原始数据的损失,所有的数据都可以从茎叶图中得到.
画茎叶图的步骤:
(1)将数据分为“茎”(高位)和“叶”(低位)两部分.
(2)将最小茎和最大茎之间的数按大小次序排成一列.
(3)将数据的“叶”按大小次序写在其茎右(左)侧.
6.几种表示频率分布的方法的优点与不足:
(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.
(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
(3)频率分布折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线.
(4)用茎叶图的优点是原有信息不会被抹掉,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.
【教材导学】
【例1】:
从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高的样本,数据如下(单位:
).试作出该样本的频率分布表.
16816171167170161701217174
16170168169171166164116418
170116618116016016416162
16017016816417417116179163172
18017417319163172167160164169
111681816817611616169162
17718171616911163166163167
1781618170169191163131
16716316418168167161162167168
1611617416167166162161164166
【点拨】:
确定组距与组数是解决“样本中的个体取不同值较多”这类问题的出发点.本题需根据绘制频率分布直方图的步骤完成.
【解析】:
最大值=180,最小值=11,
极差=29,决定分为10组;
则需将全距调整为30,组距为3,既每个小区间的长度为3,组距=全距/组数.
可取区间[10.,180.]
分组频数频率
[10.,13.)40.04
[13.,16.)80.08
[16.,19.)80.08
[19.,162.)110.11
[162.,16.)220.22
[16.,168.)190.19
[168.,171.)140.14
[171.,174.)70.07
[174.,177.)40.04
[177.,180.)30.03
合计1001
频率分布直方图为:
【反思】:
在列频率分布表时,先求极差再分组,注意分组不能太多也不能太少,往往把第1小组的起点稍微减小一点,同时要牢固掌握列频率分布表及绘制频率分布直方图是步骤与方法.
【变式练习一】:
下表给出了某校00名12岁男孩中用随机抽样得出的120人的身高
(单位cm)
(1)列出样本频率分布表﹔
(2)一画出频率分布直方图;
(3)估计身高小于134cm的人数占总人数的百分比..
【例2】:
从全校参加科技知识竞赛的学生试卷中,抽取一个样本,考察竞赛的成绩分布.将样本分成组,绘成频率分布直方图(如图),图中从左到右各小组的小长方形的高的比是1∶3∶6∶4∶2,最后边一组的频数是6.请结合频率分布直方图提供的信息,解答下列问题:
(1)样本的容量是多少?
(2)列出频率分布表;
(3)成绩落在哪个范围内的人数最多?
并求该小组的频数、频率;
(4)估计这次竞赛中,成绩不低于60分的学生占总人数的百分比.【点拨】:
本题主要考察频率分布直方图的应用,考察识图、用图的能力,运用频率分布直方图的知识解答.
【解析】:
(1)由于各组的组距相等,所以各组的频率与各小长方形的高成正比且各组频率的和等于1,那么各组的频率分别为116,316,616,416,216.设该样本容量为n,则6n=216,所以样本容量为n=48.
(2)由以上得频率分布表如下:
成绩频数频率
[0.,60.)3116
[60.,70.)9316
[70.,80.)18616
[80.,90.)12416
[90.,100.)6216
合计481
(3)成绩落在[70.,80.)之间的人数最多,该组的频数和频率分别是18和38.
(4)不低于60分的学生占总人数的百分比约为
1-116×100%≈94%.
【反思】:
(1)频率分布直方图中,,所以各小长方形的面积表示相应各组的频率,各小长方形的面积的总和等于.
(2)样本容量=.
【变式练习二】:
某校为了了解高一年级学生的体能情况,抽调了一部分学生进行一分钟跳绳测试,将测试成绩整理后作出如下统计图,甲同学计算出前两组的频率和是0.12,乙同学计算出跳绳次数不少于100次的同学占96%,丙同学计算出从左至右第二、三、四组的频数比为4:
17:
1,结合统计图回答下列问题:
(1)这次共抽调了多少人?
(2)若跳绳次数不少于130次为优秀,则这次测试成绩的优秀率是多少?
【例3】:
某中学高一
(1)班甲、乙两名同学自高中以每场数学考试成绩如下:
甲的得分:
9,81,7,91,86,89,71,6,76,88,94,110,107;
乙的得分:
83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较.
【点拨】:
用中间的数字表示两位同学得分的十位数和百位数,两边的数字分别表示两人每场数学考试成绩的个位数.
【解析】:
甲、乙两人数学成绩的茎叶图如图所示:
甲乙
从这个茎叶图可以看出,乙同学的得分情况是大致对称的,中位数是99;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是89.因此乙同学发挥比较稳定,总体得分情况比甲同学好.
【反思】:
茎叶图由“茎”和“叶”两部分构成,绘制茎叶图的关键是设计好树茎,通常是以该组数据的高位数值作为树茎,树茎一经确定,树叶就自然地长在相应的树茎上了.
【变式练习三】:
在某电脑杂志的一篇中,每个句子的字数如下:
10,28,31,17,23,27,18,1,26,24,20,19,36,27,14,2,1,22,11,24,27,17.
在某报纸的一篇中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,36,23,36,41,27,13,22,23,18,46,32,22.
(1)将这两组数据用茎叶图表示.
(2)将这两组数据进行比较分析,得到什么结论?
【思悟小结】
(由学生完成)【基础导测】
1.将一个容量为n的样本分成若干组,已知某组的频数和频率分别为40和0.12,则n的值为
(A)640(B)320()240(D)160
2.下面给出4个茎叶图则数据6,23,12,13,27,3,37,38,1可以由图______表示
3.一个容量为32的样本,已知某组样本的频率为0.062,则该组样本的频数为
A2B.4.6D.8
4.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.岁~18岁的男生体重(g),得到频率分布直方图,如图,据图可得这100名学生中体重在[6.,64.)g的学生人数是()(A)20(B)30()40(D)0
.(2010福建)将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2:
3:
4:
6:
4:
1,且前三组数据的频数之和等于27,则n等于.
6.(2010江苏卷)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[,40]中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20.
7.(2010•福州高一检测)甲、乙两个小组各10名学生的英语口语测试成绩如下(单位:
分):
甲组:
7690848681878682883
乙组:
8284889798091897974
用茎叶图表示两个小组的成绩,并判断哪个小组的成绩更整齐一些.
8.观察下面表格:
(1)完成表中的频率分布表;
(2)根据表格,画出频率分布直方图;
(3)估计数据落在[10.9,11.3)范围内的概率约为多少?
分组频数频率
[10.7,10.8)3
[10.8,10.9)9
[10.9,11.0)13
[11.0,11.1)16
[11.1,11.2)26
[11.2,11.3)20
[11.3,11.4)7
[11.4,11.)4
[11.,11.6)2
合计100
【知能提升】
1.对于样本频率分布折线图与总体密度曲线的关系,下列说法正确的是()
A.频率分布折线图与总体密度曲线无关
B.频率分布折线图就是总体密度曲线
.样本容量很大的频率分布折线图就是总体密度曲线
D如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线
2.为了解一片经济林的生长情况,随机测量了其中100
株树木的底部周长(单位:
).根据所得数据画
出样本的频率分布直方图(如右图),那么在这100
株树木中,底部周长小于110的株数是()
A.30B.60.70D.80
3.某班0名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:
第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于1秒;……;第六组,成绩大于等于18秒且小于等于19秒.如图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于1秒且小于17秒的学生人数为,则从频率分布直方图中可分析出x和分别为()
(A)0.9,3(B)0.9,4
()0.1,3(D)0.1,4
4.某商场在国庆黄金周的促销活动中,对10月2日9时至14时的销售额进行统计,其频率分布直方图如图1所示,已知9时至10时的销售额为2.万元,则11时至12时的销售额为
A.6万元B.8万元
.10万元D.12万元
.甲、乙两个班级各随机选出1名同学进行测验,成绩的
茎叶图如图所示.则甲、乙两班的最高成绩分别是______,
______.从图中看______班的平均成绩较高.6.(2010北京理)从某小学随机抽取100名同学,将他们的身高(单位:
厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=.若要从身高在[120,130),[130,140),[140,10]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,10]内的学生中选取的人数应为.
7.从高一学生中抽取0名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:
分):
[40,0),2;[0,60),3;[60,70),10;[70,80),1;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计成绩在[60,90)分的学生比例;
(4)估计成绩在8分以下的学生比例.
8.0辆汽车经过某一段公路的时速记录如图所示:
将其分成7组.
(1)列出样本的频率分布表;
(2)画出频率分布直方图以及频率分布折线图;
(3)根据上述结果,估计汽车时速在哪组的几率最大?
9.在育民中学举行的电脑知识竞赛中,将高一两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.1,0.10,0.0,第二小组的频数是40.
(1)求第二小组的频率,并补全这个频率分布直方图;
(2)求这两个班参赛的学生人数是多少?
(3)这两个班参赛学生的成绩的中位数应落在第几小组内?
(不必说明理由)
【数学探究】
(2010湖北)为了了解一个小水库中养殖的鱼有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:
千克),并将所得数据分组,画出频率分布直方图(如图所示)
(Ⅰ)求出各组相应的频率;
(Ⅱ)估计数据落在[1.1,1.30)中的百分比为多少;
(Ⅲ)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条,请根据这一情况估计该水库中鱼的总条数.