高中数学第2章统计22总体分布的估计频率分布表频率分布直方图与折线图教学案.docx
《高中数学第2章统计22总体分布的估计频率分布表频率分布直方图与折线图教学案.docx》由会员分享,可在线阅读,更多相关《高中数学第2章统计22总体分布的估计频率分布表频率分布直方图与折线图教学案.docx(18页珍藏版)》请在冰豆网上搜索。
高中数学第2章统计22总体分布的估计频率分布表频率分布直方图与折线图教学案
学习资料汇编
2.2.1&2.2.2 频率分布表 频率分布直方图与折线图
预习课本P53~59,思考并完成以下问题
1.什么叫频率分布表?
2.制作频率分布表的一般步骤是什么?
3.什么叫频率分布直方图?
4.什么叫频率分布折线图?
什么叫总体分布密度曲线?
1.频率分布表
(1)定义:
当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.
(2)我们将整个取值区间的长度称为全距,一般的全距等于数据中最大值与最小值之差;分成的区间的长度称为组距.
(3)绘制频率分布表的步骤:
①求全距,决定组数和组距,组距=
.
②分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.
③登记频数,计算频率,列出频率分布表.
[点睛]
(1)在频率分布表中,除最后一个区间是闭区间,其他区间均为左闭右开区间,这样做的目的是为了不重不漏,避免丢失样本数据.
(2)频率分布表中各组频数之和等于样本容量,各组频率之和等于1.
2.频率分布直方图
(1)定义:
我们用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图.
(2)绘制步骤:
①制作频率分布表.
②建立直角坐标系:
把横轴分成若干段,每一段对应一个组的组距,并标上一些关键点.
③画矩形:
在横轴上,以连结相邻两点的线段为底,以纵轴上
为高作矩形,这样得一系列矩形,就构成了频率分布直方图.
3.频率分布折线图
(1)定义:
把频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.
(2)总体分布密度曲线:
频率折线图的优点是它反映了数据的变化趋势,如果将样本容量取得足够大,分组的组距取得足够小,则相应的频率折线图将趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线.
[点睛]
频率分布折线图反映了数据的变化趋势,可用来对数据进行估计和预测.
1.已知一个容量是40的样本,把它分成六组,第一组到第四组的频数分别是5,6,7,10,第五组的频率是0.2,那么第六组的频数是________,频率是________.
答案:
4 0.1
2.如图是容量为100的样本的频率分布直方图,试根据图形中的数据填空.
(1)样本数据落在范围[6,10)内的频率为________;
(2)样本数据落在范围[10,14)内的频数为________.
答案:
(1)0.32
(2)36
3.对于样本频率分布折线图与总体分布的密度曲线的关系,有下列说法:
①频率分布折线图与总体分布的密度曲线无关;
②频率分布折线图就是总体分布的密度曲线;
③样本容量很大的频率分布折线图就是总体分布的密度曲线;
④如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限趋于总体分布的密度曲线.
其中正确的是________.(填序号)
答案:
④
频率分布表的制作
[典例] 某中学40名男生的体重数据如下(单位:
kg):
61 60 59 59 59 58 58 57 57 57 57 56
56 56 56 56 56 56 55 55 55 55 54 54
54 54 53 53 52 52 52 52 52 51 51 51
50 50 49 48
请根据上述数据列相应的频率分布表.
[解] ①计算全距,61-48=13;
②决定组距和组数,取组距为2,
=
=6.5,
所以共分7组;
③决定分点,使分点比数据多一位小数,并把第一小组分点减小0.5,即分成七组:
[47.5,49.5),[49.5,51.5),[51.5,53.5),[53.5,55.5),[55.5,57.5),[57.5,59.5),[59.5,61.5];
④列出频率分布表,如下:
分组
频数
频率
[47.5,49.5)
2
0.05
[49.5,51.5)
5
0.125
[51.5,53.5)
7
0.175
[53.5,55.5)
8
0.20
[55.5,57.5)
11
0.275
[57.5,59.5)
5
0.125
[59.5,61.5]
2
0.05
合计
40
1.00
(1)在列频率分布表时,全距、组距、组数有如下关系:
①若
为整数,则
=组数.
②若
不为整数,则
的整数部分+1=组数.
(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.
[活学活用]
下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:
cm).
区间
界限
[122,
126)
[126,
130)
[130,
134)
[134,
138)
[138,
142)
人数
5
8
10
22
33
区间
界限
[142,
146)
[146,
150)
[150,
154)
[154,
158]
人数
20
11
6
5
(1)列出样本频率分布表;
(2)估计身高小于134cm的人数占总人数的百分比.
解:
(1)样本频率分布表如下:
分组
频数
频率
[122,126)
5
0.04
[126,130)
8
0.07
[130,134)
10
0.08
[134,138)
22
0.18
[138,142)
33
0.28
[142,146)
20
0.17
[146,150)
11
0.09
[150,154)
6
0.05
[154,158]
5
0.04
合计
120
1
(2)由样本频率分布表可知身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.
频率分布直方图与频率分布折线图的绘制
[典例] 为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组如下:
[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2.
(1)列出频率分布表;
(2)画出频率分布直方图以及频率分布折线图.
[解]
(1)频率分布表如下:
分组
频数
频率
[10.75,10.85)
3
0.03
[10.85,10.95)
9
0.09
[10.95,11.05)
13
0.13
[11.05,11.15)
16
0.16
[11.15,11.25)
26
0.26
[11.25,11.35)
20
0.20
[11.35,11.45)
7
0.07
[11.45,11.55)
4
0.04
[11.55,11.65]
2
0.02
合计
100
1.00
(2)频率分布直方图及频率分布折线图如图.
(1)绘图时,应以横轴表示分组,纵轴表示各组频率与组距的比值,以各个组距为底,以各频率除以组距的商为高,分别画成矩形,便得到频率分布直方图.
(2)顺次连接频率分布直方图中各个矩形的上端的中点,就得到频率分布折线图.
[活学活用]
有一个容量为50的样本,数据的分组及各组的频数如下:
[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5],4.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)根据频率分布直方图估计数据落在[15.5,24.5)的频率约是多少.
解:
(1)频率分布表如下:
分组
频数
频率
[12.5,15.5)
3
0.06
[15.5,18.5)
8
0.16
[18.5,21.5)
9
0.18
[21.5,24.5)
11
0.22
[24.5,27.5)
10
0.20
[27.5,30.5)
5
0.10
[30.5,33.5]
4
0.08
合计
50
1.00
(2)频率分布直方图如图所示:
频率分布直方图的识、读、用
(3)数据落在[15.5,24.5)的频率约为0.16+0.18+0.22=0.56.
[典例] 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第3组的频数为12,请解答下列问题:
(1)本次活动共有多少件作品参加评比?
(2)哪组上交的作品数最多?
有多少件?
(3)经过评比,第4组和第6组分别有10件和2件作品获奖,这两组哪组获奖率较高?
[解]
(1)依题意得第3小组的频率为
=
,
又第3小组频数为12,
故本次活动的参评作品数为
=60(件).
(2)根据频率分布直方图可看出第4组上交的作品数量最多,
共有60×
=18(件).
(3)第4组获奖率是
=
.
第6组上交作品数量为60×
=3(件).
第6组的获奖率为
>
,显然第6组的获奖率较高.
频率分布直方图的性质
(1)图中每个小长方形的面积表示相应各组的频率,即小长方形的面积=组距×
=频率.
(2)在频率分布直方图中,各小长方形的面积的总和等于1.
(3)
=样本容量.
(4)频率分布直方图中,各矩形的面积之比等于频率之比,各矩形的高度之比也等于频率之比.
[活学活用]
从某校参加2016年全国高中数学联赛预赛的600名同学中,等可能抽取若干名同学,将他们的成绩制成频率分布表,下面给出了此表中部分数据.
(1)根据表中已知数据,依次写出在①、②、③处的数值;
(2)补全在区间[70,140]上的频率分布直方图;
(3)若成绩不低于110分的同学能参加决赛,那么可以估计该校大约有多少学生能参加决赛?
分组
频数
频率
[70,80)
0.08
[80,90)
③
[90,100)
0.36
[100,110)
16
0.32
[110,120)
0.08
[120,130)
2
②
[130,140]
0.02
合计
①
解:
(1)样本容量=
=50,
∴①处为50;∴
=0.04,②处为0.04;
③处为1-0.08-0.36-0.32-0.08-0.04-0.02=0.10.
(2)频率分布直方图如图:
(3)成绩不低于110分的同学能参加决赛的频率为
0.08+0.04+0.02=0.14,所以估计该校能参加决赛的人数大约为600×0.14=84.
层级一 学业水平达标
1.已知样本:
12,7,11,12,11,12,10,10,9,8,13,12,10,9,6,11,8,9,8,10,那么样本在[11.5,13.5)上的频率为________.
答案:
0.25
2.一个容量为n的样本分成若干组,已知某组的频数和频率分别是30和0.25,则n=________.
解析:
由题意n=
=120.
答案:
120
3.观察新生婴儿的体重(单位:
g),其频率分布直方图如图所示,则新生婴儿体重在[2700,3000)内的频率为________.
解析:
由图可知当新生婴儿体重在[2700,3000)内时,
=0.001,而组距为300,所以频率为0.001×300=0.3.
答案:
0.3
4.为了了解初中生的身体素质,某地区随机抽取了n名学生进行跳绳测试,根据所得数据画样本的频率分布直方图如图所示,且从左到右第1小组的频数是100,则n=________.
解析:
由图可知,第1小组的频率为25×0.004=0.1,
∴n=
=1000.
答案:
1000
5.鲁老师为了分析一次数学考试的情况,将全班60名学生的数学成绩分为5组,第一组到第三组的频数分别是8,24,22,第四组的频率是0.05,那么落在第五组的频数是多少?
频率是多少?
全校300人中分数在第五组中的约有多少人?
解:
因为第四组的频数为0.05×60=3,所以第五组的频数为60-8-24-22-3=3,频率为
=0.05,全校300人中分数在第五组的约有0.05×300=15(人).
层级二 应试能力达标
1.将容量为100的样本数据,按从小到大的顺序分成8个组,如下表:
组号
1
2
3
4
5
6
7
8
频数
9
14
14
13
12
X
13
10
则第六组的频率为________.
解析:
由9+14+14+13+12+x+13+10=100,得x=15.故第六组的频率为
=0.15.
答案:
0.15
2.为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间对某地居民调查了10000人,并根据所得数据画出样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人做进一步调查,则在[2.5,3)(小时)时间段内应抽出的人数是________.
解析:
抽出的100人中平均每天看电视的时间在[2.5,3)(小时)时间内的频率是0.5×0.5=0.25,所以这10000人中用分层抽样方法抽出100人,在[2.5,3)(小时)时间段内应抽出的人数是100×0.25=25.
答案:
25
3.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积的和的
,且样本容量为160,则中间一组的频数是________.
解析:
频率分布直方图中所有小长方形的面积和等于1,则中间小长方形的面积为
,也就是中间一组的频率是
,中间一组的频数为160×
=32.
答案:
32
4.为提高公众对健康的自我管理能力和科学认识,某调查机构共调查了200人在一天中的睡眠时间.现将数据整理分组,如下表所示.由于操作不慎,表中A,B,C,D四处数据污损,统计员只记得A处的数据比C处的数据大4,由此可知B处的数据为________.
分组(睡眠时间)
频数
频率
[4,5)
8
0.04
[5,6)
52
0.26
[6,7)
A
B
[7,8)
C
D
[8,9)
20
0.10
[9,10]
4
0.02
合计
200
1
解析:
设A处的数据为x,则C处的数据为x-4,
则x+x-4+8+52+20+4=200,x=60,
则B处数据为
=0.30.
答案:
0.30
5.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为________;
(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.
解析:
(1)设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,h=0.04.
(2)志愿者年龄在[25,35)的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)的人数约为0.55×800=440.
答案:
(1)0.04
(2)440
6.某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重(单位:
g)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100g的个数是36,则样本中净重大于或等于98g并且小于104g的产品的个数是________.
解析:
由频率分布直方图可知,产品净重小于100g的频率是0.05×2+0.1×2=0.3,所以样本中产品的个数为
=120,产品净重大于或等于104g的频率为0.075×2=0.15,∴产品净重大于或等于98g而小于104g的频率为1-0.15-0.1=0.75,则净重在此范围内的产品个数为120×0.75=90.
答案:
90
7.为了解某商场某日旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得的数据整理后,画出频率分布直方图(如图所示),已知图中从左到右前三个小组的频率之比为1∶2∶3,第4小组与第5小组的频率分别为0.175和0.075,第二小组的频数为10,则抽取的顾客人数是________.
解析:
由条件可得,第二小组的频率为2×
=0.25,因为第二小组的频数为10,所以抽取的顾客人数是
=40.
答案:
40
8.从某小学随机抽取100名同学,将他们的身高(单位:
cm)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
解析:
∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a=
=0.030.由题意知,身高在[120,130),[130,140),[140,150]的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为
=
,
∴在[140,150]中选取的学生应为3人.
答案:
0.030 3
9.对某电子元件进行寿命追踪统计,情况如下:
寿命/h
[100,200)
[200,300)
[300,400)
[400,500)
[500,600]
个数
20
30
80
40
30
(1)列出频率分布表;
(2)画出频率分布直方图;
(3)估计电子元件寿命在100h~400h以内的比例;
(4)估计电子元件寿命在400h以上的比例.
解:
(1)频率分布表如下:
分组
频数
频率
[100,200)
20
0.10
[200,300)
30
0.15
[300,400)
80
0.40
[400,500)
40
0.20
[500,600]
30
0.15
合计
200
1.00
(2)频率分布直方图如图:
(3)频率为0.1+0.15+0.4=0.65.
所以我们估计电子元件寿命在100h~400h以内的比例为65%.
(4)寿命在400h以上的电子元件的频率为1-0.65=0.35.
所以我们估计电子元件寿命在400h以上的比例为35%.
10.为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:
kg),并将所得数据分组,画出频率分布直方图(如图所示).
(1)求出各组相应的频率;
(2)数据落在[1.15,1.30]中的频率为多少;
(3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中还有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.
解:
(1)由频率分布直方图和频率=组距×
可得下表
分组
频率
[1.00,1.05)
0.05
[1.05,1.10)
0.20
[1.10,1.15)
0.28
[1.15,1.20)
0.30
[1.20,1.25)
0.15
[1.25,1.30]
0.02
(2)因为0.30+0.15+0.02=0.47,
所以数据落在[1.15,1.30]中的频率约为0.47.
(3)由分层抽样中每个个体被抽到的概率相同知:
设水库中鱼的总条数为N,则
=
,即N=2000,故水库中鱼的总条数约为2000条.
敬请批评指正