1、2.2.1用样本的频率分布用样本的频率分布估计总体分布(一)估计总体分布(一)莱芜一中莱芜一中 刘少华刘少华1.频数:频数:将样本按照一定的方法分成若干组,将样本按照一定的方法分成若干组,每组内含有这个样本的个体的数目。每组内含有这个样本的个体的数目。2.频率:频率:样本中某个组的频数和样本容量的比。样本中某个组的频数和样本容量的比。简单随机抽样、系统抽样、分层抽样简单随机抽样、系统抽样、分层抽样2.2.通过抽样方法收集数据的目的是什么?通过抽样方法收集数据的目的是什么?从数据中寻找所包含的信息,用样本去估计总体从数据中寻找所包含的信息,用样本去估计总体1.1.随机抽样的三种常用方法随机抽样的
2、三种常用方法:复习旧知复习旧知温故知新温故知新思考:生活中,我们在哪里可以看到大量的数据数据?我国是世界上严重缺水的国家之一,城市缺水问题较为突出,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准定额管理,即确定一个居民月用水量标准a a,用水量不超过,用水量不超过a a的的部分按平价收费,超出部分按平价收费,超出a a的部分按议价收费。的部分按议价收费。如果希望大部分居如果希望大部分居民的日常生活不受影响,那么标准民的日常生活不受影响,那么标准a
3、a定为多少比较合理呢?定为多少比较合理呢?采用抽样调查的方式采用抽样调查的方式获得样本数据获得样本数据分析样本数据来估计分析样本数据来估计全市居民用水量的分布情况全市居民用水量的分布情况20002000年全国主要城市中年全国主要城市中缺水情况排在前缺水情况排在前1010位的城市位的城市问题问题1 1:为了较合理地确定这个为了较合理地确定这个标准,你认为需要做哪些工作?标准,你认为需要做哪些工作?探索新知探索新知 初中我们曾经学过初中我们曾经学过频数分布图频数分布图和和频数分布表频数分布表,这使我们能够清,这使我们能够清楚地知道数据分布在各个小组楚地知道数据分布在各个小组的个数的个数.下面将要学
4、习下面将要学习的的频率分布表频率分布表和和频率分布图频率分布图,则是从各个小组,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律数据在样本容量中所占比例大小的角度,来表示数据分布的规律.它可以使我们看到整个样本数据的它可以使我们看到整个样本数据的频率分布频率分布情况情况.用用图图将它们画出来,或者用紧将它们画出来,或者用紧凑的凑的表格表格改变数据的排列方式改变数据的排列方式.分析数据的一种基本方法是分析数据的一种基本方法是作图作图可以达到两个目的可以达到两个目的:(1)从数据中提取信息(从数据中提取信息(2)利用图形传递信息。)利用图形传递信息。表格表格通过改变数据的构成
5、形式,为我们提供解释数据的新方式。通过改变数据的构成形式,为我们提供解释数据的新方式。3.1 2.5 2.0 2.03.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.
6、9 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.32.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2
7、 1.5 0.5 2.4 2.5 2.6 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2讨论:如何分析数据?根据这些数据你能得出用水量其他信息吗讨论:如何分析数据?根据这些数据你能得出用水量其他信息吗?通过抽样,获得了通过抽样,获得了100100位居民月平均用水量位居民月平均用水量
8、(单位:单位:t)t),如下表:,如下表:我们要对这些数据进行我们要对这些数据进行整理与分析整理与分析收集数据收集数据第一步第一步:求求极差极差(一组数据中的最大值与最小值的差)(一组数据中的最大值与最小值的差)思考思考1 1:上述上述100100个数据中的个数据中的最小最小值和最大值分别是什么值和最大值分别是什么?样本数据的变化范围是什么?样本数据的变化范围是什么?0.2 4.30.2 4.3思考思考2:分成多少组合适呢?分成多少组合适呢?第二步第二步:决定组距组距与组数组数 组距组距:指每组两个端点的距离。:指每组两个端点的距离。组数组数:k=k=极差极差组距,组距,(4.30.2)0.5
9、8.2组数组数=8.2+1=9于是组距为于是组距为0.5,组数为,组数为9如果将上述如果将上述100个数据取组距个数据取组距为为0.5进行分组,那么这些数据进行分组,那么这些数据共分为多少组?共分为多少组?4.3-0.2=4.14.3-0.2=4.1整理数据整理数据若若k为整数,则组数为整数,则组数=k,若若k不为整数,则组数不为整数,则组数=k+1。当样本容量不超过当样本容量不超过100时,时,按数据多少,常分成按数据多少,常分成5-12组。组。第四步:列第四步:列频率分布表频率分布表第三步:将数据第三步:将数据分组分组以组距为以组距为0.50.5将数据分组时,将数据分组时,可以分成以下可以
10、分成以下9 9组:组:0,0.5),0.5,1),0,0.5),0.5,1),4,4.5.,4,4.5.知识探究(一):频率分布表知识探究(一):频率分布表思考思考3:各组数据的取值范围各组数据的取值范围 可以如何设定?可以如何设定?各组均为左闭右开区间左闭右开区间,最后一组是闭区间闭区间思考思考4:如何统计样本如何统计样本数据在各组中的数据在各组中的频数频数?如何计算样本数据在各组中的如何计算样本数据在各组中的频率频率?你能将这些数据用表格反映出来吗你能将这些数据用表格反映出来吗?分组分组频数累计频数累计频数频数频率频率0,0.5)0.5,1)1,1.5)1.5,2)2,2.5)2.5,3)
11、3,3.5)3.5,4)4,4.5合计合计48152225146420.040.080.150.220.250.140.060.041001.000.02频率频率/组距组距0.080.080.160.160.300.300.440.440.500.500.280.280.120.120.080.080.040.04频率分布表频率分布表1.1.分组分组2.2.频数累计(可省)频数累计(可省)3.3.频数频数4.4.频率频率 最后一行是合计最后一行是合计知识探究(一):频率分布表知识探究(一):频率分布表频数的合计为频数的合计为样本容量样本容量频率合计为频率合计为1 1100100位居民月平均用水
12、量的频率分布表位居民月平均用水量的频率分布表5.5.频率频率/组距组距小矩形的面积小矩形的面积组距组距频率频率组距组距频率频率=分组分组频数频数频率频率频率频率/组组距距0,0.5)40.040.080.5,1)80.080.161,1.5)150.150.301.5,2)220.220.442,2.5)250.250.502.5,3)140.140.283,3.5)60.060.123.5,4)40.040.084,4.520.020.04合计合计100用水量用水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234请计算每个小矩形的面积请计
13、算每个小矩形的面积,它代表什么它代表什么?为什么为什么?所有小矩形的面积的和是多少所有小矩形的面积的和是多少?1注意纵坐标是频率/组距为了直观反映样本数据在各组中的分布情况,将频率分布表中的信息用图形表示:知识探究(二):频率分布直方图知识探究(二):频率分布直方图用水量用水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.52341.频率分布直方图,显示了样本数据落在各个小组的比例的大小,图中最高的小矩形说明了什么?2.大部分居民的月均用水量都集中在什么之间?月均用水量在月均用水量在2,2.5)2,2.5)内的居民最多内的居民最多.1,3)1,3
14、)之间之间.根据频率分布直方图,居民月均用水量有什么特点?根据频率分布直方图,居民月均用水量有什么特点?分析数据分析数据(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而且是状的,而且是“单峰单峰”的;的;(2 2)大部分居民的月均用水量集中在一个中间值附近,)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等.如果当地政府希望如果当地政府希望85%85%以上的居民每月的用水量不超出标准以上的居民每月的用水量不超出标准,
15、根据根据频率分布表和频率分布直方图频率分布表和频率分布直方图,你能对制定月用水量提出建议吗你能对制定月用水量提出建议吗?分组分组频数频数频率频率频率频率/组组距距0,0.5)40.040.080.5,1)80.080.161,1.5)150.150.301.5,2)220.220.442,2.5)250.250.502.5,3)140.140.283,3.5)60.060.123.5,4)40.040.084,4.520.020.04合计合计1001用水量用水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234若将标准a定为2.5,则7474
16、%的居民在的居民在2.5t2.5t以下以下若将标准a定为3,则88%88%的居民在的居民在3t3t以下,标准可定为以下,标准可定为3t.3t.同样一组数据,如果同样一组数据,如果组距不同,横轴、纵轴的单位不同,组距不同,横轴、纵轴的单位不同,得到得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,下面给出以时会影响我们对总体的判断,下面给出以0.1和和1为组距重新作出的为组距重新作出的频率分布直方图。频率分布直方图。优点:优点:很容易表示大量数据,非常直观的表明分布形状,很容易表示大量数据,非常直观的表明分布形状,使我们能够看到在分布表中看不清楚的一些数据模式。使我们能够看到在分布表中看不清楚的一些数据模式。缺点:缺点:虽然可以大致估计出总体的分布情况,但是不能保虽然可以大致估计出总体的分布情况,但是不能保留原来的数据信息,在精确度要求较高的情况下不适用留原来的数据信息,在精确度要求较高的情况下不适用。问题问题:你认为频率分布直方图的优缺点是什么?你认为频率分布直方图的优缺点是什么?00.10
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1