用样本的数字特征估计总体的数字特征一.ppt
《用样本的数字特征估计总体的数字特征一.ppt》由会员分享,可在线阅读,更多相关《用样本的数字特征估计总体的数字特征一.ppt(21页珍藏版)》请在冰豆网上搜索。
问题提出问题提出1.1.对一个未知总体,我们已经学过的用样本分布估计总对一个未知总体,我们已经学过的用样本分布估计总体分布的方法有哪些?
体分布的方法有哪些?
2.2.它们各有什么优缺点?
它们各有什么优缺点?
频率分布表和频率分布直方图能够很容易表示大量数频率分布表和频率分布直方图能够很容易表示大量数据,据,非常直观非常直观地表明其分布形状,使我们能够看到许多地表明其分布形状,使我们能够看到许多隐藏在数据后的信息,但是,隐藏在数据后的信息,但是,损失了一些样本数据的信损失了一些样本数据的信息,不能保留原有数据。
息,不能保留原有数据。
茎茎叶叶图由所有样本数据组成,没有损失任何样本信息,图由所有样本数据组成,没有损失任何样本信息,可以在抽样过程中随时记录,但是,只能适用于样本容可以在抽样过程中随时记录,但是,只能适用于样本容量较小时。
量较小时。
2.2.2用样本的数字特征用样本的数字特征估计总体的数字特征
(一)估计总体的数字特征
(一)平均数平均数:
一组数据的算术平均数一组数据的算术平均数,即即x=一一众数、中位数、平均数的概念众数、中位数、平均数的概念中数中数:
将一组数据按:
将一组数据按大小依次大小依次排列,把排列,把处在最处在最中间位置的一个数据中间位置的一个数据(或(或最中间两个最中间两个数据的平均数数据的平均数)叫做这组数据的)叫做这组数据的中位数中位数众数众数:
在一组数据中,出现次数最多:
在一组数据中,出现次数最多的数据叫做这组数据的的数据叫做这组数据的众数众数复习运用复习运用平均数平均数中位数中位数众数众数探究探究11:
众数、中位数和平均数:
众数、中位数和平均数思考思考11:
如何从频率分布直方图中估计众数、中位数、平如何从频率分布直方图中估计众数、中位数、平均数?
均数?
思考思考22:
在城市居民月均用水量样本数据的频率分布直方在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?
由此估计总体的众图中,你认为众数应在哪个小矩形内?
由此估计总体的众数是什么?
数是什么?
月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.511.522.533.544.50.511.522.533.544.5O取最高矩形下端取最高矩形下端中点的横坐标中点的横坐标2.252.25作为众数作为众数.思考思考44:
在城市居民月均用水量样本数据的频率分布直方在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是图中,从左至右各个小矩形的面积分别是0.040.04,0.080.08,0.150.15,0.220.22,0.250.25,0.140.14,0.060.06,0.040.04,0.02.0.02.由此估计由此估计总体的中位数是什么?
总体的中位数是什么?
月月均均用用水水量量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.511.522.533.544.50.511.522.533.544.5OO0.5-0.04-0.08-0.15-0.22=0.010.5-0.04-0.08-0.15-0.22=0.01,设小矩形的宽为,则:
,设小矩形的宽为,则:
0.50.50.010.01,得,得0.020.02,所以中位数是,所以中位数是+0.02+0.022.02.2.02.思考思考3:
3:
在频率分布直方图中在频率分布直方图中,每个小矩形的面积表示什么每个小矩形的面积表示什么?
中位数左右两侧的直方图的面积应有什么关系?
中位数左右两侧的直方图的面积应有什么关系?
思考思考55:
平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”,在下面的,在下面的频率分布直方图中,各个小矩形的重心在哪里?
从直方图频率分布直方图中,各个小矩形的重心在哪里?
从直方图估计总体在各组数据内的平均数分别为多少?
估计总体在各组数据内的平均数分别为多少?
0.250.25,0.750.75,1.251.25,1.751.75,2.252.25,2.752.75,3.253.25,3.753.75,4.25.4.25.月均月均用用水水量量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.511.522.533.544.50.511.522.533.544.5OO样本数据的估计平均数就是将频率分布直方图中样本数据的估计平均数就是将频率分布直方图中每个小矩每个小矩形的面积与形的面积与小矩形底边中点的横坐标小矩形底边中点的横坐标之积相加之积相加.由此估计由此估计总体的平均数就是总体的平均数就是0.250.250.040.04+0.750.750.080.08+1.251.250.150.15+1.751.750.220.22+2.252.250.250.25+2.752.750.140.14+3.253.250.060.06+3.753.750.040.04+4.254.250.020.02=2.02=2.02(tt).思考思考66:
从居民月均用水量样本数据可知,该样本的众数从居民月均用水量样本数据可知,该样本的众数是是2.32.3,中位数是,中位数是2.02.0,平均数是,平均数是1.973,1.973,这与我们从样本频这与我们从样本频率分布直方图得出的结论有偏差率分布直方图得出的结论有偏差,你能解释一下原因吗?
你能解释一下原因吗?
在制作频率分布直方图在制作频率分布直方图“丢失丢失”了一些样本数据,了一些样本数据,得到的是一个估计值,且所得估计值与数据分组有关得到的是一个估计值,且所得估计值与数据分组有关.注注:
在只有样本频率分布直方图的情况下,才可按上述方在只有样本频率分布直方图的情况下,才可按上述方法估计众数、中位数和平均数法估计众数、中位数和平均数,并由此估计总体特征并由此估计总体特征.平均数大于(或小于)中位数,说明样本数据中存在平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值许多较大(或较小)的极端值.这句话具有模糊性甚至蒙骗性,其中收入水平是员工这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数工资的某个中心点,它可以是众数、中位数或平均数.样本数据的样本数据的平均数大于(或小平均数大于(或小于)中位数于)中位数说明什么问题?
说明什么问题?
思考思考77:
一组数据的中位数一般不受少数几个极端值的影一组数据的中位数一般不受少数几个极端值的影响,在某些情况下是一个优点,但它对极端值的不敏感有响,在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点时也会成为缺点,你能理解下例中你能理解下例中“我们单位的收入水平比我们单位的收入水平比别的单位高别的单位高”这句话的含义?
这句话的含义?
11、众数体现了样本数据的最、众数体现了样本数据的最大集中点,但它对其它数据信息的大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。
忽视使得无法客观地反映总体特征。
如上例中众数是如上例中众数是2.25t,2.25t,它告诉它告诉我们,月均用水量为我们,月均用水量为2.25t2.25t的居民数的居民数比月均用水量为其它数值的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少。
多,但它并没有告诉我们多多少。
二、三种数字特征的优缺点:
二、三种数字特征的优缺点:
22、中位数是样本数据所占频率的、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。
的不敏感有时也会成为缺点。
如上例中假设有某一用户月均用水如上例中假设有某一用户月均用水量为量为1000t1000t,那么它所占频率为,那么它所占频率为0.01,0.01,几几乎不影响中位数乎不影响中位数,但显然这一极端值是但显然这一极端值是不能忽视的。
不能忽视的。
33、由于平均数与每一个样本的、由于平均数与每一个样本的数据有关,所以任何一个样本数据的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众改变都会引起平均数的改变,这是众数、中位数都不具有的性质。
数、中位数都不具有的性质。
与众数、中位数比较起来,平均数可与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。
使平均数在估计时可靠性降低。
三种数字特征的三种数字特征的优缺点缺点特征数特征数优优点点缺缺点点众数众数体现了样本数据的最大体现了样本数据的最大集中点集中点无法客观反映总体无法客观反映总体特征特征中位数中位数不受少数极端值的影响不受少数极端值的影响不受少数极端值的不受少数极端值的影响有时也是缺点影响有时也是缺点平均数平均数与每一个数据有关,更与每一个数据有关,更能反映全体的信息能反映全体的信息.受少数极端值的影受少数极端值的影响较大,使其在估响较大,使其在估计总体时的可靠性计总体时的可靠性降低降低.生活决策中的应用生活决策中的应用:
体育体育文艺比赛中文艺比赛中,使用的是平均分使用的是平均分.同时去掉一个最高分和最低分同时去掉一个最高分和最低分,从而降从而降低误差低误差,保证公平保证公平练习(课本第练习(课本第7474页)页)答:
应该采用平均数来表示每一个国家项目答:
应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息。
但的平均金额,因为它能反映所有项目的信息。
但平均数会受到极端数据平均数会受到极端数据22002200万元的影响,所以大万元的影响,所以大多数项目投资金额都和平均数相差比较大。
多数项目投资金额都和平均数相差比较大。
三三、众数、中位数、平均数的简单应用众数、中位数、平均数的简单应用例例1某工厂人员及工资构成如下:
某工厂人员及工资构成如下:
人员人员经理经理管理人员管理人员高级技工高级技工工人工人学徒学徒合计合计周工资周工资2200250220200100人数人数16510123合计合计22001500110020001006900
(1)指出这个问题中周工资的众数、中)指出这个问题中周工资的众数、中位数、平均数位数、平均数
(2)这个问题中,工资的平均数能客观)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?
为什么?
地反映该厂的工资水平吗?
为什么?
分析分析:
众数为:
众数为200,中位数为,中位数为220,平均数为,平均数为300。
因平均数为因平均数为300,由表格中所列出的数据,由表格中所列出的数据可见,只有经理在平均数以上,其余的人可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。
实地反映该工厂的工资水平。
练习练习:
”八八.一一”前夕前夕,某中学举行国防知识竞赛某中学举行国防知识竞赛:
满分满分为为100分分,80分以上为优秀分以上为优秀,现将高一的两个班参赛学生现将高一的两个班参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布的成绩进行整理后分成五组绘制成如图所示的频率分布直方图直方图,已知图中从左到右的第一、第二、第三、第四、已知图中从左到右的第一、第二、第三、第四、第五小组的频率分别是第五小组的频率分别是0.3,0.4,0.15,0.1,0.05求:
求:
(1)成绩的众数、)成绩的众数、中位数;中位数;
(2)平均成绩)平均成绩506070809010000.0050.0100.0150.030.04
(1)65,65
(2)67