1、例3小强的自行车失窃了,他想知道所在地区每个家庭平均发生过几次自行车失窃事件为此,他和同学们一起,调查了全校每个同学所在家庭发生过几次自行车失窃事件分析这样抽样调查是不合适的虽然他们调查的人数很多,但是因为排除了所在地区那些没有中学 生的家庭,所以他们的调查结果不能推广到所在地区的所有家庭。想一想:小强和他的同学们的调查反映哪些家庭失窃自行车的情况?这个例子告诉我们,开展调查之前,要仔细检查总体中的每个个体是否都有可能成为调查对象。例4 1936年,美国文学文摘杂志:根据1000万电话和从该杂志订户所收回的意见,断言兰登将以370161的优势在总统竞选中击败罗斯福,但结果是,罗斯福当选了,文学
2、文摘大丢面子,原因何在呢?分析原来,1936年能装电话和订阅文学文摘杂志的人,在经济上相对富裕,而引入不太高的大多数选民选择了罗斯福。文学文摘的教训表明,抽样调查时,既要关注样本的大小,又要关注样本的代表性。小结:在做抽样调查时,所选取的样本应具有代表性,应避免遗漏某一群体,同时样本的容易要足够大,这样样本才能反映总体的特性,才能反映事物的本来面目。二、这样抽样调查合适吗1用例子说明样本中的个体数太少,不能真实反映的特性。假设总体是某年级300名学生的数学考试成绩,我们已经按照学号顺序排列如下:97 92 89 86 93 73 74 72 60 98 70 90 89 90 91 80 69
3、 92 70 64 92 83 89 93 72 77 79 75 80 93 93 72 87 76 86 82 85 82 87 86 81 88 74 87 92 88 75 92 89 82 88 86 85 76 79 92 89 84 93 75 93 84 87 90 88 90 80 89 72 78 73 79 85 78 77 91 92 82 77 86 90 78 86 90 83 73 75 67 76 55 70 76 77 91 70 84 87 62 91 67 88 78 82 77 87 75 84 70 80 66 80 87 60 78 76 89 81
4、 88 73 75 95 68 80 70 78 71 80 65 82 83 62 72 80 70 83 68 74 67 67 80 90 70 82 85 96 70 73 86 87 81 70 69 76 68 70 68 71 79 71 87 60 64 62 81 69 63 66 63 64 53 61 41 58 60 84 62 63 76 82 76 61 72 66 80 90 93 87 60 82 85 77 84 78 65 62 75 64 70 68 66 99 81 65 98 87 100 64 68 82 73 66 72 96 78 74 52 9
5、2 83 85 60 67 94 88 86 89 93 99 100 79 85 68 60 74 70 78 65 68 68 79 77 90 55 80 77 67 65 87 81 67 75 57 75 90 86 66 83 68 84 68 85 74 98 89 67 79 77 69 89 68 55 58 63 77 78 69 67 80 82 83 98 94 96 80 79 68 70 57 74 96 70 78 80 87 85 93 80 88 67 70 93。我们用简单抽样的方法选取一个样本是:随机数(学号)11125416794276成绩8086669
6、167它的频数分布直方图、平均成绩和标准差分别如下:另外,小明和小红也分别选取了一些样本,它们同样也包含五个个体,如下表:1322455988978737669759027554728382同样,也可以作出这两个样本的频数分布直方图、计算它们的平均成绩和校准差,如下图所示:样本平均成绩为74.2分,标准差为3.8分样本平均成绩为80.8分,标准差为6.5分从以上三张图比较来看,它们之间存在明显的差异,平均数和标准差与总体的平均数与标准差也相去甚远,显然这样选择的样本不能反映总体的特性,是不可靠的。以下是总体的频数分布直方图、平均成绩和标准差,你可以把三个样本的频数分布直方图、平均成绩和标准差与
7、它进行比较,更能反映这样选取样本是不可靠的。2选择恰当的样本个体数目下面是某位同学用随机抽样的方法选取两个含有40个个体的样本,并计算了它们的平均数与标准差,绘制了频数分布直方图,具体如下:样本平均成绩为75.7分,标准差为10.2分样本平均成绩为77.1分,标准差为10.7分从以上我们可以看出,当样本中个体太少时,样本的平均数、标准差往往差距较大,如果选取适当的样本的个体数,各个样本的平均数、标准差与总体的标准差相当接近。)一般来说,用样本估计总体时,样本容量越大,样本对总体的估计也就越精确,相应地,搜集、整理、计算数据的工作量也就越大,因此,在实际工作中,样本容量既要考虑问题本身的需要,又
8、要考虑实现的可能性和所付出的代价的大小。三、用样本估计总体问题:2002年北京的空气质量情况如何?请用简单随机抽样方法选取该年的30天,记录并统计这30天北京的空气污染指数,求出这30天的平均空气污染指数,据此估计北京2002年全年的平均空气污染指数和空气质量状况。(可以查询中国环境保护网)我们用随机抽样的方法选定如下表中的30天,通过上网得知北京在这30天的空气污染指数及质量级别,如下表所示:这30个空气污染指数的平均数为107,据此估计该城市2002年的平均空气污染指数为107,空气质量状况属于轻微污染。练习:算一算自己选取的样本的污染指数为多少?根据样本的空气污染指数的平均数,估计这个城
9、市的空气质量。下面是老师抽取的样本的空气质量级别、所占天数及比例的统计图和该城市2002年全年的相应数据的统计图,同学们可以通过比较两张统计图,体会用样本估计总体的合理性。经比较可以发现,虽然从样本获得的数据与总体的不完全一致,但这样的误差还是可以接受的,是一个较好的估计。根据自己所抽取的样本绘制统计图,并和2002年全年的相应数据的统计图进行比较,想一想用你所抽取的样本估计总体是否合理?显然,由于所抽取的样本的不同,样本的污染指数不同。但是,正如我们前面已经看到的,随着样本容量(样本中包含的个体的个数)的增加,由样本得出的平均数往往会更接近总体的平均数,数学家已经证明随机抽样方法是科学而可靠
10、的。对于估计总体特性这类问题,数学上的一般做法是给出具有一定可靠程度的一个估计值的范围。用样本估计总体时,样本容量越大,样本对总体的估计也就越精确。相应地,搜集、整理、计算数据的工作量也就越大,随机抽样是经过数学证明了的可靠的方法,它对于估计总体特征是很有帮助的。四、典型例题解析例1 下表是某班20名男同学的身高,请你计算出他们的平均身高身高(cm)143155157160163164165人数1243分析:首先观察题的特点后选择平均数公式解:注意:求平均数时样本容量是20而不是8例2某班在一次物理测试中,成绩为:100分7人,90分14人,80分17人,70分8人,60分2人,50分2人,则该班此次测试的平均成绩为( )A82分 B62分C65分 D75分错解:选D误区分析:分正解:选A例3 假设你们年级共有四个班级,各班的男同学人数和平均身高如下表所示:平均身高(cm)161.2162.3160.8160.7班级男生人数232524小强这样计算全年级男同学的平均身高小强这样计算平均数可以吗?为什么?正确不理解加权平均数公式,容易求这四个平均身高的平均数不正确改为:【中考考点】用样本估计总体是统计的思想方法,学会用计算器计算相应的平均数和标准差,在中考题中一般以填空或选择题的形式渗透在各个题中
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1