人教版高中数学必修三第二章 统计用样本估计总体活动与探究Word文档格式.docx
《人教版高中数学必修三第二章 统计用样本估计总体活动与探究Word文档格式.docx》由会员分享,可在线阅读,更多相关《人教版高中数学必修三第二章 统计用样本估计总体活动与探究Word文档格式.docx(7页珍藏版)》请在冰豆网上搜索。
例3 小强的自行车失窃了,他想知道所在地区每个家庭平均发生过几次自行车失窃事件.为此,他和同学们一起,调查了全校每个同学所在家庭发生过几次自行车失窃事件.
分析 这样抽样调查是不合适的.虽然他们调查的人数很多,但是因为排除了所在地区那些没有中学生的家庭,所以他们的调查结果不能推广到所在地区的所有家庭。
想一想:
小强和他的同学们的调查反映哪些家庭失窃自行车的情况?
这个例子告诉我们,开展调查之前,要仔细检查总体中的每个个体是否都有可能成为调查对象。
例41936年,美国《文学文摘》杂志:
根据1000万电话和从该杂志订户所收回的意见,断言兰登将以370︰161的优势在总统竞选中击败罗斯福,但结果是,罗斯福当选了,《文学文摘》大丢面子,原因何在呢?
分析 原来,1936年能装电话和订阅《文学文摘》杂志的人,在经济上相对富裕,而引入不太高的大多数选民选择了罗斯福。
《文学文摘》的教训表明,抽样调查时,既要关注样本的大小,又要关注样本的代表性。
小结:
在做抽样调查时,所选取的样本应具有代表性,应避免遗漏某一群体,同时样本的容易要足够大,这样样本才能反映总体的特性,才能反映事物的本来面目。
二、这样抽样调查合适吗
1.用例子说明样本中的个体数太少,不能真实反映的特性。
假设总体是某年级300名学生的数学考试成绩,我们已经按照学号顺序排列如下:
97928986937374726098709089909180699270649283899372777975809393728776868285828786818874879288759289828886857679928984937593848790889080897278737985787791928277869078869083737567765570767791708487629167887882778775847080668087607876898188737595688070787180658283627280708368746767809070828596707386878170697668706871797187606462816963666364536141586084626376827661726680909387608285778478656275647068669981659887100646882736672967874529283856067948886899399100798568607470786568687977905580776765878167755775908666836884688574988967797769896855586377786967808283989496807968705774967078808785938088677093。
我们用简单抽样的方法选取一个样本是:
随机数(学号)
111
254
167
94
276
成绩
80
86
66
91
67
它的频数分布直方图、平均成绩和标准差分别如下:
另外,小明和小红也分别选取了一些样本,它们同样也包含五个个体,如下表:
132
245
5
98
89
78
73
76
69
75
90
275
54
72
83
82
同样,也可以作出这两个样本的频数分布直方图、计算它们的平均成绩和校准差,如下图所示:
样本平均成绩为74.2分,标准差为3.8分
样本平均成绩为80.8分,标准差为6.5分
从以上三张图比较来看,它们之间存在明显的差异,平均数和标准差与总体的平均数与标准差也相去甚远,显然这样选择的样本不能反映总体的特性,是不可靠的。
以下是总体的频数分布直方图、平均成绩和标准差,你可以把三个样本的频数分布直方图、平均成绩和标准差与它进行比较,更能反映这样选取样本是不可靠的。
2.选择恰当的样本个体数目
下面是某位同学用随机抽样的方法选取两个含有40个个体的样本,并计算了它们的平均数与标准差,绘制了频数分布直方图,具体如下:
样本平均成绩为75.7分,标准差为10.2分
样本平均成绩为77.1分,标准差为10.7分
从以上我们可以看出,当样本中个体太少时,样本的平均数、标准差往往差距较大,如果选取适当的样本的个体数,各个样本的平均数、标准差与总体的标准差相当接近。
)
一般来说,用样本估计总体时,样本容量越大,样本对总体的估计也就越精确,相应地,搜集、整理、计算数据的工作量也就越大,因此,在实际工作中,样本容量既要考虑问题本身的需要,又要考虑实现的可能性和所付出的代价的大小。
三、用样本估计总体
问题:
2002年北京的空气质量情况如何?
请用简单随机抽样方法选取该年的30天,记录并统计这30天北京的空气污染指数,求出这30天的平均空气污染指数,据此估计北京2002年全年的平均空气污染指数和空气质量状况。
(可以查询中国环境保护网)
我们用随机抽样的方法选定如下表中的30天,通过上网得知北京在这30天的空气污染指数及质量级别,如下表所示:
这30个空气污染指数的平均数为107,据此估计该城市2002年的平均空气污染指数为107,空气质量状况属于轻微污染。
练习:
算一算自己选取的样本的污染指数为多少?
根据样本的空气污染指数的平均数,估计这个城市的空气质量。
下面是老师抽取的样本的空气质量级别、所占天数及比例的统计图和该城市2002年全年的相应数据的统计图,同学们可以通过比较两张统计图,体会用样本估计总体的合理性。
经比较可以发现,虽然从样本获得的数据与总体的不完全一致,但这样的误差还是可以接受的,是一个较好的估计。
根据自己所抽取的样本绘制统计图,并和2002年全年的相应数据的统计图进行比较,想一想用你所抽取的样本估计总体是否合理?
显然,由于所抽取的样本的不同,样本的污染指数不同。
但是,正如我们前面已经看到的,随着样本容量(样本中包含的个体的个数)的增加,由样本得出的平均数往往会更接近总体的平均数,数学家已经证明随机抽样方法是科学而可靠的。
对于估计总体特性这类问题,数学上的一般做法是给出具有一定可靠程度的一个估计值的范围。
用样本估计总体时,样本容量越大,样本对总体的估计也就越精确。
相应地,搜集、整理、计算数据的工作量也就越大,随机抽样是经过数学证明了的可靠的方法,它对于估计总体特征是很有帮助的。
四、典型例题解析
例1下表是某班20名男同学的身高,请你计算出他们的平均身高.
身高(cm)
143
155
157
160
163
164
165
人数
1
2
4
3
分析:
首先观察题的特点后选择平均数公式.
解:
.
注意:
求平均数时样本容量是20而不是8.
例2某班在一次物理测试中,成绩为:
100分7人,90分14人,80分17人,70分8人,60分2人,50分2人,则该班此次测试的平均成绩为()
A.82分B.62分
C.65分D.75分
错解:
选D.
误区分析:
分.
正解:
选A.
例3假设你们年级共有四个班级,各班的男同学人数和平均身高如下表所示:
平均身高(cm)
161.2
162.3
160.8
160.7
班级男生人数
23
25
24
小强这样计算全年级男同学的平均身高.
小强这样计算平均数可以吗?
为什么?
正确.
不理解加权平均数公式,容易求这四个平均身高的平均数.
不正确.
改为:
【中考考点】
用样本估计总体是统计的思想方法,学会用计算器计算相应的平均数和标准差,在中考题中一般以填空或选择题的形式渗透在各个题中.