高一数学统计抽样方法Word文档下载推荐.docx
《高一数学统计抽样方法Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《高一数学统计抽样方法Word文档下载推荐.docx(19页珍藏版)》请在冰豆网上搜索。
利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法,这里仅介绍随机数表法。
怎样利用随机数表产生样本呢?
下面通过例子来说明
课本P41页
随机数表法的步骤:
(1)将总体的个体编号(每个号码的位数一致);
(2)在随机数表中任选一个数字作为开始;
(3)从选定的数开始按一定的方向读下去,若得到的数码在编号中,则取出;
若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止。
【例题精析】
例1:
人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?
例2:
某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?
[分析]简单随机抽样一般采用两种方法:
抽签法和随机数表法。
解法1:
解法2:
【课堂练习】P42
【课堂小结】
1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:
放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法。
2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。
3、简单随机抽样每个个体入样的可能性都相等,均为n/N,但是这里一定要将每个个体入样的可能性、第n次每个个体入样的可能性、特定的个体在第n次被抽到的可能性这三种情况区分开业,避免在解题中出现错误。
【课后作业】
《创新课时训练》抽样方法
(1)
第二课时系统抽样
(1)正确理解系统抽样的概念;
(2)掌握系统抽样的一般步骤;
(3)正确理解系统抽样与简单随机抽样的关系;
正确理解系统抽样的概念,能够灵活应用系统抽样的方法解决统计问题。
【创设情境】:
某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?
一、系统抽样的定义:
将总体平均分成几个部分,然后按照一定的规则,从每个部分中抽取一个个体作为样本,这种抽样的方法叫做系统抽样。
【说明】由系统抽样的定义可知系统抽样有以下特证:
(1)当总体容量N较大时,采用系统抽样。
(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k=[
].
(3)预先制定的规则指的是:
在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。
思考?
(1)你能举几个系统抽样的例子吗?
(2)下列抽样中不是系统抽样的是()
A、从标有1~15号的15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5,i+10(超过15则从1再数起)号入样
B工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验
C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止
D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
二、系统抽样的一般步骤。
(1)采用随机的方法将总体中的N个个编号。
(2)将编号按间隔
分段,当
是整数时,取
=
,当
不是整数时,从总体中剔除一些个体,是剩下的总体中个体的个数
能被
整除,这时取
,并将剩下的总体重新编号;
(3)在第一段用简单随机抽样确定起始个体的编号
(
∈N,
≤
)。
(4)按照一定的规则抽取样本,通常是将编号为
,
+
+2
,…,
+(n-1)
的个体取出。
【说明】从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想。
例1、某单位在岗职工共624人,为了调查工人用于上班途中的时间,决定抽取10%的工人进行调查,试采用系统抽样方法抽取所需的样本。
(答案见课本P43)
例2、从忆编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是
A.5,10,15,20,25B、3,13,23,33,43
C.1,2,3,4,5D、2,4,6,16,32
【课堂练习】
P44练习1.2.3
补充:
1、从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为()
A.99B、99,5C.100D、100,5
2、从学号为0~50的高一某班50名学生中随机选取5名同学参加数学测试,采用系统抽样的方法,则所选5名学生的学号可能是()
A.1,2,3,4,5B、5,16,27,38,49
C.2,4,6,8,10D、4,13,22,31,40
3、采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体人样的可能性为()
A.8B.8,3C.8.5D.9
4、某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是抽样方法。
1、在抽样过程中,当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤为:
《创新课时训练》抽样方法
(2)
第三课时分层抽样
(1)正确理解分层抽样的概念;
(2)掌握分层抽样的一般步骤;
(3)区分简单随机抽样、系统抽样和分层抽样,并选择适当正确的方法进行抽样。
正确理解分层抽样的定义,灵活应用分层抽样抽取样本,并恰当的选择三种抽样方法解决现实生活中的抽样问题。
【创设情景】
假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?
一、分层抽样的定义。
一般的,当总体由差异明显的几个部分组成时,为了使样本更客观的反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这种抽样的方法叫分层抽样。
【说明】应用分层抽样应遵循以下要求:
(1)分层:
将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。
二、分层抽样的步骤:
(1)将总体按一定的标准分层;
(2)计算各层的个体数与总体的个体数的比;
(3)按各层个体数占总体的个体数的比确定各层应抽取的样本容量;
(4)在每一层进行抽样(各层可以按简单随机抽样或系统抽样的方法抽取)
探究交流
(1)分层抽样为保证每个个体等可能入样,必须进行()
A、每层等可能抽样B、每层不等可能抽样
C、所有层按同一抽样比等可能抽样
(2)如果采用分层抽样,从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽到的可能性为()
A.
B.
C.
D.
【例选精析】
1.某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为()
A.15,5,25B.15,15,15C.10,5,30D15,10,20
2.课本P45例2
3.某地区共有36000名中小学生,其中,小学、初中、高中、职校生人数比为
,先要用分层抽样的方法从中抽取一个样本为360的样本,则这四类学生分别应该抽取多少?
某市两中学各对本校12~14岁学生身高抽样统计,结果两校差异有19cm,可能吗?
可能出现了什么问题?
P46练习1.2.3
1、分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:
(1)、分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。
(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。
2、分层抽样的优点是:
使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。
第四课时单元复习
复习本节内容,处理剩余习题
教学过程:
简单随机抽样、系统抽样、分层抽样的比较
类别
各自特点
联系
适用
范围
共同点
简单随机抽样
从总体中逐个抽取
总体个数较少
(1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样
系统抽样
将总体均分成几部分,按预先制定的规则在各部分抽取
在起始部分样时采用简单随机抽样
总体个数较多
分层抽样
将总体分成几层,
分层进行抽取
分层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
1.P47例3
2.一个地区共有5个乡镇,人口3万人,其中人口比例为3:
2:
5:
3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?
并写出具体过程。
P47练习1.2.3.4
课本P49习题2.1
《创新课时训练》单元复习
(1)
第五课时频率分布表
通过实例体会分布的意义和作用;
在表示样本数据的过程中,学会列频率分布表
重点与难点
会列频率分布表,能通过样本的频率分布估计总体的分布。
教学设想
课本P50引例
课本P51例1
1.频率分布表:
我们把反映总体频率分布的表格称为频率分布表。
2.制作频率分布表
(1)求全距,决定组数和组距,
;
(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组去闭区间;
(3)登记频数,计算频率,列出频率分布表。
说明:
①全距:
整个取值区间的长度;
②组距:
分成的区间的长度
③一般情况下,分组时除最右边的区间是闭区间外,其他区间均为左闭右开区间,称区间的左端点为下组限,右端点为上组限。
当然,也可以采用左开右闭区间形式。
例题讲解:
下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
(1)列出样本频率分布表﹔
(2)估计身高小于134cm的人数占总人数的百分比.。
课堂笔记P47例2课堂笔记P481,2,3,6
课本P53练习1,2,3
《创新课时训练》总体分布的估计
(1)
第六课时频率分布直方图与折线图
学会用频率分布表做频率直方图和频率折线图,学会用频率直方图对总体分布规律进行估计
做频率直方图和频率折线图,能用频率直方图对总体分布规律进行估计
能否用一个更为直观的方法体现数据分布的规律?
课本P53例2
1.频率分布直方图:
能够反映样本的频率分布规律的直方图
频率分布直方图的特征:
①从频率分布直方图可以清楚的看出数据分布的总体趋势。
②从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
课本P54例3
〖探究〗:
接下来请同学们思考下面这个问题:
如果将所有矩形的面积加起来,是什么?
3.频率分布折线图:
将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图,简称频率折线图。
注意:
取值区间两端点须分别向外延伸半个组距,并取次组距上在x轴上的点与折线首尾相连。
画出例3的频率分布折线图
3.总体密度曲线:
如果将样本容量取得足够大,分组的组距足够小,则相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线。
〖思考〗:
1.对于任何一个总体,它的密度曲线是不是一定存在?
2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?
实际上,尽管有些总体密度曲线是饿、客观存在的,但一般很难想函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.
课本P55例4
补:
为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:
4:
17:
15:
9:
3,第二小组频数为12.
(1)第二小组的频率是多少?
样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
课本P57练习1,2
《创新课时训练》总体分布的估计
(2)
第七课时茎叶图
掌握茎叶图的意义及画法,并能在实际问题中用茎叶图进行数据统计。
茎叶图的意义及画法,能在实际问题中用茎叶图进行数据统计。
某篮球云动员在某塞季各场比赛的得分情况如下:
12,15,24,31,31,36,36,37,39,44,49,50
如何分析该运动员的整体水平及发挥的稳定程度?
1.茎叶图:
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。
(见课本P57例子)
2.众数:
3.中位数:
茎叶图的特征:
(1)茎叶图一般左侧的叶从大到小写,右侧的按从小到大的顺序写,相同的数据要重复纪录,不得遗漏。
(2)用茎叶图表示数据有两个优点:
一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;
二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
(3)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。
1.课本P58例5
2.课堂笔记P56魔法石1,2,3,4
【课堂精练】
P58练习1.2.
1.茎叶图一般左侧的叶从大到小写,右侧的从小到大的顺序写,相同的数据要重复纪录,不得遗漏。
2.用茎叶图表示数据有两个优点:
3.茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。
《创新课时训练》总体分布的估计(3)
第八课时总体特征数的估计
(1)
(1)正确理解样本数据平均数的意义和作用,学会计算数据的平均数。
(2)会用样本的基本数字特征估计总体的基本数字特征。
(3)形成对数据处理过程进行初步评价的意识。
重点:
用样本平均数估计总体的平均数
难点:
能应用相关知识解决简单的实际问题。
在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕
甲运动员﹕7,8,6,8,6,5,8,10,7,4;
乙运动员﹕9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?
为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。
——用样本的数字特征估计总体的数字特征
<
一>
、众数、中位数、平均数
1.众数:
一组数据中出现次数最多的那个数据,叫做这组数据的众数。
2.中位数:
把n个数据按大小顺序排列,处于最中间位置的一个数据叫做这组数据的中位数.
中位数则仅与数据排列位置有关,当一组数据从小到大排列后,最中间的数据为中位数(偶数个数据的最中间两个的平均数)。
因此某些数据的变动对它的中位数影响不大。
当一组数据中的个别数据变动较大时,可用它来描述其集中趋势。
3.平均数:
我们把
称为
这n个数的平均数。
1.课本P62引例讲解理想近似值的原理,介绍
符号
2.课本P63例1
3.课本P64例2
4.课本P65例3
P66练习1.2.3.4
《创新课时训练》总体特征数的估计
(1)
【家庭作业】
《课堂笔记》P63魔法石
第九课时总体特征数的估计
(2)
二>
、标准差、方差
1.标准差
平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断。
某地区的统计显示,该地区的中学生的平均身高为176㎝,给我们的印象是该地区的中学生生长发育好,身高较高。
但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质。
因此,只有平均数难以概括样本数据的实际状态。
例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕
如果你是教练,选哪位选手去参加正式比赛?
我们知道,
。
两个人射击的平均成绩是一样的。
那么,是否两个人就没有水平差距呢?
(观察P66图2.2-8)直观上看,还是有差异的。
很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据。
考察样本数据的分散程度的大小,最常用的统计量是标准差。
标准差是样本数据到平均数的一种平均距离,一般用s表示。
样本数据
的标准差的算法:
(1)、算出样本数据的平均数
(2)算出每个样本数据与样本数据平均数的差:
(3)、算出(2)中
的平方。
(4)、算出(3)中n个平方数的平均数,即为样本方差。
(5)、算出(4)中平均数的算术平方根,,即为样本标准差。
其计算公式为:
显然,标准差较大,数据的离散程度较大;
标准差较小,数据的离散程度较小。
〖提问〗:
标准差的取值范围是什么?
标准差为0的样本数据有什么特点?
从标准差的定义和计算公式都可以得出:
当
时,意味着所有的样本数据都等于样本平均数。
(在课堂上,如果条件允许的话,可以给学生简单的介绍一下利用计算机来计算标准差的方法。
)
2.方差
从数学的角度考虑,人们有时用标准差的平方
(即方差)来代替标准差,作为测量样本数据分散程度的工具:
在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。
〖例1〗:
画出下列四组样本数据的直方图,说明他们的异同点。
(1)5,5,5,5,5,5,5,5,5
(2)4,4,4,5,5,5,6,6,6
(3)3,3,4,4,5,6,6,7,7
(4)2,2,2,2,5,8,8,8,8
分析:
先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。
解:
(图略,可查阅课本P68)
四组数据的平均数都是5.0,标准差分别为:
0.00,0.82,1.49,2.83。
他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的。
〖例2〗:
(见课本P69)
比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之