统计.docx
《统计.docx》由会员分享,可在线阅读,更多相关《统计.docx(24页珍藏版)》请在冰豆网上搜索。
统计
课题
统计
教学目标
1.了解简单随机抽样、分层抽样及系统抽样的意义,会用它们对简单实际问题进行抽样.
2.会用样本频率分布估计总体分布.
3.会用样本估计总体平均值和方差
重点、难点
1.会用样本频率分布估计总体分布.
2.会用样本估计总体平均值和方差
考点及考试要求
在本章的复习中,要理解几种抽样方法的区别与联系.应充分注意一些重要概念的实际意义,理解概率统计中处理问题的基本思想方法,掌握所学的概率统计知识的实际应用
教学内容
统计
●网络体系总览
.
●复习方略指南
在本章的复习中,要理解几种抽样方法的区别与联系.应充分注意一些重要概念的实际意义,理解概率统计中处理问题的基本思想方法,掌握所学的概率统计知识的实际应用.
这部分内容高考命题趋向主要以选择题、填空题为主,重点考查基础知识、基本概念及其简单的应用.
对有关概率统计的应用题要多加关注.
12.1抽样方法与总体分布的估计
●知识梳理
1.简单随机抽样:
一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.
2.分层抽样:
当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.
3.两种抽样方法的比较(略).
4.总体:
在数理统计中,通常把被研究的对象的全体叫做总体.
5.频率分布:
用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.
6.总体分布:
从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.
简单随机抽样
提出问题:
假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?
显然,你只能从中抽取一定数量的饼干作为检验的样本。
(为什么?
)那么,应当怎样获取样本呢?
一、简单随机抽样的概念
一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。
简单随机抽样必须具备下列特点:
(1)简单随机抽样要求被抽取的样本的总体个数N是有限的。
(2)简单随机样本数n小于等于样本总体的个数N。
(3)简单随机样本是从总体中逐个抽取的。
(4)简单随机抽样是一种不放回的抽样。
(5)简单随机抽样的每个个体入样的可能性均为n/N。
思考?
下列抽样的方式是否属于简单随机抽样?
为什么?
(1)从无限多个个体中抽取50个个体作为样本。
(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。
二、抽签法和随机数法
1、抽签法的定义。
一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
【说明】抽签法的一般步骤:
(1)将总体的个体编号。
(2)连续抽签获取样本号码。
思考?
你认为抽签法有什么优点和缺点:
当总体中的个体数很多时,用抽签法方便吗?
2、随机数法的定义:
利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法,这里仅介绍随机数表法。
怎样利用随机数表产生样本呢?
下面通过例子来说明,假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行。
第一步,先将800袋牛奶编号,可以编为000,001,…,799。
第二步,在随机数表中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行)。
162277943949544354821737932378
844217533157245506887704744767
630163785916955567199810507175
332112342978645607825242074438
576086324409472796544917460962
87352096438426349164
21763350258392120676
12867358074439523879
15510013429966027954
90528477270802734328
第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本。
【说明】随机数表法的步骤:
(1)将总体的个体编号。
(2)在随机数表中选择开始数字。
(3)读数获取样本号码。
【例题精析】
例1:
人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?
[分析]简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样。
例2:
某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?
[分析]简单随机抽样一般采用两种方法:
抽签法和随机数表法。
解法1:
(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径。
解法2:
(随机数表法)将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本。
课堂练习
1、为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是
A.总体是240B、个体是每一个学生
C、样本是40名学生D、样本容量是40
2、为了正确所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是()
A、总体B、个体是每一个学生
C、总体的一个样本D、样本容量
3、一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是
4、从3名男生、2名女生中随机抽取2人,检查数学成绩,则抽到的均为女生的可能性是。
系统抽样
提出问题:
某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?
一、系统抽样的定义:
一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。
由系统抽样的定义可知系统抽样有以下特证:
(1)当总体容量N较大时,采用系统抽样。
(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k=[
].
(3)预先制定的规则指的是:
在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。
思考?
(1)你能举几个系统抽样的例子吗?
(2)下列抽样中不是系统抽样的是()
A、从标有1~15号的15号的15个小球中任选3个作为样本,按从小号到
大号排序,随机确定起点i,以后为i+5,i+10(超过15则从1再数起)号入样
B工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验
C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止
D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
点拨:
(2)c不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样。
二、系统抽样的一般步骤:
(1)采用随机抽样的方法将总体中的N个个编号。
(2)将整体按编号进行分段,确定分段间隔k(k∈N,L≤k).
(3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。
(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。
【例题精析】
例1、某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:
5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。
[分析]按1:
5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号。
解:
按照1:
5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生。
采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293。
例2、从忆编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是
A.5,10,15,20,25B、3,13,23,33,43
C.1,2,3,4,5D、2,4,6,16,32
[分析]用系统抽样的方法抽取至的导弹编号应该k,k+d,k+2d,k+3d,k+4d,其中d=50/5=10,k是1到10中用简单随机抽样方法得到的数,因此只有选项B满足要求,故选B。
注:
1、在抽样过程中,当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤为:
(1)采用随机的方法将总体中个体编号;
(2)将整体编号进行分段,确定分段间隔k(k∈N);
(3)在第一段内采用简单随机抽样的方法确定起始个体编号L;
(4)按照事先预定的规则抽取样本。
2、在确定分段间隔k时应注意:
分段间隔k为整数,当
不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。
课堂练习:
1、从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为
A.99B、99,5C.100D、100,5
2、从学号为0~50的高一某班50名学生中随机选取5名同学参加数学测试,采用系统抽样的方法,则所选5名学生的学号可能是()
A.1,2,3,4,5B、5,16,27,38,49
C.2,4,6,8,10D、4,13,22,31,40
3、采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体人样的可能性为()
A.8B.8,3C.8.5D.9
4、某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是抽样方法。
5、某单位的在岗工作为624人,为了调查工作上班时,从家到单位的路上平均所用的时间,决定抽取10%的工作调查这一情况,如何采用系统抽样的方法完成这一抽样?
分层抽样
提出问题:
假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?
一、分层抽样的定义:
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。
【说明】分层抽样又称类型抽样,应用分层抽样应遵循以下要求:
(1)分层:
将相似的个体归人一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。
二、分层抽样的步骤:
(1)分层:
按某种特征将总体分成若干部分。
(2)按比例确定每层抽取个体的个数。
(3)各层分别按简单随机抽样的方法抽取。
(4)综合每层抽样,组成样本。
【说明】
(1)分层需遵循不重复、不遗漏的原则。
(2)抽取比例由每层个体占总体的比例确定。
(3)各层抽样按简单随机抽样进行。
三、简单随机抽样、系统抽样、分层抽样的比较
类别
共同点
各自特点
联系
适用
范围
简单
随机
抽样
(1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样
从总体中逐个抽取
总体个数较少
将总体均分成几部分,按预先制定的规则在各部分抽取
在起始部分
样时采用简
随机抽样
总体个数较多
系统
抽样
将总体分成几层,
分层进行抽取
分层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
分层
抽样
【例选精析】
例1、某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为
A.15,5,25B.15,15,15
C.10,5,30D15,10,20
[分析]因为300:
200:
400=3:
2:
4,于是将45分成3:
2:
4的三部分。
设三部分各抽取的个体数分别为3x,2x,4x,由3x+2x+4x=45,得x=5,故高一、高二、高三各年级抽取的人数分别为15,10,20,故选D。
例2:
一个地区共有5个乡镇,人口3万人,其中人口比例为3:
2:
5:
2:
3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?
并写出具体过程。
[分析]采用分层抽样的方法。
解:
因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:
(1)将3万人分为5层,其中一个乡镇为一层。
(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。
300×3/15=60(人),300×2/15=100(人),300×2/15=40(人),300×2/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60人。
(3)将300人组到一起,即得到一个样本。
1、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是()
A.简单随机抽样B.系统抽样
C.分层抽样D.先从老人中剔除1人,然后再分层抽样
2、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为人,A型血应抽取的人数为人,B型血应抽取的人数为人,AB型血应抽取的人数为人。
3、某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,若该校取一个容量为n的样本,则n=。
4、对某单位1000名职工进行某项专门调查,调查的项目与职工任职年限有关,人事部门提供了如下资料:
任职年限
5年以下
5年至10年
10年以上
人数
300
500
200
试利用上述资料设计一个抽样比为1/10的抽样方法。
●点击双基
1.为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是
A.1000名运动员是总体B.每个运动员是个体
C.抽取的100名运动员是样本D.样本容量是100
解析:
这个问题我们研究的是运动员的年龄情况.因此应选D.
答案:
D
2.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一个容量为3的样本,则某特定个体入样的概率是
A.
B.
C.
D.
解析:
用简单随机抽样法从中抽取,则每个个体被抽到的概率都相同为
,所以选C.
答案:
C
3.一个容量为n的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n的值为
A.640B.320C.240D.160
解析:
∵
=0.125,∴n=320.故选B.
答案:
B
4.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中较合适的抽样方法是___________.
解析:
要研究的总体里各部分情况差异较大,因此用分层抽样.
答案:
分层抽样
5.某班学生在一次数学考试中成绩分布如下表:
分数段
[0,80)
[80,90)
[90,100)
人数
2
)
5
6
分数段
[100,110)
[110,120
[120,130)
人数
8
12
6
分数段
[130,140)
[140,150)
人数
4
2
那么分数在[100,110)中的频率和分数不满110分的累积频率分别是______________、_______(精确到0.01).
解析:
由频率计算方法知:
总人数=45.
分数在[100,110)中的频率为
=0.178≈0.18.
分数不满110分的累积频率为
=
≈0.47.
答案:
0.180.47
●典例剖析
【例1】(2004年湖南,5)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是
A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法
剖析:
此题为抽样方法的选取问题.当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.
依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法.故选B.
答案:
B
评述:
采用什么样的抽样方法要依据研究的总体中的个体情况来定.
【例2】(2004年福建,15)一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k小组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是___________.
剖析:
此问题总体中个体的个数较多,因此采用系统抽样.按题目中要求的规则抽取即可.
∵m=6,k=7,m+k=13,∴在第7小组中抽取的号码是63.
答案:
63
评述:
当总体中个体个数较多而差异又不大时可采用系统抽样.采用系统抽样在每小组内抽取时应按规则进行.
【例3】把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.
剖析:
已知前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为1-0.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数.
由已知知前七组的累积频数为0.79×100=79,故后三组共有的频数为21,依题意
=21,a1(1+q+q2)=21.∴a1=1,q=4.∴后三组频数最高的一组的频数为16.
答案:
16
评述:
此题剖析只按第二种思路给出了解答,你能按第一种思路来解吗?
【例4】对某电子元件进行寿命追踪调查,情况如下:
寿命(h)
100~200
200~300
300~400
400~500
500~600
个数
20
30
80
40
30
(1)列出频率分布表;
(2)画出频率分布直方图和累积频率分布图;
(3)估计电子元件寿命在100~400h以内的概率;
(4)估计电子元件寿命在400h以上的概率.
剖析:
通过本题可掌握总体分布估计的各种方法和步骤.
解:
(1)频率分布表如下:
寿命(h)
频数
频率
累积频率
100~200
20
0.10
0.10
200~300
30
0.15
0.25
300~400
80
0.40
0.65
400~500
40
0.20
0.85
500~600
30
0.15
1
合计
200
1
(2)频率分布直方图如下:
(3)由累积频率分布图可以看出,寿命在100~400h内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400h内的概率为0.65.
(4)由频率分布表可知,寿命在400h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400h以上的概率为0.35.
评述:
画频率分布条形图、直方图时要注意纵、横坐标轴的意义.
●闯关训练
夯实基础
1.(2004年江苏,6)某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为
A.0.6hB.0.9hC.1.0hD.1.5h
解析:
=0.9.
答案:
B
2.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样法从中抽取20人,各年龄段分别抽取的人数为
A.7,5,8B.9,5,6
C.6,5,9D.8,5,7
解析:
45×
=