第11讲 随机抽样和样本估计总体学生.docx

上传人:b****1 文档编号:18378987 上传时间:2023-04-24 格式:DOCX 页数:15 大小:271.83KB
下载 相关 举报
第11讲 随机抽样和样本估计总体学生.docx_第1页
第1页 / 共15页
第11讲 随机抽样和样本估计总体学生.docx_第2页
第2页 / 共15页
第11讲 随机抽样和样本估计总体学生.docx_第3页
第3页 / 共15页
第11讲 随机抽样和样本估计总体学生.docx_第4页
第4页 / 共15页
第11讲 随机抽样和样本估计总体学生.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

第11讲 随机抽样和样本估计总体学生.docx

《第11讲 随机抽样和样本估计总体学生.docx》由会员分享,可在线阅读,更多相关《第11讲 随机抽样和样本估计总体学生.docx(15页珍藏版)》请在冰豆网上搜索。

第11讲 随机抽样和样本估计总体学生.docx

第11讲随机抽样和样本估计总体学生

第11讲随机抽样和样本估计总体

[玩前必备]

1.统计的基本概念

(1)总体:

一般把所考察对象的某一数值指标的全体构成的集合看成总体.

(2)个体:

构成总体的每一个元素作为个体.

(3)样本:

从总体中抽出若干个个体所组成的集合叫样本.

(4)样本容量:

样本中个体的数目叫样本容量.

2.简单随机抽样

(1)定义:

一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.

(2)最常用的简单随机抽样方法有两种——抽签法和随机数法.

(3)应用范围:

总体个体数较少.

3.分层抽样

(1)定义:

一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.

(2)分层抽样的应用范围:

当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.

4.频率分布表

(1)含义:

把反映总体频率分布的表格称为频率分布表.

(2)频率分布表的画法步骤:

第一步:

求极差,决定组数和组距,组距=

第二步:

分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;

第三步:

登记频数,计算频率,列出频率分布表.

5.频率分布直方图

利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图.

(1)作频率分布直方图的方法

①先制作频率分布表,然后作直角坐标系.

②把横轴分成若干段,每一线段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的

,这样得出一系列的矩形.

③每个矩形的面积恰好是该组的频率,这些矩形就构成了频率分布直方图.

(2)频率分布直方图的特征

①直方图中各小长方形的面积之和为1.

②直方图中纵轴表示

,故每组样本的频率为组距×

,即矩形的面积.

③直方图中每组样本的频数为频率×总体数.

6.茎叶图

茎相同者共用一个茎(如两位数中的十位数),茎按从小到大的顺序从上向下列出,共茎的叶(如两位数中的个位数),一般按从小到大(或从大到小)的顺序同行列出.这样将样本数据有条理地列出来的图形叫做茎叶图.其优点是当样本数据较少时,茎叶图可以保留样本数据的所有信息,直观反映出数据的水平状况、稳定程度,且便于记录和表示;缺点是对差异不大的两组数据不易分析,且样本数据很多时效果不好.

茎叶图的画法步骤

第一步:

将每个数据分为茎(高位)和叶(低位)两部分;

第二步:

将最小茎与最大茎之间的数按大小次序排成一列;

第三步:

将各个数据的叶依次写在其茎的两侧.

7.样本的数字特征:

众数、中位数、平均数、方差、标准差

(1)众数:

一组数据中出现次数最多的那个数据,叫做这组数据的众数.

(2)中位数:

把n个数据按大小顺序排列,处于最中间位置的一个数据叫做这组数据的中位数.

在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.

(3)平均数:

样本数据的算术平均数,即

(x1+x2+…+xn).

(4)标准差与方差:

设一组数据x1,x2,x3,…,xn的平均数为x,则这组数据的标准差和方差分别是

s=

s2=

[(x1-

)2+(x2-

)2+…+(xn-

)2]

标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.

(5)标准差和方差的一些结论

若取值x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均值为x1p1+x2p2+…+xnpn;若x1,x2,…,xn的平均数为

,方差为s2,则ax1+b,ax2+b,…,axn+b的平均数为a

+b,方差为a2s2.

[玩转典例]

题型一随机抽样

例1 从某年级的500名学生中抽取60名学生进行体重的统计分析,下列说法正确的是(  )

A.500名学生是总体

B.每个学生是个体

C.抽取的60名学生的体重是一个样本

D.抽取的60名学生的体重是样本容量

例2 (高考江西卷)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为(  )

7816 6572 0802 6314 0702 4369 9728 0198

3204 9234 4935 8200 3623 4869 6938 7481

A.08    B.07C.02D.01

例3 某高级中学共有学生3000名,各年级男、女生人数如下表:

高一年级

高二年级

高三年级

女生

523

x

y

男生

487

490

z

已知在全校学生中随机抽取1名,抽到高二年级女生的概率是0.17.若现需对各年级用分层抽样的方法在全校抽取300名学生,则应在高三年级抽取的学生人数为________.

[玩转跟踪]

1.某学校为了解高一800名新入学同学的数学学习水平,从中随机抽取100名同学的中考数学成绩进行分析,在这个问题中,下列说法正确的是(  )

A.800名同学是总体

B.100名同学是样本

C.每名同学是个体

D.样本容量是100

2.(2017·江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.

3.某学校高一、高二、高三三个年级共有学生3500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按

的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为(  )

A.8B.11

C.16D.10

题型二频率分布直方图

例4(山东,8)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:

kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(  )

A.6     B.8C.12D.18

例5在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________,________.

例6(2017·全国Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:

万人)的数据,绘制了下面的折线图.

根据该折线图,下列结论错误的是(  )

A.月接待游客量逐月增加

B.年接待游客量逐年增加

C.各年的月接待游客量高峰期大致在7,8月

D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

[玩转跟踪]

1.(山东)某高校调查了200名学生每周的自习时间(单位:

小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是(  )

A.56B.60C.120D.140

2.(重庆)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:

则这组数据的中位数是(  )

A.19B.20C.21.5D.23

3.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是(  )

A.各月的平均最低气温都在0℃以上

B.七月的平均温差比一月的平均温差大

C.三月和十一月的平均最高气温基本相同

D.平均最高气温高于20℃的月份有5个

题型三用样本的数字特征估计总体的数字特征

例7某公司10位员工的月工资(单位:

元)为x1,x2,…,x10,其均值和方差分别为

和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为(  )

A.

,s2+1002B.

+100,s2+1002C.

,s2D.

+100,s2

[玩转跟踪]

1.如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:

分),已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为(  )

A.2,5B.5,5C.5,8D.8,8

2.(安徽)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为(  )

A.8B.15C.16D.32

3.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是(  )

    1  2 5

    20 2 3 3

    31 2 4 4 8 9

    45 5 5 7 7 8 8 9

    50 0 1 1 4 7 9

    61 7 8

A.46,45,56   B.46,45,53C.47,45,56D.45,47,53

题型四综合应用

例8(新课标全国Ⅰ,18)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:

质量指标值分组

[75,85)

[85,95)

[95,105)

[105,115)

[115,125)

频数

6

26

38

22

8

(1)在下表中作出这些数据的频率分布直方图:

(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);

(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?

 

[玩转跟踪]

1.(2015·广东,17)某城市100户居民的月平均用电量(单位:

度),以[160,180),[180,200),

[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.

(1)求直方图中x的值;

(2)求月平均用电量的众数和中位数;

(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?

 

[玩转练习]

1(2019全国II理5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是

A.中位数B.平均数

C.方差D.极差

2(2019全国II理13)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为__________.

3.(2018全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:

建设前经济收入构成比例建设后经济收入构成比例

则下面结论中不正确的是

A.新农村建设后,种植收入减少

B.新农村建设后,其他收入增加了一倍以上

C.新农村建设后,养殖收入增加了一倍

D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半

4.(2017江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.

5.(2015陕西)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为

A.167B.137C.123D.93

6.(2015新课标2)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:

万吨)柱形图,以下结论不正确的是.

A.逐年比较,2008年减少二氧化硫排放量的效果最显著

B.2007年我国治理二氧化硫排放显现成效

C.2006年以来我国二氧化硫年排放量呈减少趋势

D.2006年以来我国二氧化硫年排放量与年份正相关

7.(2014广东)已知某地区中小学生人数和近视情况分别如图1和图2所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别是

A.200,20B.100,20C.200,10D.100,10

8.(2013福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6组:

[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为

A.588B.480C.450D.120

9.(2018江苏)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为.

10.(2015湖南)在一次马拉松比赛中,35名运动员的成绩(单位:

分钟)的茎叶图如图所示.

若将运动员按成绩由好到差编为

号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是.

11.(2019江苏5)已知一组数据6,7,8,8,9,10,则该组数据的方差是.

12.(2019全国III理17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:

将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:

记C为事件:

“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.

(1)求乙离子残留百分比直方图中a,b的值;

(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).

 

13.(2016年四川)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准

(吨)、一位居民的月用水量不超过

的部分按平价收费,超出

的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:

吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成9组,制成了如图所示的频率分布直方图.

(I)求直方图中a的值;

)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;

)若该市政府希望使85%的居民每月的用水量不超过标准

(吨),估计

的值,并说明理由.

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1