第3讲统计.docx

上传人:b****4 文档编号:27531667 上传时间:2023-07-02 格式:DOCX 页数:22 大小:166KB
下载 相关 举报
第3讲统计.docx_第1页
第1页 / 共22页
第3讲统计.docx_第2页
第2页 / 共22页
第3讲统计.docx_第3页
第3页 / 共22页
第3讲统计.docx_第4页
第4页 / 共22页
第3讲统计.docx_第5页
第5页 / 共22页
点击查看更多>>
下载资源
资源描述

第3讲统计.docx

《第3讲统计.docx》由会员分享,可在线阅读,更多相关《第3讲统计.docx(22页珍藏版)》请在冰豆网上搜索。

第3讲统计.docx

第3讲统计

第3讲 统 计

考情解读

 

(1)该部分常考内容:

样本数字特征的计算、各种统计图表;有时也会在知识交汇点处命题,如概率与统计交汇等.

(2)从考查形式上来看,大部分为填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中、低档题.

1.随机抽样

(1)简单随机抽样特点是从总体中逐个抽取.适用范围:

总体中的个体较少.

(2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:

总体中的个体数较多.

(3)分层抽样特点是将总体分成几层,分层进行抽取.适用范围:

总体由差异明显的几部分组成.

2.常用的统计图表

(1)频率分布直方图

①小长方形的面积=组距×

=频率;

②各小长方形的面积之和等于1;

③小长方形的高=

,所有小长方形的高的和为

.

(2)茎叶图

在样本数据较少时,用茎叶图表示数据的效果较好.

3.用样本的数字特征估计总体的数字特征

(1)众数、中位数、平均数

数字特征

样本数据

频率分布直方图

众数

出现次数最多的数据

取最高的小长方形底边中点的横坐标

中位数

将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)

把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标

平均数

样本数据的算术平均数

每个小矩形的面积乘以小矩形底边中点的横坐标之和

(2)方差:

s2=

[(x1-

)2+(x2-

)2+…+(xn-

)2].

标准差:

s=

.

热点一 抽样方法

例1

 

(1)(2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为________.

(2)某学校共有师生3200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________.

思维启迪 

(1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;

(2)分层抽样最重要的是各层的比例.

答案 

(1)12 

(2)200

解析 

(1)由

=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为

=12.

(2)本题属于分层抽样,设该学校的教师人数为x,所以

,所以x=200.

思维升华 

(1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;

(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;分层抽样满足:

各层抽取的比例都等于样本容量在总体容量中的比例.

 

(1)某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取49人做问卷调查,将高一、高二、高三学生依次随机按1,2,3,…,1470编号,若第1组有简单随机抽样方法抽取的号码为23,则高二应抽取的学生人数为________.

(2)(2014·广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________.

答案 

(1)17 

(2)200,20

解析 

(1)由系统抽样方法,知按编号依次每30个编号作为一组,共分49组,高二学生的编号为496到988,在第17组到第33组内,第17组抽取的编号为16×30+23=503,为高二学生,第33组抽取的编号为32×30+23=983,为高二学生,故共抽取高二学生人数为33-16=17.

(2)该地区中、小学生总人数为

3500+2000+4500=10000,

则样本容量为10000×2%=200,其中抽取的高中生近视人数为2000×2%×50%=20.

热点二 用样本估计总体

例2

 

(1)(2014·山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:

kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为___________________________________________________________________.

(2)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:

毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是________.

2

0.04

1

2

3

6

9

3

0.05

9

6

2

1

0.06

2

9

3

3

1

0.07

9

6

4

0.08

7

7

0.09

2

4

6

思维启迪 

(1)根据第一组与第二组的人数和对应频率估计样本总数,然后利用第三组的频率和无疗效人数计算;

(2)直接根据公式计算方差.

答案 

(1)12 

(2)甲

解析 

(1)志愿者的总人数为

=50,

所以第三组人数为50×0.36=18,

有疗效的人数为18-6=12.

(2)

=(0.042+0.053+0.059+0.061+0.062+0.066+0.071+0.073+0.073+0.084+0.086+0.097)÷12≈0.0689,

=(0.041+0.042+0.043+0.046+0.059+0.062+0.069+0.079+0.087+0.092+0.094+0.096)÷12≈0.0675,

s2=

[(0.042-0.0689)2+(0.053-0.0689)2+…+(0.097-0.0689)2]≈0.000212.

s2=

[(0.041-0.0675)2+(0.042-0.0675)2+…+(0.096-0.0675)2]≈0.000429.

所以甲、乙两地浓度的方差较小的是甲地.

思维升华 

(1)反映样本数据分布的主要方式:

频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等.

(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.

 

(1)某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.

(2)(2014·陕西)设样本数据x1,x2,…,x10的均值和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为________.

答案 

(1)10 

(2)1+a,4

解析 

(1)由频率分布直方图可知:

,所以x=10.

(2)

=1,yi=xi+a,

所以y1,y2,…,y10的均值为1+a,方差不变仍为4.

热点三 概率与统计的综合应用

例3

 某高校组织自主招生考试,共有2000名优秀同学参加笔试,成绩均介于195分到275分之间,从中随机抽取50名同学的成绩进行统计,将统计结果按如下方式分成8组:

第1组[195,205),第2组[205,215),……,第8组[265,275].如图是按上述分组方法得到的频率分布直方图,且笔试成绩在260分(含260分)以上的同学进入面试.

(1)估计所有参加笔试的2000名同学中,参加面试的同学人数;

(2)面试时,每位同学抽取两个问题,若两个问题全答错,则不能取得该校的自主招生资格;若两个问题均回答正确且笔试成绩在270分以上,则获A类资格;其他情况下获B类资格.现已知某中学有两人获得面试资格,且仅有一人笔试成绩为270分以上,在回答两个面试问题时,两人对每一个问题正确回答的概率均为

,求恰有一名同学获得该高校B类资格的概率.

思维启迪 

(1)据频率分布直方图,先计算成绩在260分以上的同学的概率,再确定面试方面的人数;

(2)列举两名同学的所有答题情况.

解 

(1)设第i(i=1,2,…,8)组的频率为fi,则由频率分布直方图知f7=1-(0.004+0.01+0.01+0.02+0.02+0.016+0.008)×10=0.12.

所以成绩在260分以上的同学的概率P≈

+f8=0.14,2000×0.14=280,

故这2000名同学中,取得面试资格的约为280人.

(2)不妨设两名同学分别为M、N,且M的笔试成绩在270分以上,则对于M,答题的可能有M11,M10,M01,M00,对于N,答题的可能有N11,N10,N01,N00,其中角标中的1表示正确,0表示错误,如N10表示N同学第一题正确,第二题错误.

将两名同学的答题情况列表如下:

M11

M10

M01

M00

N11

AB

BB

BB

CB

N10

AB

BB

BB

CB

N01

AB

BB

BB

CB

N00

AC

BC

BC

CC

表中AB表示M获A类资格,N获B类资格;

BC表示M获B类资格,N没有获得资格.

所以恰有一名同学获得该高校B类资格的概率为

.

思维升华 解概率统计的综合问题的关键是从文字语言中提取数学信息,找出概率问题中的基本事件,列举基本事件总数,再利用古典概型的解法求解概率.

某企业为了增强自身竞争力,计划对职工进行技术培训,以提高产品的质量,为了解某车间对技术培训的态度与性别的关系,对该车间所有职工进行了问卷调查得到了如下的列联表:

赞成

不赞成

合计

男职工

22

8

30

女职工

8

12

20

合计

30

20

50

(1)用分层抽样的方法在不赞成的职工中抽5人进行调查,其中男职工、女职工各抽取多少人?

(2)在上述抽取的5人中选2人,求至少有一名男职工的概率.

解 

(1)在不赞成的职工中抽5人,

则抽取比例为

所以男职工应该抽取8×

=2(人),女职工应该抽取12×

=3(人).

(2)上述抽取的5人中,男职工2人记为a,b,女职工3人记为c,d,e,则从5人中选2人的所有情况为(a,b),(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),(c,d),(c,e),(d,e),共10种情况.

其中至少有一名男职工的情况有(a,b),(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),共7种情况.

故从上述抽取的5人中选2人,至少有一名男职工的概率为P=

.

1.随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体中的个体数量明显较多时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽样.系统抽样最重要的特征是“等距”,分层抽样最重要的是各层的“比例”.

2.用样本估计总体

(1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为1.

(2)众数、中位数及平均数的异同:

众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.

(3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布.

①总体期望的估计,计算样本平均值

xi.②总体方差(标准差)的估计:

方差=

(xi-

)2,标准差=

,方差(标准差)较小者较稳定.

真题感悟

1.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:

cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.

答案 24

解析 底部周长在[80,90)的频率为0.015×10=0.15,

底部周长在[90,100)的频率为0.025×10=0.25,

样本容量为60,所以树木的底部周长小于100cm的株数为(0.15+0.25)×60=24.

2.(2014·重庆)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:

分)

甲组

乙组

9

0

9

x

2

1

5

y

8

7

4

2

4

已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为________.

答案 5,8

解析 由于甲组中有5个数,比中位数小的有两个数为9,12,比中位数大的也有两个数24,27,所以10+x=15,x=5.又因

=16.8,所以y=8.

押题精练

1.某教育出版社在高三期末考试结束后,从某市参与考试的考生中选取600名学生对在此期间购买教辅资料的情况进行调研,得到如下数据:

购买图

书情况

只买试题类

只买讲解类

试题类和讲解类都买

人数

240

200

160

若该教育出版社计划用分层抽样的方法从这600人中随机抽取60人进行座谈,则只买试题类的学生应抽取的人数为________.

答案 24

解析 只买试题类的学生应抽取的人数为60×

=24.

2.某地区对某路段公路上行驶的汽车速度实施监控,从中抽取50辆汽车进行测速分析,得到如图所示的时速的频率分布直方图,根据该图,时速在70km/h以下的汽车有________辆.

答案 20

解析 时速在70km/h以下的汽车所占的频率为0.01×10+0.03×10=0.4,共有0.4×50=20(辆).

3.如图是一次选秀节目上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数为85,则a2+b2的最小值是________.

答案 32

解析 方法一 根据题意,得

=5,得a+b=8,则b=8-a,a2+b2=a2+(8-a)2=2a2-16a+64,其中a,b满足0≤a≤9,0≤b≤9,所以0≤a≤9,0≤8-a≤9,即0≤a≤8且a是整数.设函数f(a)=2a2-16a+64,分析知当a=4时,f(a)取得最小值32,所以a2+b2的最小值是32.

方法二 由a+b=8,且a,b≥0,得8≥2

,故ab≤16,则a2+b2=(a+b)2-2ab≥64-32=32,当且仅当a=b=4时等号成立,所以a2+b2的最小值是32.

(推荐时间:

50分钟)

一、填空题

1.(2014·湖南)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则p1,p2,p3的大小关系是________.

答案 p1=p2=p3

解析 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3.

2.某中学高中一年级有400人,高中二年级有320人,高中三年级有280人,现从中抽取一个容量为200人的样本,则高中二年级被抽取的人数为________.

答案 64

解析 由已知,得样本容量为400+320+280=1000,

所以,高中二年级被抽取的人数为

×320=64.

3.(2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为________.

7816

6572

0802

6314

0702

4369

9728

0198

3204

9234

4935

8200

3623

4869

6938

7481

答案 01

解析 从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:

08,02,14,07,01,所以第5个个体编号为01.

4.为了了解某城市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为120,则抽取的学生人数是_____________________________________________.

答案 480

解析 由频率分布直方图知:

学生的体重在65~75kg的频率为(0.0125+0.0375)×5=0.25,

则学生的体重在50~65kg的频率为1-0.25=0.75.

从左到右第2个小组的频率为0.75×

=0.25.

所以抽取的学生人数是120÷0.25=480.

5.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:

学生

1号

2号

3号

4号

5号

甲班

6

7

7

8

7

乙班

6

7

6

7

9

以上两组数据的方差中较小的一个为s2,则s2=______________________________________

__________________________________.

答案 

解析 

甲=7,s2甲=

×[(6-7)2+(7-7)2+(7-7)2+(8-7)2+(7-7)2]=

乙=7,s

×[(6-7)2+(7-7)2+(6-7)2+(7-7)2+(9-7)2]=

所以s

.

由两组数据中方差较小的一个为s2,即s2=

.

6.超速行驶已成为马路上最大杀手之一,已知某路段属于限速路段,规定通过该路段的汽车时速不超过70km/h,否则视为违规.某天,有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图如图所示,则违规的汽车大约有________辆.

答案 110

解析 由题意,知时速超过70km/h的为违规汽车,由频率分布直方图可以得出超过70km/h的频率为0.011×10=0.11,所以违规的汽车大约有1000×0.11=110(辆).

7.某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,并用茎叶图表示出了两组数据,对两块地抽取树苗的高度的平均数

甲,

乙和中位数y甲,y乙进行比较,结论是____________________.

答案 

甲<

乙,y甲

8.从某中学高一年级中随机抽取100名同学,将他们的成绩(单位:

分)数据绘制成频率分布直方图(如图).则这100名学生成绩的平均数、中位数分别为________.

答案 125,124

解析 由图可知(a+a-0.005)×10=1-(0.010+0.015+0.030)×10,解得a=0.025,则

=105×0.1+115×0.3+125×0.25+135×0.2+145×0.15=125.中位数在120~130之间,设为x,则0.01×10+0.03×10+0.025×(x-120)=0.5,解得x=124.

9.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是__________.

答案 1

解析 当x≥4时,

≠91,

∴x<4,∴

=91,

∴x=1.

10.(2013·辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.

答案 10

解析 设5个班级中参加的人数分别为x1,x2,x3,x4,x5,则由题意知

=7,

(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=20,

五个整数的平方和为20,则必为0+1+1+9+9=20,

由|x-7|=3可得x=10或x=4.

由|x-7|=1可得x=8或x=6.

由上可知参加的人数分别为4,6,7,8,10,

故最大值为10.

二、解答题

11.为了了解2014年某校高三学生的视力情况,随机抽查了一部分学生的视力,将调查结果分组,分组区间为(3.9,4.2],(4.2,4.5],…,(5.1,5.4].经过数据处理,得到如下频率分布表:

分组

频数

频率

(3.9,4.2]

3

0.06

(4.2,4.5]

6

0.12

(4.5,4.8]

25

x

(4.8,5.1]

y

z

(5.1,5.4]

2

0.04

合计

n

1.00

(1)求频率分布表中未知量n,x,y,z的值;

(2)从样本中视力在(3.9,4.2]和(5.1,5.4]的学生中随机抽取2人,求2人的视力差的绝对值低于0.5的概率.

解 

(1)由表,可知样本容量为n,由

=0.04,得n=50.

所以x=

=0.5,y=50-3-6-25-2=14,z=

=0.28.

(2)设样本中视力在(3.9,4.2]的3人为a,b,c,

样本视力在(5.1,5.4]的2人为d,e.

由题意得从5人任取2人的所有基本事件有:

(a,d),(a,e),(b,d),(b,e),(c,d),(c,e),(a,b),(a,c),(b,c),(d,e)共10个.

设事件A表示“抽取的2人视力差的绝对值低于0.5”,则事件A包括4个基本事件.

(a,b),(a,c),(b,c),(d,e).所以P(A)=

.

故抽取的2人的视力差的绝对值低于0.5的概率为

.

12.某驾校在招收新学员时,从一批报名者中随机抽取了10名,用对数视力表检查得到每个学员视力状况的茎叶图(小数点前一位的数字为茎,小数点后一位的数字为叶),如图所示.若视力不低于5.0,则称该学员“视力过关”.

(1)若该组数据的平均数为4.82,求其中位数;

(2)若从这10人中随机选取2人,求至少有1人视力过关的概率.

解 

(1)由茎叶图,知该组数据的平均数为

=4.82.解得x=9.

所以该组数据的中位数为

=4.85.

(2)记视力不过关的人为1,2,3,4,5,6,视力过关的人为a,b,c,d.则事件的总体结果为

(1,2),(1,3),(1,4),(1,5),(1,6),(1,a),(1,b),(1,c),(1,d),共9种(其中至少一人过关的有4种);

(2,3),(2,4),(2,5),(2,6),(2,a),(2,b),(2,c),(2,d),共8种(其中至少一人过关的

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 党团工作 > 入党转正申请

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1