用样本估计总体知识讲解教学教材.docx

上传人:b****6 文档编号:4118026 上传时间:2022-11-28 格式:DOCX 页数:15 大小:143.56KB
下载 相关 举报
用样本估计总体知识讲解教学教材.docx_第1页
第1页 / 共15页
用样本估计总体知识讲解教学教材.docx_第2页
第2页 / 共15页
用样本估计总体知识讲解教学教材.docx_第3页
第3页 / 共15页
用样本估计总体知识讲解教学教材.docx_第4页
第4页 / 共15页
用样本估计总体知识讲解教学教材.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

用样本估计总体知识讲解教学教材.docx

《用样本估计总体知识讲解教学教材.docx》由会员分享,可在线阅读,更多相关《用样本估计总体知识讲解教学教材.docx(15页珍藏版)》请在冰豆网上搜索。

用样本估计总体知识讲解教学教材.docx

用样本估计总体知识讲解教学教材

 

用样本估计总体知识讲解

用样本估计总体

【学习目标】

1.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.

2.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.

3.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.

4.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.

5.会用样本的基本数字特征估计总体的基本数字特征.

【要点梳理】

要点一、频率分布的概念

频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:

1.计算一组数据中最大值与最小值的差,即求极差

2.决定组距与组数

3.将数据分组

4.列频率分布表

5.画频率分布直方图

要点诠释:

频率分布直方图的特征:

1.从频率分布直方图可以清楚的看出数据分布的总体趋势.

2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.

要点二、频率分布折线图、总体密度曲线

1.频率分布折线图的定义:

连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.

2.总体密度曲线的定义:

在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.

要点诠释:

总体密度曲线能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律.

要点三、茎叶图

当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.

要点诠释:

茎叶图的特征:

(1)用茎叶图表示数据有两个优点:

一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.

(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.

要点四、众数、中位数与平均数

1.众数

一组数据中出现次数最多的数据叫做众数.如果变量是分类的,用众数是很有必要的.例如班委会要作出一项决定,考察全班同学对它赞成与否就可以用众数.

2.中位数

将一组数据从小到大依次排列,把中间数据(或中间两数据的平均数)叫做中位数.中位数把样本数据分成了相同数目的两部分.

3.平均数

样本数据的算术平均数,即

.

要点诠释:

由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.

要点五、标准差与方差

1.标准差

样本数据

的标准差的算法:

(1)算出样本数据的平均数

.

(2)算出每个样本数据与样本数据平均数的差:

(3)算出

(2)中

的平方.

(4)算出(3)中n个平方数的平均数,即为样本方差.

(5)算出(4)中平均数的算术平方根,,即为样本标准差.

其计算公式为:

2.方差

从数学的角度考虑,人们有时用标准差的平方

(即方差)来代替标准差,作为测量样本数据分散程度的工具:

要点诠释:

在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.

数据的离散值程度可以用极差、方差或标准差来描述.极差反映了一组数据变化的幅度;样本方差描述了一组数据围绕平均数波动的大小;样本方差的算术根表示样本的标准差,它也描述了数据对平均数的离散程度.

【典型例题】

类型一:

频率分布表、频率分布直方图

例1.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如下图所示).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:

(1)本次活动共有多少件作品参加评比?

(2)哪组上交的作品数最多?

有多少件?

(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?

【答案】

(1)60

(2)四组18(3)六组

【解析】

(1)依题意知第三组的频率为

∵第三组的频数为12,

∴本次活动的参评作品数为

件).

(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有

(件).

(3)第四组的获奖率是

第六组上交的作品数量为

(件),

∴第六组的获奖率为

显然第六组的获奖率较高.

【总结升华】弄清所求问题是什么,并正确地运算是做对题的关键.本题主要考查同学们对频率分布直方图的理解,只有熟悉它的特征,才能清楚数据分布的总体趋势,根据直方图反映的信息正确解题.

举一反三:

【变式1】某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如下图所示).根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生数是________.

例2.阅高考试卷有一个环节叫“试批”.某省为了了解和掌握考生的实际答卷情况,随机地抽取了100名考生的数学成绩,数据如下(单位:

分):

135981021109912111096100103

1259711711311092102109104112

1051248713197102123104104128

10912311110310592114108104102

12912697100115111106117104109

1118911012180120121104108118

12999909912112310711191100

991011169710210810195107101

1021081179911810611997126108

12311998121101113102103104108

(1)列出频率分布表;

(2)画出频率分布直方图和折线图;

(3)估计该省考生数学成绩在100~120分之间的比例;

(4)设该省有20万考生,估计该省考生数学成绩不及格的人数(满分150分,90分及以上视为及格);

(5)根据折线图估计该省考生的数学成绩在哪一个分数段的人数将会最多.

【思路点拨】理解频率分布直方图的具体含义.

【解析】100个数据中,最大值为135,最小值为80,极差为135-80=55.

把100个数据分成11组,这时组距

(1)频率分布表如下:

分组

频数

频率

[80,85)

1

0.01

0.002

[85,90)

2

0.02

0.004

[90,95)

4

0.04

0.008

[95,100)

14

0.14

0.028

[100,105)

24

0.24

0.048

[105,110)

15

0.15

0.030

[110,115)

12

0.12

0.024

[115,120)

9

0.09

0.018

[120,125)

11

0.11

0.022

[125,130)

6

0.06

0.012

[130,135]

2

0.02

0.004

合计

100

1

0.2

注:

表中加上“

”一列,这是为画频率直方图准备的,因为它是频率直方图的纵坐标.

(2)根据频率分布表中的有关信息画出频率分布直方图及折线图,见下图.

(3)从频率分布表中可知,这100名考生的数学成绩在100~120分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在100~120分之间的比例为60%(0.60=60%).

(4)100名考生中,数学成绩不及格的频率为0.01+0.02=0.03.比例为3%.

200000×3%=6000(人).

估计该省考生数学成绩不及格的有6000人.

(5)折线图的最高点位于100~105之间,据此估计该省考生的数学成绩在100~105分这个分数段的人数将会最多.

【总结升华】本例中,决定分点时,直接使用了最小值加组距,即80+5k(k=1,2,…,11),而没有把最小值减去某一个数(例如80-0.5=79.5)作为第1个分点,这是因为100个分数是明确的,即它们都在80~135之间.凡事都要具体问题具体分析,不可教条化.本例是把5分看成一个分数段,统计各段的情况.

举一反三:

【变式1】一个容量为20的样本,分组后,组距与频数如下[10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2,则样本在(-∞,50]上的频率为()

A.

B.

C.

D.

【答案】D

【解析】根据频率的计算公式频率

求解.

频率

【变式2】对某电子元件进行寿命追踪调查,情况如下:

寿命/h

100~200

200~300

300~400

400~500

500~600

个数

20

30

80

40

30

(1)列出频率分布表;

(2)画出频率分布直方图;

(3)估计该电子元件寿命在100~400h以内的占总体的比例;

(4)估计该电子元件寿命在400h以上的在总体中占的比例.

【解析】

(1)样本频率分布表如下:

寿命/h

频数

频率

100~200

20

0.10

200~300

30

0.15

300~400

80

0.40

400~500

40

0.20

500~600

30

0.15

合计

200

1

(2)频率分布直方图如下图所示;

(3)估计该电子元件寿命在100~400h以内占总体的比例为65%;

(4)估计该电子元件寿命在400h以上的在总体中占的比例为35%.

类型二:

众数、中位数、平均数

例3.据报道,某公司的33名职工的月工资(以元为单位)如下:

职务

董事长

副董事长

董事

总经理

经理

管理员

职员

人数

1

1

2

1

5

3

20

工资(元)

5500

5000

3500

3000

2500

2000

1500

(1)求该公司人员月工资的平均数、中位数、众数;(精确到元)

(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是什么?

(精确到元)

(3)你认为哪个统计量更能反映这个公司人员的工资水平?

结合此问题谈一谈你的看法.

【思路点拨】理解平均数、中位数、众数的概念.

【答案】

(1)209115001500

(2)3288(3)中位数和众数

【解析】

(1)平均数是

(元),

中位数是1500元,众数是1500元.

(2)平均数是

(元),

中位数是1500元,众数是1500元.

(3)在这个问题中,中位数和众数均能反映该公司人员的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司人员的工资水平.

【总结升华】

(1)深刻理解和把握平均数、中位数、众数在反映样本数据上的特点,结合实际情况,灵活运用.

(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各数据的重心.

举一反三:

【变式1】为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:

4:

17:

15:

9:

3,第二小组频数为12.

(1)第二小组的频率是多少?

样本容量是多少?

(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?

在这次测试中,学生跳绳次数的中位数落在哪个小组内?

请说明理由.

在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.

【答案】

(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,

因此第二小组的频率为:

又因为频率=

所以

(2)由图可估计该学校高一学生的达标率约为

(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.

类型三:

方差、标准差

例4.在一次科技知识竞赛中,两组学生的成绩如下表:

分数

50

60

70

80

90

100

人数

甲组

2

5

10

13

14

6

乙组

4

4

16

2

12

12

已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.

【解析】

(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.

(2)

[2(50-80)2+5(60-80)2+10(70-80)2+13(80-80)2+14(90-80)2+6(100-80)2]=

(2×900+5×400+10×100+13×0+14×100+6×400)=172,

(4×900+4×400+16-100+2×0+12×100+12×400)=256.

∴甲组成绩较乙组成绩稳定,故甲组成绩好些.

(3)甲、乙两组成绩的中位数、平均数都是80分,其中,甲组成绩在80分以上的有33人,乙组成绩在80分以上的有26人,从这一角度看,甲组的成绩总体较好.

(4)从成绩统计表看,甲组成绩大于或等于90分的人数为14+6=20(人),乙组成绩大于或等于90分的人数为12+12=24(人),∴乙组成绩集中在高分段的人数较多,同时,乙组得满分的人数比甲组得满分的人数多6人,从这一角度看,乙组的成绩较好

【总结升华】要正确解答这道题,首先要抓住问题中的关键词语.全方位地进行必要的计算,而不能习惯地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本例的“满分人数”;其次要在恰当地评估后,组织好正确的语言作出结论.

举一反三:

【变式1】甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从中抽测10个,它们的尺寸分别如下(单位:

mm)

甲机床:

10.210.110.09.89.9

10.39.710.09.910.1

乙机床:

10.310.49.69.910.1

10.98.99.710.210.0

分别计算上面两个样本的平均数和方差.如图纸规定零件的尺寸为10mm,从计算的结果来看哪台机床加工这种零件较合适?

【解析】

.

=0.03

=0.06

.

∴用甲机床比乙机床稳定,即用甲机床加工较合适.

类型四:

茎叶图

例5.某中学高二

(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:

甲:

95,81,75,91,86,89,71,65,76,88,94,110,107;

乙:

83,86,93,99,88,103,98,114,98,79,78,106,101.

画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.

【思路点拨】茎叶图便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据.

【答案】乙同学的成绩比较稳定

【解析】甲、乙两人数学成绩的茎叶图如图所示.

从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况,也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好.

举一反三:

【变式1】在某高中篮球联赛中,甲、乙两名运动员的得分如下:

甲:

14,17,25,26,30,31,35,37,38,39,44,48,51,53,54;

乙:

6,15,17,18,21,27,28,33,35,38,40,44,56.

(1)用茎叶图表示上面的样本数据,并求出样本数据的中位数;

(2)根据

(1)中所求的数据分析甲、乙两名运动员中哪一位发挥得更加稳定.

【解析】

(1)茎叶图如图所示.

甲运动员的中位数是37,乙运动员的中位数是28.

(2)从茎叶图上可以看出甲运动员的得分大致对称,中位数是37,乙运动员的得分也大致对称,中位数是28,因此,甲运动员发挥得比较稳定,总体得分比乙运动员高.

【变式2】随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:

cm),获得身高数据的茎叶图如图.

(1)根据茎叶图判断哪个班的平均身高较高;

(2)计算甲班的样本方差.

 

【答案】

(1)乙班

(2)57

【解析】

(1)由茎叶图可知:

甲班身高集中于

之间,

而乙班身高集中于

之间.

因此乙班平均身高高于甲班;

(2)

甲班的样本方差为:

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 政史地

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1