培优导学计划高中数学 必修3 苏教版 第二章 统计 231.docx
《培优导学计划高中数学 必修3 苏教版 第二章 统计 231.docx》由会员分享,可在线阅读,更多相关《培优导学计划高中数学 必修3 苏教版 第二章 统计 231.docx(18页珍藏版)》请在冰豆网上搜索。
培优导学计划高中数学必修3苏教版第二章统计231
§2.3 总体特征数的估计
2.3.1 平均数及其估计
学习目标
1.了解平均数为什么是“最理想”的近似值.2.会计算一组数据的平均数.3.会根据频率分布表或频率分布直方图估计平均数.
知识点一 平均数
思考 处理实验数据的原则是使近似值与实验数据越接近越好.但是实验数据往往很多,怎么刻画“最近”呢?
答案 设近似值为x,实验数据为ai(i=1,2,…,n),因为x-ai有正有负,故用(x-a1)2+(x-a2)2+…+(x-an)2来刻画近似值与实验数据最接近.
梳理
(1)一般地,使(x-a1)2+(x-a2)2+…+(x-an)2=nx2-2(a1+a2+…+an)x+a
+a
+…+a
,最小的x=
称为这个n个数据a1,a2,…,an的平均数或均值.
(2)n个数据a1,a2,a3,…,an的平均数
=
.
知识点二 平均数的估计
思考 在频率分布表里,还能看到原始数据吗?
怎样根据频率分布表计算平均数?
答案 在频率分布表里,已看不到原始数据,但可用各区间的组中值近似地表示.
梳理 一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均数为
=x1p1+x2p2+…+xnpn.
知识点三 总体特征数
1.总体特征数的定义
在数学中,通常把能反映总体某种特征的量称为总体特征数.
2.常见的总体特征数
(1)众数:
一组数据中出现次数最多的数.
(2)中位数:
一组数据按大小顺序排列后,处于中间位置的数.如果数据的个数是偶数,则取中间两个数的平均数.
(3)平均数:
n个数据x1,x2,x3,…,xn,则平均数
=
.
1.中位数是一组数据中间的数.( × )
2.众数是一组数据中出现次数最多的数.( √ )
3.如果在n个数据中,x1,x2,…,xn出现的频率分别为f1,f2,…,fn,则
=
.( × )
类型一 平均数的计算
例1 一个球队所有队员的身高如下(单位:
cm):
178,179,181,182,176,183,176,180,183,175,181,185,180,184,问这个球队的队员平均身高是多少?
(精确到1cm)
解 方法一 利用平均数的公式计算.
=
×(178+179+181+…+180+184)
=
×2523≈180(cm).
方法二 取a=180,将上面各数据同时减去180,得到一组新数据:
-2,-1,1,2,-4,3,-4,0,3,-5,1,5,0,4.
′=
×(-2-1+1+2-4+3-4+0+3-5+1+5+0+4)=
×3=
≈0.2,
∴
=
′+a=0.2+180≈180(cm).
反思与感悟
(1)在一般情况下,要计算一组数据的平均数可使用“方法一”这个公式.
(2)当数据较大,且大部分数据在某一常数左、右波动时,“方法二”可以减少运算量,故此法比较简便.
跟踪训练1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:
成绩(单位:
m)
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数
2
3
2
3
4
1
1
1
求这些运动员成绩的平均数.
解 平均数是
=
(1.50×2+1.60×3+1.65×2+1.70×3+1.75×4+1.80×1+1.85×1+1.90×1)=
≈1.69(m).
类型二 利用频率分布表或直方图估计平均数
例2 下面是某校学生日睡眠时间(单位:
h)的抽样频率分布表,试估计该校学生的日平均睡眠时间.
睡眠时间
人数
频率
[6,6.5)
5
0.05
[6.5,7)
17
0.17
[7,7.5)
33
0.33
[7.5,8)
37
0.37
[8,8.5)
6
0.06
[8.5,9]
2
0.02
合计
100
1
解 方法一 总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h).
故平均睡眠时间约为7.39h.
方法二 求组中值与对应频率之积的和.
6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h).
答 估计该校学生的日平均睡眠时间约为7.39h.
反思与感悟 一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均数为x1p1+x2p2+…+xnpn.
跟踪训练2 一批乒乓球,随机抽取100个进行检查,球的直径频率分布直方图如图.试估计这个样本的平均数.
解 平均数为39.96×0.1+39.98×0.2+40×0.5+40.02×0.2=39.996.
类型三 众数、中位数、平均数的简单应用
例3 某公司的33名职工的月工资(单位:
元)如下表:
职位
董事长
副董事长
董事
总经理
经理
管理员
职员
人数
1
1
2
1
5
3
20
工资
5500
5000
3500
3000
2500
2000
1500
(1)求该公司职工月工资的平均数、中位数、众数;
(2)若董事长、副董事长的工资分别从5500元、5000元提升到30000元、20000元,那么公司职工的月工资的新的平均数、中位数和众数又是什么?
(3)你认为哪个统计量更能反映这个公司职工的工资水平?
解
(1)公司职工月工资的平均数为
=
=
≈2091(元).
若把所有数据从大到小排序,则得到中位数是1500元,众数是1500元.
(2)若董事长、副董事长的工资提升后,职工月工资的平均数为
=
=
≈3288(元).
中位数是1500元,众数是1500元.
(3)在这个问题中,中位数和众数都能反映出这个公司职工的工资水平,因为公司少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司职工的工资水平.
反思与感悟 如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.
跟踪训练3 今年西南一地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如表所示:
(月均用水量的单位:
吨)
月均用水量分组
频数
频率
[0.5,2.5)
12
[2.5,4.5)
[4.5,6.5)
40
[6.5,8.5)
0.18
[8.5,10.5]
6
合计
100
1
(1)请完成该频率分布表,并画出相对应的频率分布直方图和频率分布折线图;
(2)估计样本的中位数是多少?
(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1200户,请估计上级支援该乡的月调水量是多少吨?
解
(1)频率分布表与相应的频率分布直方图和频率分布折线图如下:
月均用水量分组
频数
频率
[0.5,2.5)
12
0.12
[2.5,4.5)
24
0.24
[4.5,6.5)
40
0.40
[6.5,8.5)
18
0.18
[8.5,10.5]
6
0.06
合计
100
1
(2)设中位数为x,因为月均用水量在[0.5,4.5)内的频率是(0.06+0.12)×2=0.36,月均用水量在[0.5,6.5)内的频率是(0.06+0.12+0.20)×2=0.76,
所以x∈[4.5,6.5),则(x-4.5)×0.20=0.5-0.36,
解得x=5.2.
故样本的中位数是5.2.
(3)该乡每户月均用水量估计为
1.5×0.12+3.5×0.24+5.5×0.40+7.5×0.18+9.5×0.06=5.14(吨).
5.14×1200=6168(吨).
所以估计上级支援该乡的月调水量是6168吨.
1.下列说法错误的是________.(填序号)
①在统计里,把所需考察对象的全体叫作总体;
②一组数据的平均数一定大于这组数据中的每个数据;
③平均数、众数与中位数从不同的角度描述了一组数据的集中趋势;
④众数是一组数据中出现次数最多的数.
答案 ②
解析 平均数不大于最大值,不小于最小值.
2.下面是高一八班十位同学的数学测试成绩:
82,91,73,84,98,99,101,118,98,110,则该组数据的中位数是________.
答案 98
解析 将这组数据按从小到大排列为73,82,84,91,98,98,99,101,110,118,则最中间的两个数为98,98,故中位数是
(98+98)=98.
3.一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x为________.
答案 21
解析 数据个数为偶数时,中位数为中间两数的平均值
=22,所以x=21.
4.某高校有甲,乙两个数学建模兴趣班,其中甲班40人,乙班50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是______分.
答案 85
解析 平均成绩为
=85(分).
5.样本容量为100的频率分布直方图如图所示,根据样本频率分布直方图,则平均数为________.
答案 14.84
解析 平均数
=10×0.06+12×0.1+14×0.4+16×0.24+18×0.2=14.84.
1.能反映总体某种特征的量称为总体特征数,如平均数,中位数,使总体特征数通常难以获得,故常以样本特征数估计总体特征数.
2.平均数是离差的平方和最小的近似值,计算器、计算机均有专门的程序,手工计算要细致,不要漏加或重复.
3.若数据xi的频率为pi(i=1,2,…,n),则
=
ipi,该值公式可以用在频率分布表中估计平均数.
一、填空题
1.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数为________.
答案 87
解析 平均数是
×(100+95+2×90+4×85+80+75)=87.
∴平均数是87.
2.已知一组数据为-3,5,7,x,11,且这组数据的众数为5,那么数据的中位数是________.
答案 5
解析 这组数据的众数为5,则5出现的次数最多,所以x=5,那么这组数据从小到大排列为-3,5,5,7,11,则中位数为5.
3.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则a,b,c的大小关系为________.
答案 c>b>a
解析 由题意a=
(16+18+15+11+16+18+18+17+15+13)=
=15.7,
中位数为16,众数为18,即b=16,c=18,
所以c>b>a.
4.某台机床加工的1000只产品中次品数的频率分布如下表:
次品数
0
1
2
3
4
频率
0.5
0.2
0.05
0.2
0.05
则次品数的众数,平均数依次为________.
答案 0,1.1
解析 由于次品数为0的频率最大,所以众数为0;数据xi出现的频率为pi(i=1,2,…,n),则x1,x2,…,xn的平均数为x1p1+x2p2+…+xnpn=0×0.5+1×0.2+2×0.05+3×0.2+4×0.05=1.1.
5.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差为________.
答案 -3
解析 少输入90,
=3,平均数少3,求出的平均数减去实际的平均数等于-3.
6.有容量为100的样本,数据分组及各组的频数、频率如下:
[12.5,14.5),6,0.06;[14.5,16.5),16,0.16;[16.5,18.5),18,0.18;[18.5,20.5),22,0.22;[20.5,22.5),20,0.20;[22.5,24.5),10,0.10;[24.5,26.5),8,0.08.则估计总体的平均数为________.
答案 19.42
解析 由于每组数据是一个范围,所以可以用组中值近似地表示平均数.
方法一 总体的平均数约为
(13.5×6+15.5×16+17.5×18+19.5×22+21.5×20+23.5×10+25.5×8)=19.42.
故总体的平均数约为19.42.
方法二 组中值与对应频率积的和为13.5×0.06+15.5×0.16+17.5×0.18+19.5×0.22+21.5×0.20+23.5×0.10+25.5×0.08=19.42.
故总体的平均数约为19.42.
7.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
则估计高一参赛学生的成绩的众数、中位数分别为________,________.
答案 65 65
解析 由图可知众数为65,
又∵第一个小矩形的面积为0.3,
∴设中位数为60+x,
则0.3+x×0.04=0.5,得x=5,
∴中位数为60+5=65.
8.已知样本数据x1,x2,…,x10,其中x1,x2,x3的平均数为a,x4,x5,x6,…,x10的平均数为b,则样本数据的平均数为________.
答案
解析 前3个数据的和为3a,后7个数据的和为7b,样本平均数为10个数据的和除以10.
9.某商店的大米价格是3.00元/千克,面粉价格是3.60元/千克,大米与面粉的销量分别是1000千克,500千克,则该商店出售的粮食的平均价格是______元/千克.
答案 3.20
解析 平均价格为
(3.60×500+3.00×1000)=1.20+2.00=3.20(元/千克).
10.若有一个企业,70%的员工年收入1万,25%的员工年收入3万,5%的员工年收入11万,则该企业员工的年收入的平均数是________万,中位数是________万,众数是________万.
答案 2 1 1
解析 年收入的平均数是1×70%+3×25%+11×5%=2(万).中位数与众数都是1万.
11.某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共抽取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980h,1020h,1032h,则抽取的100件产品的使用寿命的平均值为________h.
答案 1013
解析 依题意可知平均数
=
=1013(h).
二、解答题
12.某地区全体九年级的3000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:
100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.
请根据以上数据估计该地区3000名学生的平均分、合格率(60或60分以上均属合格).
解 平均分为
=79.40(分),
(12+30+18+24+12)÷100=96%,
所以样本的平均分是79.40分,合格率是96%,由此来估计总体3000名学生的平均分是79.40分,合格率是96%.
13.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:
h),试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2
3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1
2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3
1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2
2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?
(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?
解
(1)
A=
(0.6+1.2+2.7+1.5+2.8+1.8+2.2+2.3+3.2+3.5+2.5+2.6+1.2+2.7+1.5+2.9+3.0+3.1+2.3+2.4)=2.3(h).
B=
(3.2+1.7+1.9+0.8+0.9+2.4+1.2+2.6+1.3+1.4+1.6+0.5+1.8+0.6+2.1+1.1+2.5+1.2+2.7+0.5)=1.6(h).
从计算结果看,A药服用者的睡眠时间增加的平均数大于服用B药的,所以A药的疗效更好.
(2)
从茎叶图看,A药的疗效更好.
三、探究与拓展
14.某班有四个学习小组,各小组人数分别为10,10,x,8,已知这组数据的中位数与平均数相等,求这组数据的中位数.
解 该组数据的平均数为
(10+10+x+8)=
(28+x),中位数是这4个数按从小到大的顺序排列后处在最中间两个数的平均数.
(1)当x≤8时,原数据从小到大排序为x,8,10,10,中位数是9,由
(28+x)=9,得x=8,符合题意,此时中位数是9;
(2)当8<x≤10时,原数据从小到大排序为8,x,10,10,中位数是
(x+10),由
(28+x)=
(10+x),得x=8,与8<x≤10矛盾,舍去;
(3)当x>10时,原数据从小到大排序为8,10,10,x,中位数是10,由
(28+x)=10,得x=12,符合题意,此时中位数是10.
综上所述,这组数据的中位数是9或10.
15.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:
吨),将数据按照[0,0.5),[0.5,1)…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由;
(3)估计居民月均用水量的中位数.
解
(1)由频率分布直方图,可知:
月均用水量在[0,0.5)的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)
=0.5×a+0.5×a,
解得a=0.30.
(2)由
(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.
(3)设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.
所以2≤x<2.5.
由0.50×(x-2)=0.5-0.48,解得x=2.04.
故可估计居民月均用水量的中位数为2.04吨.