全国通用版版高考数学大一轮复习第十章算法初步统计统计案例第55讲用样本估计总体优选学案05083141Word格式.docx
《全国通用版版高考数学大一轮复习第十章算法初步统计统计案例第55讲用样本估计总体优选学案05083141Word格式.docx》由会员分享,可在线阅读,更多相关《全国通用版版高考数学大一轮复习第十章算法初步统计统计案例第55讲用样本估计总体优选学案05083141Word格式.docx(20页珍藏版)》请在冰豆网上搜索。
中位数
把一组数据按__从小到大的__顺序排列,处在__中间__位置的一个数据(或两个数据的平均数)
中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平均数
如果有n个数据x1,x2,…,xn,那么这n个数的平均数
=__
__
平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低
(2)标准差、方差
①标准差:
样本数据到平均数的一种平均距离,一般用s表示,s=__
__.
②方差:
标准差的平方
s2=__
[(x1-
)2+(x2-
)2+…+(xn-
)2] __,
其中xi(i=1,2,3,…,n)是__样本数据__,n是__样本容量__,
是__样本平均数__.
(3)平均数、方差公式的推广
若数据x1,x2,…,xn的平均数为
,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m
+a,方差为m2s2.
1.思维辨析(在括号内打“√”或“”).
(1)在频率分布直方图中,小矩形的高表示频率.( ×
)
(2)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( ×
(3)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ )
(4)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( ×
(5)一组数据的方差越大,说明这组数据的波动越大.( √ )
解析
(1)错误.在频率分布直方图中,小矩形的高为频率/组距.
(2)错误.茎叶图中,相同的数据要重复记,故错误.
(3)正确.由众数概念知结论正确.
(4)错误.在频率分布直方图中,中位数左边和右边的小长方形面积和相等,故错误.
(5)正确.由方差定义知结论正确.
2.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( A )
8
9
7
3
1
6
4
2
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
解析 将这组数据从小到大排列,得87,89,90,91,92,93,94,96.故中位数为
=91.5,
平均数为
=
=91.5.
3.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民数有__25__人.
解析 由图可知,在[2,2.5)范围内的居民人数有100×
0.5×
(2.5-2)=25.
4.一个容量为200的样本的频率分布直方图如图所示,则样本数据落在[5,9)内的频率和频数分别为__0.2,40__.
解析 由图可知,落在[5,9)内的频率为0.05×
(9-5)=0.2,频数为200×
0.2=40.
5.某赛季甲、乙两名篮球运动员每场比赛得分记录用茎叶图表示,从茎叶图的分布情况看,__乙__运动员的发挥更稳定.
甲
乙
5
解析 由茎叶图可知,乙运动员的得分大部分集中在30~40之间,而甲运动员的得分相对比较分散且在低分区的较多,故乙比赛得分更稳定.
一 频率分布直方图及其应用
(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.
(2)已知频率分布直方图,求某种范围内的数据,可利用图形及已知范围结合求解.
【例1】(2018·
河北衡水一中测试)某市为了制定合理的节电方案,对居民用电情况进行了调查,通过抽样,获得了某年200户居民每户的月均用电量(单位:
百千瓦·
时),将数据按[0,1),[1,2),[2,3),[3,4),[4,5),[5,6),[6,7),[7,8),[8,9]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中m的值;
(2)设该市有100万户居民,估计全市每户居民中月均用电量不低于6百千瓦·
时的户数及每户居民月均用电量的中位数;
(3)政府计划对月均用电量在4百千瓦·
时以下的用户进行奖励,月均用电量在[0,1)内的用户奖励20元/月,月均用电量在[1,2)内的用户奖励10元/月,月均用电量在[2,4)内的用户奖励2元/月.若该市共有400万户居民,试估计政府执行此计划的年度预算.
解析
(1)由题得1-1×
(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=2m,所以m=0.15.
(2)200户居民中月均用电量不低于6百千瓦·
时的频率为0.06+0.04+0.02=0.12,100万户居民中月均用电量不低于6百千瓦·
时的户数有1000000×
0.12=120000.
设中位数是x百千瓦·
时,
因为前5组的频率之和0.04+0.08+0.15+0.21+0.25=0.73>
0.5,而前4组的频率之和0.04+0.08+0.15+0.21=0.48<
0.5,所以4<
x<
5.
由x-4=
,解得x=4.08.
(3)该市月均用电量在[0,1),[1,2),[2,4)内的用户数分别为20000×
8,20000×
16,20000×
72,所以每月预算为20000×
(8×
20+16×
10+72×
2)=20000×
464(元),故估计政府执行此计划的年度预算为20000×
464×
12=11136(万元).
二 茎叶图及其应用
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;
第二点是茎叶图便于记录和表示;
其缺点是当样本容量较大时,作图较繁琐.
【例2】某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下.
甲部门
乙部门
59
0448
97
122456677789
97665332110
011234688
98877766555554443332100
00113449
6655200
123345
632220
011456
10
000
(1)分别估计该市的市民对甲、乙两部门评分的中位数;
(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;
(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.
解析
(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.
50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为
=67,所以该市的市民对乙部门评分的中位数的估计值是67.
(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的频率分别为
=0.1,
=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.
(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.
三 样本的数字特征及其应用
平均数和方差都是重要的数字特征,是对总体的一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小.
【例3】甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是
甲:
8,6,7,8,6,5,9,10,4,7;
乙:
6,7,7,8,6,7,8,7,9,5.
(1)分别计算两组数据的平均数;
(2)分别计算两组数据的方差;
(3)根据计算结果,估计一下两名战士的射击水平谁更好一些.
解析
(1)
甲=
(8+6+7+8+6+5+9+10+4+7)=7,
乙=
(6+7+7+8+6+7+8+7+9+5)=7.
(2)由方差公式s2=
[(x1-
)2]可求得s
=3.0,s
=1.2.
(3)由
乙,说明甲、乙两战士的平均水平相当.
又∵s
>s
,说明甲战士射击情况波动大,因此乙战士比甲战士射击情况稳定.
1.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:
分).
甲组
乙组
x
y
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( C )
A.2,5 B.5,5
C.5,8 D.8,8
解析 由茎叶图及已知得x=5,又乙组数据的平均数为16.8,即
=16.8,解得y=8.
2.某电子商务公司对10000名网络购物者2017年度的消费情况进行统计,发现消费金额(单位:
万元)都在区间[0.3,0.9],其频率分布直方图如图所示.
(1)直方图中的a=__3__;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为__6_000__.
解析 由频率分布直方图及频率和等于1可得(0.2+0.8+1.5+2+2.5+a)×
0.1=1,解得a=3.于是消费金额在区间[0.5,0.9]内的频率为(3+2+0.8+0.2)×
0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×
10000=6000,故应填3,6000.
3.
(1)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:
℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的编号为( B )
A.①③ B.①④
C.②③ D.②④
(2)由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为__1,1,3,3__(从小到大排列).
解析
(1)由茎叶图中的数据通过计算求得
甲=29,
乙=30,s甲=
,s乙=
,∴
甲<
乙,s甲>s乙,故①④正确.故选B.
(2)不妨设x1≤x2≤x3≤x4,x1,x2,x3,x4∈N*,
依题意得x1+x2+x3+x4=8,
s=
=1,
即(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2=4,所以x4≤3,
结合x1+x2+x3+x4=8及中位数都是2,
可得x1=x2=1,x3=x4=3,则这组数据为1,1,3,3.
4.(2017·
北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:
[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图.
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
解析
(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×
10=0.6,所以样本中分数小于70的概率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.
(2)根据题意,样本中分数不小于50的概率为(0.01+0.02+0.04+0.02)×
10=0.9,
分数在区间[40,50)内的人数为100-100×
0.9-5=5.
所以总体中分数在区间[40,50)内的人数估计为400×
=20.
(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×
10×
100=60,
所以样本中分数不小于70的男生人数为60×
=30.
所以样本中的男生人数为30×
2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.
错因分析:
①不会计算中位数;
②对平均数、中位数、众数等数字特征的实际意义理解不透.
【例1】从高三年级中抽出50名学生参加竞赛,由成绩得到如下的频率分布直方图.
利用频率分布直方图估计:
(1)这50名学生的众数P与中位数M;
(2)这50名学生的平均成绩A;
(3)这50名学生60分以上所占的百分比是多少?
解析
(1)根据频率分布直方图,得这50名学生的众数是
P=
=75.
∵(0.004+0.006+0.02+0.03)×
10=0.6,
∴中位数应位于第四个小矩形中,
设其底边为x,高为0.03,则0.03x=0.2,∴x=
,
∴中位数M=
.
(2)这50名学生的平均成绩是
(45×
0.004+55×
0.006+65×
0.02+75×
0.03+85×
0.024+95×
0.016)×
10=76.2.
(3)这50名学生中60分以上的百分比是1-(0.004+0.006)×
10=0.9=90%.
【跟踪训练1】
(1)(2017·
全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:
kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( B )
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
(2)(2018·
四川成都双流中学月考)若样本平均数为
,总体平均数为μ,则( D )
A.
=μ B.
与μ无关
C.μ是
的估计值 D.
是μ的估计值
(3)(2018·
福建三明一中期中)已知一组数据m,4,2,5,3的平均数为n,且m,n是方程x2-4x+3=0的两根,则这组数据的方差为( B )
B.2
C.
D.10
解析
(1)标准差能反映一组数据的稳定程度.故选B.
(2)样本平均数为
,总体平均数为μ,在统计学中利用样本数据估计总体数据,所以样本平均数
是总体平均数μ的估计值.故选D.
(3)根据题意,可得
×
(m+4+2+5+3)=n,
化简可得m=5n-14,①
因为m,n是方程x2-4x+3=0的两根,所以m+n=4,②
联立①②解得
所以s2=
[(1-3)2+(4-3)2+(2-3)2+(5-3)2+(3-3)2]=2.故选B.
课时达标 第55讲
[解密考纲]用样本估计总体在高考中三种题型均有可能考查,作为解答题时,题目较简单,属于不能失分的题目.
一、选择题
1.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( B )
A.45 B.50
C.55 D.60
解析 根据频率分布直方图,低于60分的同学所占频率为(0.005+0.01)×
20=0.3,故该班的学生人数为
=50.故选B.
2.(2017·
山东卷)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:
件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( A )
A.3,5 B.5,5
C.3,7 D.5,7
解析 根据两组数据的中位数相等可得65=60+y,解得y=5,又因为它们的平均值相等,所以
,解得x=3.故选A.
3.如图是某工厂对一批新产品长度(单位:
mm)检测结果的频率分布直方图,估计这批产品的中位数为( C )
A.20 B.25
C.22.5 D.22.75
解析 产品的中位数出现在概率是0.5的地方.自左至右各小矩形面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x,则由0.1+0.2+0.08·
(x-20)=0.5,得x=22.5.故选C.
4.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有( D )
A.a>
b>
c B.b>
c>
a
C.c>
a>
b D.c>
a
解析 平均数a=
(15+17+14+10+15+17+17+16+14+12)=14.7,中位数b=15,众数c=17,∴c>
a.
5.如图是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,若80分以上为优秀,根据图形信息可知,这次考试的优秀率为( B )
A.25% B.30%
C.35% D.40%
解析 80分以上的频率为(0.025+0.005)×
10=0.3.
6.下面左图是某学习小组学生数学考试成绩的茎叶图,1号到16号同学的成绩依次为A1,A2,…,A16,右图是统计茎叶图中成绩在一定范围内的学生人数的算法流程图,那么该算法流程图输出的结果是( B )
A.6 B.10
C.91 D.92
解析 由算法流程图可知,其统计的是数学成绩大于等于90的人数,所以由茎叶图知,数学成绩大于等于90的人数为10,因此输出结果为10.故选B.
二、填空题
7.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:
cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在60株树木中底部周长小于100cm的株数为__24__.
解析 由题意,在抽测的60株树木中,底部周长小于100cm的株数为(0.015+0.025)×
60=24.
8.如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为__6.8__.
解析 ∵
=11,
∴s2=
=6.8.
9.为了调查某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为__10__.
解析 设5个班级的人数分别为x1,x2,x3,x4,x5,
则
=7,
=4,
即5个整数平方和为20,最大的数比7大但与7的差值不能大于或等于4,否则方差大于4,故最大值为10,最小值为4.
三、解答题
10.随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:
件),获得数据如下:
30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.
根据上述数据得到样本的频率分布表如下.
分组
频数
频率
[25,30]
0.12
(30,35]
0.20
(35,40]
0.32
(40,45]
n1
f1
(45,50]
n2
f2
(1)确定样本频率分布表中n1,n2,f1和f2的值;
(2)根据上述频率分布表,画出样本频率分布直方图和频率分布折线图.
解析
(1)由所给数据知,落在区间(40,45]内的有7个,落在(45,50]内的有2个,故n1=7,n2=2,
所以f1=
=0.28,f2=
=0.08.
(2)样本频率分布直方图和频率分布折线图如图所示.
11.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:
(1)求分数在[50,60]内的频率及全班人数;
(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.
解析
(1)分数在[50,60]的频率为0.008×
10=0.08.由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为
=25.
(2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为
÷
10=0.016.
12.(2018·
安徽合肥三中入学考试)为参