高考数学一轮复习 第十章 统计 102 用样本估计总体 文Word格式文档下载.docx
《高考数学一轮复习 第十章 统计 102 用样本估计总体 文Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《高考数学一轮复习 第十章 统计 102 用样本估计总体 文Word格式文档下载.docx(19页珍藏版)》请在冰豆网上搜索。
)
(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( ×
(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ )
(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( ×
1.(2015·
陕西改编)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为________.
答案 137
解析 由题干扇形统计图可得该校女教师人数为:
110×
70%+150×
(1-60%)=137.
2.
若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是__________.
答案 91.5和91.5
解析 ∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数为×
(91+92)=91.5.
平均数为×
(87+89+90+91+92+93+94+96)=91.5.
3.在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是________.
答案 总体
解析 调查的目的是“了解某地5000名居民某天的阅读时间”,所以“5000名居民的阅读时间的全体”是调查的总体.
4.(教材改编)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为________.
答案 19,13
5.(教材改编)甲、乙两人在相同条件下各射靶10次,每次命中环数如下:
甲 4 7 10 9 5 6 8 6 8 8
乙 7 8 6 8 6 7 8 7 5 9
试问10次射靶的情况较稳定的是________.
答案 乙
解析 甲==7.1,
乙==7.1.
s=[(4-7.1)2+(7-7.1)2+…+(8-7.1)2]=3.09,
s=[(7-7.1)2+(8-7.1)2+…+(9-7.1)2]=1.29.
s>
s,
∴乙较稳定.
题型一 频率分布直方图的绘制与应用
例1 (2015·
课标全国Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.
A地区用户满意度评分的频率分布直方图
图①
B地区用户满意度评分的频数分布表
满意度评分分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
2
8
14
10
6
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).
B地区用户满意度评分的频率分布直方图
图②
(2)根据用户满意度评分,将用户的满意度分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大?
说明理由.
解
(1)如图所示.
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;
B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
(2)A地区用户的满意度等级为不满意的概率大.
记CA表示事件:
“A地区用户的满意度等级为不满意”;
CB表示事件:
“B地区用户的满意度等级为不满意”.
由直方图得P(CA)的估计值为(0.01+0.02+0.03)×
10=0.6,P(CB)的估计值为(0.005+0.02)×
10=0.25.
所以A地区用户的满意度等级为不满意的概率大.
思维升华
(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.
(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.
(1)(2014·
山东改编)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:
kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.
答案 12
解析 志愿者的总人数为=50,
所以第三组人数为50×
0.36=18,
有疗效的人数为18-6=12.
(2)某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:
①求分数在[70,80)内的频率,并补全这个频率分布直方图;
②统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.
解 ①设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×
2+0.025+0.005)×
10+x=1,可得x=0.3,所以频率分布直方图如图所示.
②平均分:
45×
0.1+55×
0.15+65×
0.15+75×
0.3+85×
0.25+95×
0.05=71(分).
题型二 茎叶图的应用
例2
(1)(2015·
山东)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:
℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的编号为________.
(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:
分).
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为__________.
答案
(1)①④
(2)5,8
解析
(1)甲地5天的气温为:
26,28,29,31,31,
其平均数为甲==29;
方差为s=[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;
标准差为s甲=.
乙地5天的气温为:
28,29,30,31,32,
其平均数为乙==30;
方差为s=[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;
标准差为s乙=.
∴甲<乙,s甲>s乙.
(2)由茎叶图及已知得x=5,又乙组数据的平均数为16.8,即=16.8,解得y=8.
引申探究
1.本例
(2)中条件不变,试比较甲、乙两组哪组成绩较好.
解 由原题可知x=5,
则甲组平均分为=17.4.
而乙组平均分为16.8,所以甲组成绩较好.
2.在本例
(2)条件下:
①求乙组数据的中位数、众数;
②求乙组数据的方差.
解 ①由茎叶图知,乙组中五名学生的成绩为9,15,18,18,24.
故中位数为18,众数为18.
②s2=[(9-16.8)2+(15-16.8)2+(18-16.8)2×
2+(24-16.8)2]=23.76.
思维升华 茎叶图的优缺点
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.
(2014·
课标全国Ⅱ)某市为了考核甲,乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:
(1)分别估计该市的市民对甲,乙两部门评分的中位数;
(2)分别估计该市的市民对甲,乙两部门的评分高于90的概率;
(3)根据茎叶图分析该市的市民对甲,乙两部门的评价.
解
(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.
50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为=67,所以该市的市民对乙部门评分的中位数的估计值是67.
(2)由所给茎叶图知,50位市民对甲,乙部门的评分高于90的比率分别为=0.1,=0.16,故该市的市民对甲,乙部门的评分高于90的概率的估计值分别为0.1,0.16.
(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:
考生利用其他统计量进行分析,结论合理的同样给分.)
题型三 用样本的数字特征估计总体的数字特征
例3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价.
解
(1)由题图象可得甲、乙两人五次测试的成绩分别为
甲:
10分,13分,12分,14分,16分;
乙:
13分,14分,12分,12分,14分.
甲==13;
乙==13,
s=[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4;
s=[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)由s>
s可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
(2015·
广东)某工厂36名工人的年龄数据如下表.
工人编号年龄
1 40
10 36
19 27
28 34
2 44
11 31
20 43
29 39
3 40
12 38
21 41
30 43
4 41
13 39
22 37
31 38
5 33
14 43
23 34
32 42
6 40
15 45
24 42
33 53
7 45
16 39
25 37
34 37
8 42
17 38
26 44
35 49
9 43
18 36
27 42
36 39
(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;
(2)计算
(1)中样本的均值和方差s2;
(3)36名工人中年龄在-s与+s之间的有多少人?
所占的百分比是多少(精确到0.01%)?
解
(1)44,40,36,43,36,37,44,43,37.
(2)==40.
s2=[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=.
(3)40-=,40+=在的有23个,占63.89%.
9.高考中频率分布直方图的应用
典例 (14分)(2015·
广东)某城市100户居民的月平均用电量(单位:
度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中x的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?
规范解答
解
(1)由(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×
20=1得:
x=0.0075,
所以直方图中x的值是0.0075.[3分]
(2)月平均用电量的众数是=230.[4分]
因为(0.002+0.0095+0.011)×
20=0.45<
0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a,由(0.002+0.0095+0.011)×
20+0.0125×
(a-220)=0.5得:
a=224,所以月平均用电量的中位数是224.[8分]
(3)月平均用电量为[220,240)的用户有0.0125×
20×
100=25(户),月平均用电量为[240,260)的用户有0.0075×
100=15(户),月平均用电量为[260,280)的用户有0.005×
100=10(户),月平均用电量为[280,300]的用户有0.0025×
100=5(户),抽取比例==,所以月平均用电量在[220,240)的用户中应抽取25×
=5(户).[14分]
温馨提醒 本题的难点是对频率分布直方图意义的理解以及利用这个图提供的数据对所提问题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意.
[方法与技巧]
1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;
难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.
2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;
而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
3.若取值x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均值为x1p1+x2p2+…+xnpn;
若x1,x2,…,xn的平均数为,方差为s2,则ax1+b,ax2+b,…,axn+b的平均数为a+b,方差为a2s2.
[失误与防范]
频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;
条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
A组 专项基础训练
(时间:
40分钟)
1.下图是某公司10个销售店某月销售某产品数量(单位:
台)的茎叶图,则数据落在区间[22,30)内的频率为____________.
答案 0.4
解析 10个数据落在区间[22,30)内的数据有22,22,27,29,共4个,因此,所求的频率为=0.4.
2.(2014·
陕西改编)某公司10位员工的月工资(单位:
元)为x1,x2,…,x10,其均值和方差分别为和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为____________.
答案 +100,s2
解析 =,yi=xi+100,所以y1,y2,…,y10的均值为+100,方差不变.
3.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是________.
答案 50
解析 由频率分布直方图,知低于60分的频率为
(0.01+0.005)×
20=0.3.
∴该班学生人数n==50.
4.在某次测量中得到的A样本数据如下:
42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的数字特征对应相同的是__________.
答案 标准差
解析 利用平均数、标准差、众数、中位数等统计特征数的概念求解.由B样本数据恰好是A样本数据每个都减5后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与A样本不相同,标准差不变.
5.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有________.
①a1>
a2
②a2>
a1
③a1=a2
④a1,a2的大小与m的值有关
答案 ②
解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>
a1.
6.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为________________.
答案 2
解析 由题意可知样本的平均值为1,所以=1,解得a=-1,所以样本的方差为[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.
7.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为________.
答案
解析 由题意知=91,解得x=4.所以s2=[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]
=(16+9+1+0+1+9+0)=.
8.从某小学随机抽取100名学生,将他们的身高(单位:
厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
答案 0.030 3
解析 ∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a==0.030.由题意知,身高在[120,130),[130,140),[140,150]内的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为=,
∴在[140,150]中选取的学生应为3人.
9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:
(1)求分数在[50,60]的频率及全班人数;
(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.
解
(1)分数在[50,60]的频率为0.008×
10=0.08.
由茎叶图知,分数在[50,60]之间的频数为2,
所以全班人数为=25.
(2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为÷
10=0.016.
10.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:
克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36.
(1)求样本容量及样本中净重大于或等于98克并且小于104克的产品的个数;
(2)已知这批产品中每个产品的利润y(单位:
元)与产品净重x(单位:
克)的关系式为y=求这批产品平均每个的利润.
解
(1)产品净重小于100克的频率为(0.050+0.100)×
2=0.300.设样本容量为n.
∵样本中产品净重小于100克的个数是36,
∴=0.300,∴n=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×
2=0.750,
∴样本中净重大于或等于98克并且小于104克的产品的个数是120×
0.750=90.
(2)产品净重在[96,98),[98,104),[104,106]内的频率分别为0.050×
2=0.100,(0.100+0.150+0.125)×
2=0.750,0.075×
2=0.150,∴其相应的频数分别为120×
0.100=12,120×
0.750=90,120×
0.150=18,
∴这批产品平均每个的利润为×
(3×
12+5×
90+4×
18)=4.65(元).
B组 专项能力提升
30分钟)
11.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,