最新衡水中学校内自用精品高三数学一轮复习 第9章 第3节 用样本估计总体文档格式.docx
《最新衡水中学校内自用精品高三数学一轮复习 第9章 第3节 用样本估计总体文档格式.docx》由会员分享,可在线阅读,更多相关《最新衡水中学校内自用精品高三数学一轮复习 第9章 第3节 用样本估计总体文档格式.docx(10页珍藏版)》请在冰豆网上搜索。
统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.
3.样本的数字特征
数字特征
定义
众数
在一组数据中,出现次数最多的数据叫做这组数据的众数
中位数
将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
在频率分布直方图中,中位数左边和右边的直方图的面积相等
平均数
样本数据的算术平均数,即=
方差
s2=[(x1-)2+(x2-)2+…+(xn-)2],其中s为标准差
1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×
”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(2)一组数据的方差越大,说明这组数据越集中.( )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )
[解析]
(1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.
(2)错误.方差越大,这组数据越离散.
(3)正确.小矩形的面积=组距×
=频率.
(4)错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故(4)错误.
[答案]
(1)√
(2)×
(3)√ (4)×
2.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图932所示,则这组数据的中位数和平均数分别是( )
图932
A.91.5和91.5 B.91.5和92
C.91和91.5D.92和92
A [这组数据由小到大排列为87,89,90,91,92,93,94,96.
∴中位数是=91.5,
平均数==91.5.]
3.(2017·
南昌二模)如图933所示是一样本的频率分布直方图.若样本容量为100,则样本数据在[15,20)内的频数是( )
图933
A.50B.40
C.30D.14
C [因为[15,20]对应的小矩形的面积为1-0.04×
5-0.1×
5=0.3,所以样本落在[15,20]的频数为0.3×
100=30,故选C.]
4.(2016·
江苏高考)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.
0.1 [5个数的平均数==5.1,
所以它们的方差s2=[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.]
5.(2017·
山东淄博模拟)某校女子篮球队7名运动员身高(单位:
cm)分布的茎叶图如图934,已知记录的平均身高为175cm,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x,那么x的值为________.
图934
2 [170+×
(1+2+x+4+5+10+11)=175,
则×
(33+x)=5,即33+x=35,解得x=2.]
样本的数字特征
(1)(2015·
广东高考)已知样本数据x1,x2,…,xn的均值=5,则样本数据2x1+1,2x2+1,…,2xn+1的均值为________.
(2)某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:
(a,b),(a,),(a,b),(,b),(,),(a,b),(a,b),(a,),(,b),(a,),(,),(a,b),(a,),(,b),(a,b).其中a,分别表示甲组研发成功和失败;
b,分别表示乙组研发成功和失败.
①若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差.并比较甲、乙两组的研发水平;
②若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.
(1)11 [由条件知==5,则所求均值0==
=2+1=2×
5+1=11.]
(2)①甲组研发新产品的成绩为
1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,
其平均数为甲==.3分
方差s==.
乙组研发新产品的成绩为
1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,
其平均数为乙==.
因为甲>乙,s<s,
所以甲组的研发水平优于乙组.6分
②记E={恰有一组研发成功}.
在所抽得的15个结果中,恰有一组研发成功的结果是(a,),(,b),(a,),(,b),(a,),(a,),(,b),共7个.
因此事件E发生的概率为.
用频率估计概率,即得所求概率为P(E)=.12分
[规律方法] 1.平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行均值与方差的计算,关键是正确运用公式.
2.可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种做出评价或选择.
[变式训练1] (2017·
郑州模拟)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:
℃)制成如图935所示的茎叶图.考虑以下结论:
图935
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的序号为( )
A.①③ B.①④
C.②③ D.②④
B [甲地5天的气温为:
26,28,29,31,31,
其平均数为甲==29;
方差为s=[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;
标准差为s甲=.
乙地5天的气温为:
28,29,30,31,32,
其平均数为乙==30;
方差为s=[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;
标准差为s乙=.∴甲<乙,s甲>s乙.]
茎叶图及其应用
(2014·
全国卷Ⅱ)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:
(1)分别估计该市的市民对甲、乙两部门评分的中位数;
(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;
(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.
[解]
(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.3分
50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为=67,所以该市的市民对乙部门评分的中位数的估计值是67.5分
(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为=0.1,=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.8分
(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.12分
[规律方法] 1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.
2.
(1)作样本的茎叶图时,先要根据数据特点确定茎、叶,再作茎叶图;
作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.
(2)根据茎叶图中数据的数字特征进行分析判断,考查识图能力、判断推理能力和创新应用意识;
解题的关键是抓住“叶”的分布特征,准确提炼信息.
[变式训练2] (2017·
雅礼中学质检)已知甲、乙两组数据如茎叶图936所示,若两组数据的中位数相同,平均数也相同,那么m+n=________.
【导学号:
01772364】
图936
11 [∵两组数据的中位数相同,
∴m==3.
又∵两组数据的平均数也相同,
∴=,∴n=8,
因此m+n=11.]
频率分布直方图
☞角度1 利用分布直方图求频率、频数
(2016·
山东高考)某高校调查了200名学生每周的自习时间(单位:
小时),制成了如图937所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
图937
A.56B.60
C.120D.140
D [由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×
2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×
200=140.故选D.]
☞角度2 用频率分布直方图估计总体
四川高考)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:
吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图938所示的频率分布直方图.
图938
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
[解]
(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×
0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.3分
由0.04+0.08+0.5×
a+0.20+0.26+0.5×
a+0.06+0.04+0.02=1,
解得a=0.30.5分
(2)由
(1),知100位居民每人的月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人