高考数学一轮复习知识点与练习 用样本估计总体.docx
《高考数学一轮复习知识点与练习 用样本估计总体.docx》由会员分享,可在线阅读,更多相关《高考数学一轮复习知识点与练习 用样本估计总体.docx(17页珍藏版)》请在冰豆网上搜索。
高考数学一轮复习知识点与练习用样本估计总体
1.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差).
(2)决定组距与组数.
(3)将数据分组.
(4)列频率分布表.
(5)画频率分布直方图.
2.频率分布折线图和总体分布的密度曲线
(1)频率分布折线图:
将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.
(2)总体分布的密度曲线:
将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线.
3.茎叶图
统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.
4.标准差和方差
(1)标准差是样本数据到平均数的一种平均距离.
(2)标准差:
s=
.
(3)方差:
s2=
[(x1-
)2+(x2-
)2+…+(xn-
)2](xn是样本数据,n是样本容量,
是样本平均数).
【知识拓展】
1.频率分布直方图的特点
(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示
,频率=组距×
.
(2)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.
(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.
2.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为
那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m
+a.
(2)数据x1,x2,…,xn的方差为s2.
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
【思考辨析】
判断下面结论是否正确(请在括号中打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( )
(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )
(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( )
(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( )
1.(2015·陕西改编)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为________.
2.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是__________.
3.在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是________.
4.(教材改编)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为________.
5.(教材改编)甲、乙两人在相同条件下各射靶10次,每次命中环数如下:
甲 4 7 10 9 5 6 8 6 8 8
乙 7 8 6 8 6 7 8 7 5 9
试问10次射靶的情况较稳定的是________.
题型一 频率分布直方图的绘制与应用
例1 (2015·课标全国Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.
A地区用户满意度评分的频率分布直方图
图①
B地区用户满意度评分的频数分布表
满意度评分分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
2
8
14
10
6
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).
B地区用户满意度评分的频率分布直方图
图②
(2)根据用户满意度评分,将用户的满意度分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大?
说明理由.
思维升华
(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.
(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.
(1)(2014·山东改编)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:
kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.
(2)某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:
①求分数在[70,80)内的频率,并补全这个频率分布直方图;
②统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.
题型二 茎叶图的应用
例2
(1)(2015·山东)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:
℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的编号为________.
(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:
分).
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为__________.
引申探究
1.本例
(2)中条件不变,试比较甲、乙两组哪组成绩较好.
2.在本例
(2)条件下:
①求乙组数据的中位数、众数;②求乙组数据的方差.
思维升华 茎叶图的优缺点
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.
(2014·课标全国Ⅱ)某市为了考核甲,乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:
(1)分别估计该市的市民对甲,乙两部门评分的中位数;
(2)分别估计该市的市民对甲,乙两部门的评分高于90的概率;
(3)根据茎叶图分析该市的市民对甲,乙两部门的评价.
题型三 用样本的数字特征估计总体的数字特征
例3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价.
思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
(2015·广东)某工厂36名工人的年龄数据如下表.
工人编号年龄
工人编号年龄
工人编号年龄
工人编号年龄
1 40
10 36
19 27
28 34
2 44
11 31
20 43
29 39
3 40
12 38
21 41
30 43
4 41
13 39
22 37
31 38
5 33
14 43
23 34
32 42
6 40
15 45
24 42
33 53
7 45
16 39
25 37
34 37
8 42
17 38
26 44
35 49
9 43
18 36
27 42
36 39
(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;
(2)计算
(1)中样本的均值
和方差s2;
(3)36名工人中年龄在
-s与
+s之间的有多少人?
所占的百分比是多少(精确到0.01%)?
9.高考中频率分布直方图的应用
典例 (14分)(2015·广东)某城市100户居民的月平均用电量(单位:
度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中x的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?
温馨提醒 本题的难点是对频率分布直方图意义的理解以及利用这个图提供的数据对所提问题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意.
[方法与技巧]
1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.
2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
3.若取值x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均值为x1p1+x2p2+…+xnpn;若x1,x2,…,xn的平均数为
,方差为s2,则ax1+b,ax2+b,…,axn+b的平均数为a
+b,方差为a2s2.
[失误与防范]
频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
A组 专项基础训练
(时间:
40分钟)
1.下图是某公司10个销售店某月销售某产品数量(单位:
台)的茎叶图,则数据落在区间[22,30)内的频率为____________.
2.(2014·陕西改编)某公司10位员工的月工资(单位:
元)为x1,x2,…,x10,其均值和方差分别为
和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为____________.
3.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是________.
4.在某次测量中得到的A样本数据如下:
42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的数字特征对应相同的是__________.
5.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有________.
①a1>a2;②a2>a1;③a1=a2;④a1,a2的大小与m的值有关
6.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为_______.
7.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为________.
8.从某小学随机抽取100名学生,将他们的身高(单位:
厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:
(1)求分数在[50,60]的频率及全班人数;
(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.
10.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:
克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36.
(1)求样本容量及样本中净重大于或等于98克并且小于104克的产品的个数;
(2)已知这批产品中每个产品的利润y(单位:
元)与产品净重x(单位:
克)的关系式为y=
求这批产品平均每个的利润.
B组 专项能力提升
(时间:
30分钟)
11.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是________.
12.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:
cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.
13.(2015·湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:
万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=________;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
14.若某产品的直径长与标准值的差的绝对值不超过1mm时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:
mm),将所得数据分组,得到如下频率分布表:
分组
频数
频率
[-3,-2)
0.10
[-2,-1)
8
(1,2]
0.50
(2,3]
10
(3,4]
合计
50
1.00
(1)将上面表格中缺少的数据填在相应位置;
(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;
(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.
15.(2014·广东)某车间20名工人年龄数据如下表:
年龄(岁)
19
28
29
30
31
32
40
工人数(人)
1
3
3
5
4
3
1
(1)求这20名工人年龄的众数与极差;
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;
(3)求这20名工人年龄的方差.