高中北师版数学必修3第1章 5 51 52 用样本估计总体Word格式.docx
《高中北师版数学必修3第1章 5 51 52 用样本估计总体Word格式.docx》由会员分享,可在线阅读,更多相关《高中北师版数学必修3第1章 5 51 52 用样本估计总体Word格式.docx(15页珍藏版)》请在冰豆网上搜索。
![高中北师版数学必修3第1章 5 51 52 用样本估计总体Word格式.docx](https://file1.bdocx.com/fileroot1/2023-1/29/3eba5d4f-06f4-4959-946e-591b9c09d244/3eba5d4f-06f4-4959-946e-591b9c09d2441.gif)
思考:
在频率分布直方图中,如何求众数、中位数、平均数?
[提示] ①在频率分布直方图中,众数是最高矩形中点的横坐标;
②中位数左边和右边的直方图的面积应该相等;
③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
1.当收集到的数据量很大时,比较合适的统计图是( )
A.茎叶图 B.频率分布直方图
C.频率折线图D.频率分布表
B [当收集到的数据量很大时,一般用频率分布直方图.]
2.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组上的直方图的高为h,则|a-b|=( )
A.hm B.
C.
D.h+m
B [
=h,故|a-b|=组距=
.]
3.频率分布直方图中,小矩形的面积等于( )
A.组距 B.频率
C.组数D.频数
B [根据小矩形的宽及高的意义,可知小矩形的面积为一组样本数据的频率.]
4.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如图所示.
已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________.
100 0.15 [设参赛的人数为n,第二小组的频率为1-(0.30+0.15+0.10+0.05)=0.4,
依题意
=0.4,
∴n=100,优秀的频率是0.10+0.05=0.15.]
画频率分布直方图、折线图
【例1】 已知一个样本:
30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率折线图;
(3)根据频率分布直方图,估计总体出现在23~28内的频率是多少.
[解]
(1)计算极差:
30-21=9.
决定组距和组数:
取组距为2.
∵
=4
,∴共分5组.
决定分点,使分点比数据多一位小数.
并把第1小组的分点减小0.5,即分成如下5组:
[20.5,22.5),[22.5,24.5),[24.5,26.5),
[26.5,28.5),[28.5,30.5].
列出频率分布表如下:
分组
频数
频率
频率/组距
[20.5,22.5)
2
0.1
0.05
[22.5,24.5)
3
0.15
0.075
[24.5,26.5)
8
0.4
0.2
[26.5,28.5)
4
[28.5,30.5]
合计
20
1.00
(2)作出频率分布直方图如下:
取各小长方形上的中点并用线段连接就构成了频率折线图,如上图.
(3)由频率分布表和频率分布直方图观察得:
样本值出现在23~28之间的频率为0.15+0.40+0.2=0.75,所以可以估计总体中出现在23~28之间的数的频率约为0.75.
绘制频率分布直方图的具体步骤
1.求极差
一组数据的最大值与最小值的差称为极差.
2.决定组距与组数
数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过120时,按照数据的多少,常分成5~12组.为方便起见,组距的选择应力求“取整”.
3.将数据分组
通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.
1.为了了解中学生的身高情况,对实验中学同龄的50名男学生的身高进行了测量,结果如下(单位:
cm):
175
168
170
176
167
181
162
173
171
177
174
166
163
160
169
165
158
172
161
157
179
列出频率分布表,画出频率分布直方图及频率折线图.
[解] 在这个样本中,最大值为181,最小值为157,它们的极差为24,可以取组距为4,根据题意列出样本的频率分布表如下表:
156.5~160.5
0.06
160.5~164.5
0.08
164.5~168.5
12
0.24
168.5~172.5
172.5~176.5
13
0.26
176.5~180.5
180.5~184.5
0.04
50
由上表画出频率分布直方图及频率折线图如图.
频率分布直方图的应用
【例2】 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图如图所示,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?
样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?
[解]
(1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为
=0.08.
又因为第二小组频率=
,
所以样本容量=
=150.
(2)由图可估计该校高一学生的达标率约为
×
100%=88%.
频率分布直方图的性质
1.因为小矩形的面积=组距×
频率÷
组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
2.在频率分布直方图中,各小矩形的面积之和等于1.
3.频数÷
相应的频率=样本容量.
2.
(1)某班50名学生在一次百米跑测试中,成绩全部介于13s与19s之间,将测试结果按如下方式分成六组:
第一组,成绩大于或等于13s且小于14s;
第二组,成绩大于或等于14s且小于15s;
…;
第六组,成绩大于或等于18s且小于或等于19s,如图所示是按上述分组方法得到的频率分布直方图.设成绩小于17s的学生人数占全班总人数的百分比为x,成绩大于或等于15s且小于17s的学生人数为y,则从频率分布直方图中分析出x和y分别为( )
A.0.9,35 B.0.9,45
C.0.1,35D.0.1,45
(2)某商场在端午节的促销活动中,对某日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为3万元,则11时至12时的销售额为________万元.
(1)A
(2)12 [由频率分布直方图知x=0.34+0.36+0.18+0.02=0.9,因为
=0.36+0.34=0.7,所以y=35.故选A.
(2)由频率分布直方图知,9时至10时的销售额的频率为0.1,故销售总额为
=30(万元),又11时至12时的销售额的频率为0.4,故销售额为0.4×
30=12万元.故填12万元.]
估计总体的数字特征
[探究问题]
1.如何从频率分布直方图中估计中位数?
提示:
在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
2.在条形统计图中怎样估计众数?
众数是最高矩形的中点的横坐标.
3.怎样估计平均数?
平均数的估计值等于频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的总和.
【例3】 已知一组数据:
125,121,123,125,127,129,125,128,130,129,126,124,125,127,126,122,124,125,126,128.
(1)填写下面的频率分布表:
[121,123)
[123,125)
[125,127)
[127,129)
[129,131]
(2)作出频率分布直方图;
(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.
[思路探究]
(1)根据频数与频率的概念填写表格;
(2)利用作频率分布直方图的步骤作图;
(3)根据直方图中求数字特征的方法求解.
[解]
(1)
1
(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实上,众数的精确值为125;
(2)图中虚线对应的数据是125+2×
=126.25,事实上中位数为125.5.使用“组中值”求平均数
=122×
0.1+124×
0.15+126×
0.4+128×
0.2+130×
0.15=126.3,平均数的精确值为
=125.75.
1.平均数、中位数、众数、极差、方差等统计量是将多个数据“加工”成一个数据,能更清楚地反映这组数据的某些重要特征,要理解这些统计量表达的信息.
2.利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.
3.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
求:
(1)高一参赛学生成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
[解]
(1)由图可知众数为65,又因为第一个小矩形的面积为0.3,
所以设中位数为60+x,
则0.3+x×
0.04=0.5,得x=5,
所以中位数为60+5=65.
(2)依题意,
=55×
0.3+65×
0.4+75×
0.15+85×
0.1+95×
0.05=67,
所以平均成绩约为67分.
1.利用直方图求数字特征:
(1)众数是最高的矩形的底边的中点.
(2)中位数左右两边直方图的面积应相等.
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.三种图表的区别与联系:
名称
区别
频率分布表
从数量上比较准确地反映样本的频率分布规律
频率分布直方图
反映样本的频率分布情况
频率折线图
直观地反映了数据的变化趋势
这三种图表都是描述样本数据分布情况,估计总体频率分布规律的,其联系如下:
1.思考辨析
(1)频率分布直方图中的纵坐标指的是频率的值.( )
(2)频率分布直方图中各小矩形的面积之和可以不为1.( )
(3)将数据分组时,一般要求各组的组距相等.( )
(4)在用样本估计总体分布的过程中,样本容量越大,估计越精确.( )
(5)样本平均数一定大于总体平均数.( )
(6)样本标准差与总体标准差的大小关系无法确定.( )
[解析]
(1)×
,纵坐标指的是频率与组距的比值.
(2)×
,各小矩形的面积之和一定为1.
(3)√,对数据进行分组时,一般要求各组的组距相等.
(4)√,样本容量越大,估计越精确.
(5)×
,样本平均数与总体平均数的大小关系不确定.
(6)√,可能大于也可能小于.
[答案]
(1)×
(2)×
(3)√ (4)√ (5)×
(6)√
2.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )
A.45 B.50 C.55 D.60
B [成绩在[20,40)和[40,60)的频率分别是0.1,0.2,则低于60分的频率是0.3,设该班学生总数为m,则
=0.3,m=50.]
3.从某小学随机抽取100名同学,将他们的身高(单位:
厘米)数据绘制成频率分布直方图如图所示.由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
图156
0.030 3 [∵0.005×
10+0.035×
10+a×
10+0.020×
10+0.010×
10=1,
∴a=0.030,设身高在[120,130),[130,140),[140,150]三组的分别有x,y,z人.
∴
=0.030×
10,
∴x=30,同理y=20,z=10.
∴从[140,150]中抽取
18=3.]
4.公交车的数量太多容易造成资源的浪费,太少又难以满足乘客的需求.为此,公交公司在某站台随机调查了80名乘客,他们的候车时间如下所示(单位:
分):
17
14
10
24
18
22
19
28
5
34
7
25
15
31
11
16
9
23
21
6
32
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率折线图;
(2)候车时间15分钟以上的比例是多少?
你能为公交公司提出什么建议?
[解]
(1)该数据中最大值为34,最小值为1,两者之差为33,故取组距为5,分为7组.
时间分组(Δxi)
频数(ni)
频率(fi)
[0,5)
0.015
[5,10)
0.1125
0.0225
[10,15)
0.275
0.055
[15,20)
[20,25)
0.125
0.025
[25,30)
0.100
0.020
[30,35]
0.0375
0.0075
频率分布直方图如下图所示:
频率折线图如下图所示:
(2)候车时间不低于15分钟的百分比为
0.275+0.125+0.100+0.0375=0.5375=53.75%,
公交公司可以适当增加公交车的数量.