高考数学理科一轮复习第9章 第3节 用样本估计总体Word文档下载推荐.docx
《高考数学理科一轮复习第9章 第3节 用样本估计总体Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《高考数学理科一轮复习第9章 第3节 用样本估计总体Word文档下载推荐.docx(14页珍藏版)》请在冰豆网上搜索。
一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:
把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:
把
=
称为x1,x2,…,xn这n个数的平均数.
(4)标准差与方差:
设一组数据x1,x2,x3,…,xn的平均数为
,则这组数据的标准差和方差分别是
s=
;
s2=
[(x1-
)2+(x2-
)2+…+(xn-
)2].
[常用结论]
1.频率分布直方图中各小矩形的面积之和为1.
2.频率分布直方图与众数、中位数与平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
3.若数据x1,x2,…,xn的平均数为
,方差为s2,则数据mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m
+a,方差为m2s2.
[基础自测]
1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×
”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(2)一组数据的方差越大,说明这组数据越集中.( )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )
[答案]
(1)√
(2)×
(3)√ (4)×
2.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:
kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
B [标准差反映样本数据的离散波动大小,故选B.]
3.数据1,3,4,8的平均数与方差分别是( )
A.2,2.5 B.2,10.5
C.4,2D.4,6.5
D [平均数为
=4,方差为
=6.5.]
4.某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为( )
A.117B.118
C.118.5D.119.5
B [22次考试中,所得分数最高的为98,最低的为56,所以极差为98-56=42,
将分数从小到大排列,中间两数为76,76,所以中位数为76,
所以此学生该门功课考试分数的极差与中位数之和为42+76=118.]
5.(教材改编)某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.
48 [由频率分布直方图可知45岁以下的教师的频率为5×
(0.040+0.080)=0.6,所以共有80×
0.6=48(人).]
样本的数字特征的计算与应用
1.在某次测量中,得到的A样本数据为81,82,82,84,84,85,86,86,86,若B样本数据恰好是A样本数据分别加2后所得的数据,则A,B两个样本的下列数字特征对应相同的是( )
A.众数 B.平均数
C.标准差D.中位数
C [由题意可得A,B两组数据的众数分别是86和88,排除A;
B组数据的平均数比A组数据的平均数大2,排除B;
B组数据的中位数比A组数据的中位数大2,排除D;
A,B两组数据的标准差相同,C正确,故选C.]
2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
甲 乙
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
C [根据条形统计图可知甲的中靶情况为4环、5环、6环、7环、8环;
乙的中靶情况为5环、5环、5环、6环、9环.
甲=
(4+5+6+7+8)=6,
乙=
(5×
3+6+9)=6,甲的成绩的方差为
=2,乙的成绩的方差为
=2.4;
甲的成绩的极差为4环,乙的成绩的极差为4环;
甲的成绩的中位数为6环,乙的成绩的中位数为5环,综上可知C正确,故选C.]
3.某人5次上班途中所花的时间(单位:
分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为( )
A.1B.2
C.3D.4
D [由题意可知
∴
∴(x+y)2=x2+y2+2xy,即208+2xy=400,∴xy=96.
∴(x-y)2=x2+y2-2xy=16,∴|x-y|=4,故选D.]
[规律方法] 众数、中位数、平均数、方差的意义及常用结论
(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.
(2)方差的简化计算公式:
,或写成s2=
,即方差等于原数据平方的平均数减去平均数的平方.
茎叶图
【例1】 某良种培育基地正在培育一小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产量的数据(单位:
千克)如下:
品种A:
357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.
品种B:
363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430
(1)作出品种A与B亩产量数据的茎叶图;
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
[解]
(1)画出茎叶图如图所示.
(2)由于每个品种的数据都只有25个,样本容量不大,画茎叶图很方便;
此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且可以随时记录新的数据.
(3)通过观察茎叶图可以看出:
①品种A的亩产量的平均数(或均值)比品种B高;
②品种A的亩产量的标准差(或方差)比品种B大,故品种A的亩产量的稳定性较差.
[规律方法] 茎叶图中的两个关注点
(1)重复出现的数据要重复记录,不能遗漏.
(2)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.
易错警示:
茎叶图中数字大小排列不一定从小到大排列,一定要看清楚.
(1)
空气质量指数(AirQualityIndex,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;
51~100为良;
101~150为轻度污染;
151~200为中度污染;
201~300为重度污染;
大于300为严重污染.从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于100的天数约为________.(该年为365天)
(2)如图所示的茎叶图是甲、乙两位选手在某次比赛中的比赛得分,则下列说法正确的是( )
A.甲的平均数大于乙的平均数
B.甲的中位数大于乙的中位数
C.甲的方差大于乙的方差
D.甲的平均数等于乙的中位数
(1)146
(2)C [
(1)该样本中AQI大于100的频数是4,频率为
,
由此估计该地全年AQI大于100的频率为
估计此地该年AQI大于100的天数约为365×
=146.
(2)由茎叶图可知,
×
(59+45+32+38+24+26+11+12+14)=29,
(51+43+30+34+20+25+27+28+12)=30,s
(302+162+32+92+52+32+182+172+152)≈235.3,s
(212+132+02+42+102+52+32+22+182)≈120.9,甲的中位数为26,乙的中位数为28.所以甲的方差大于乙的方差.故选C.]
频率分布直方图
【例2】 某城市100户居民的月平均用电量(单位:
千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中x的值.
(2)求月平均用电量的众数和中位数.
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240]的用户中应抽取多少户?
[解]
(1)(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×
20=1,解得x=0.0075.
即直方图中x的值为0.0075.
(2)月平均用电量的众数是
=230.
∵(0.002+0.0095+0.011)×
20=0.45<0.5,
(0.002+0.0095+0.011+0.0125)×
20=0.7>0.5,
∴月平均用电量的中位数在[220,240)内.
设中位数为a,则0.45+0.0125×
(a-220)=0.5,解得a=224,即中位数为224.
(3)月平均用电量在[220,240]的用户有0.0125×
20×
100=25(户).同理可得月平均用电量在[240,260)的用户有15户,月平均用电量在[260,280)的用户有10户,月平均用电量在[280,300]的用户有5户,故抽取比例为
.
∴月平均用电量在[220,240)的用户中应抽取25×
=5(户).
[规律方法] 频率、频数、样本容量的计算方法
(2)
从某企业生产的某种产品中抽取100件,测量这