中位数仍为x5,∴A正确.]
2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
甲 乙
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
C [根据条形统计图可知甲的中靶情况为4环、5环、6环、7环、8环;乙的中靶情况为5环、5环、5环、6环、9环.
甲=
(4+5+6+7+8)=6,
乙=
(5×3+6+9)=6,甲的成绩的方差为
=2,乙的成绩的方差为
=2.4;甲的成绩的极差为4环,乙的成绩的极差为4环;甲的成绩的中位数为6环,乙的成绩的中位数为5环,综上可知C正确,故选C.]
3.某人5次上班途中所花的时间(单位:
分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为( )
A.1 B.2C.3 D.4
D [由题意可知
∴
∴(x+y)2=x2+y2+2xy,即208+2xy=400,∴xy=96.
∴(x-y)2=x2+y2-2xy=16,
∴|x-y|=4,故选D.]
4.(20xx·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的分组
[-0.20,0)
[0,0.20)
[0.20,0.40)
[0.40,0.60)
[0.60,0.80)
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:
≈8.602.
[解]
(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为
=0.21.
产值负增长的企业频率为
=0.02.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)
=
(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2=
i
=
[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]
=0.0296,
s=
=0.02×
≈0.17,
所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
方差的简化计算公式:
s2=
[(x
+x
+…+x
)-nx2],或写成s2=
(x
+x
+…+x
)-x2,即方差等于原数据平方的平均数减去平均数的平方.
考点2 茎叶图
茎叶图中的2个关注点
(1)重复出现的数据要重复记录,不能遗漏.
(2)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.
某良种培育基地正在培育一小麦新品种A,将其与原有的一种优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产量的数据(单位:
千克)如下:
品种A:
357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.
品种B:
363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430.
(1)作出品种A与B亩产量数据的茎叶图;
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
[解]
(1)画出茎叶图如图所示.
(2)由于每个品种的数据都只有25个,样本容量不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且可以随时记录新的数据.
(3)通过观察茎叶图可以看出:
①品种A的亩产量的平均数(或均值)比品种B高;②品种A的亩产量的标准差(或方差)比品种B大,故品种A的亩产量的稳定性较差.
茎叶图中数字大小排列不一定从小到大排列,解题时一定要看清楚.
1.[多选]胡萝卜中含有大量的β胡萝卜素,摄入人体消化器官后,可以转化为维生素A,现从a,b两个品种的胡萝卜所含的β胡萝卜素(单位:
mg)得到茎叶图如图所示,则下列说法正确的有( )
A.
a<
b B.a的方差大于b的方差
C.b品种的众数为3.31D.a品种的中位数为3.27
ABD [由茎叶图得:
b品种所含β胡萝卜素普遍高于a品种,∴
a<
b,故A正确;a品种的数据波动比b品种的数据波动大,∴a的方差大于b的方差,故B正确;b品种的众数为3.31与3.41,故C错误;a品种的数据的中位数为:
=3.27,故D正确.故选ABD.]
2.
空气质量指数(AirQualityIndex,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于100的天数约为________.(该年为365天)
146 [该样本中AQI大于100的频数是4,频率为
,由此估计该地全年AQI大于100的频率为
,估计此地该年AQI大于100的天数约为365×
=146.]
考点3 频率分布直方图
频率、频数、样本容量的计算方法
(1)
×组距=频率.
(2)
=频率,
=样本容量,样本容量×频率=频数.
(1)[多选]为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论正确的有( )
A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25
B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5
C.该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320
D.该校九年级学生1分钟仰卧起坐的次数少于20的人数约为32
(2)(20xx·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:
将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比,根据试验数据分别得到如下直方图:
记C为事件:
“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
①求乙离子残留百分比直方图中a,b的值;
②分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
(1)ABC [由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是26.25;众数是最高矩形的中间值27.5;1分钟仰卧起坐的次数超过30的频率为0.2,所以估计1分钟仰卧起坐的次数超过30的人数为320;1分钟仰卧起坐的次数少于20的频率为0.1,所以估计1分钟仰卧起坐的次数少于20的人数为160.故D错误.]
(2)[解] ①由已知得0.70=a+0.20+0.15,故
a=0.35.
b=1-0.05-0.15-0.70=0.10.
②甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
频率分布直方图的纵坐标是
,而不是频率,切莫与条形图混淆.
[教师备选例题]
(20xx·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:
m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
[0.6,0.7)
频数
1
3
2
4
9
26
5
使用了节水龙头50天的日用水量频数分布表
日用水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
频数
1
5
13
10
16
5
(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?
(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)
[解]
(1)如图所示:
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.
(3)该家庭未使用节水龙头50天日用水量的平均数为
1=
(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.
该家庭使用了节水龙头后50天日用水量的平均数为
2=
(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.
估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).
1.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为( )
A.64 B.54C.48 D.27
B [前两组中的频数为100×(0.05+0.11)=16.因为后五组频数和为62,所以前三组为38.所以第三组频数为22.又最大频率为0.32,对应的最大频数为0.32×100=32.所以a=22+32=54.]
2.某城市100户居民的月平均用电量(单位:
千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中x的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?
[解]
(1)(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1,解得x=0.0075.
即直方图中x的值为0.0075.
(2)月平均用电量的众数是
=230.
∵(0.002+0.0095+0.011)×20=0.45<0.5,
(0.002+0.0095+0.011+0.0125)×20=0.7>0.5,
∴月平均用电量的中位数在[220,240)内.
设中位数为a,则0.45+0.0125×(a-220)=0.5,解得a=224,即中位数为224.
(3)月平均用电量在[220,240)的用户有0.0125×20×100=25(户).同理可得月平均用电量在[240,260)的用户有15户,月平均用电量在[260,280)的用户有10户,月平均用电量在[280,300]的用户有5户,故抽取比例为
=
.
∴月平均用电量在[220,240)的用户中应抽取25×
=5(户).