专题检测十七统计统计案例理.docx
《专题检测十七统计统计案例理.docx》由会员分享,可在线阅读,更多相关《专题检测十七统计统计案例理.docx(14页珍藏版)》请在冰豆网上搜索。
专题检测十七统计统计案例理
专题检测(十七)统计、统计案例
A组——“6+3+3”考点落实练
一、选择题
1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( )
A.73 B.78
C.77D.76
解析:
选B 样本的分段间隔为=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78.故选B.
2.(2019届高三·南宁摸底联考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A.100,20B.200,20
C.200,10D.100,10
解析:
选B 由题图甲可知学生总人数是10000,样本容量为10000×2%=200,抽取的高中生人数是2000×2%=40,由题图乙可知高中生的近视率为50%,所以高中生的近视人数为40×50%=20,故选B.
3.从某地高中男生中随机抽取100名同学,将他们的体重(单位:
kg)数据绘制成频率分布直方图(如图),由直方图可知( )
A.估计体重的众数为50或60
B.a=0.03
C.学生体重在[50,60)有35人
D.从这100名男生中随机抽取一人,体重在[60,80)的概率为
解析:
选C 根据频率分布直方图知,最高的小矩形对应的底边中点为=55,所以估计众数为55,A错误;根据频率和为1,计算(a+0.035+0.030+0.020+0.010)×10=1,解得a=0.005,B错误;体重在[50,60)内的频率是0.35,估计体重在[50,60)内的学生有100×0.35=35人,C正确;体重在[60,80)内的频率为0.3+0.2=0.5,用频率估计概率,知这100名男生中随机抽取一人,体重在[60,80)的概率为,D错误.
4.如图是民航部门统计的2019年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述不正确的是( )
A.深圳的变化幅度最小,北京的平均价格最高
B.深圳和厦门的春运期间往返机票价格同去年相比有所下降
C.平均价格从高到低居于前三位的城市为北京、深圳、广州
D.平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门
解析:
选D 由图可知深圳对应的小黑点最接近0%,故变化幅度最小,北京对应的条形图最高,则北京的平均价格最高,故A正确;由图可知深圳和厦门对应的小黑点在0%以下,故深圳和厦门的价格同去年相比有所下降,故B正确;由图可知条形图由高到低居于前三位的城市为北京、深圳和广州,故C正确;由图可知平均价格的涨幅由高到低分别为天津、西安和南京,故D错误,选D.
5.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是( )
A.13,12B.13,13
C.12,13D.13,14
解析:
选B 设等差数列{an}的公差为d(d≠0),a3=8,a1a7=a=64,(8-2d)(8+4d)=64,即2d-d2=0,又d≠0,故d=2,故样本数据为:
4,6,8,10,12,14,16,18,20,22,平均数为=13,中位数为=13.
6.(2017·山东高考)为了研究某班学生的脚长x(单位:
厘米)和身高y(单位:
厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为=x+,已知i=225,i=1600,=4.该班某学生的脚长为24,据此估计其身高为( )
A.160B.163
C.166D.170
解析:
选C 由题意可知=4x+,
又=22.5,=160,
因此160=22.5×4+,解得=70,
所以=4x+70.
当x=24时,=4×24+70=166.
二、填空题
7.如图是某学校一名篮球运动员在10场比赛中所得分数的茎叶图,则该运动员在这10场比赛中得分的中位数为________.
解析:
把10场比赛的所得分数按顺序排列:
5,8,9,12,14,16,16,19,21,24,中间两个为14与16,故中位数为=15.
答案:
15
8.已知一组数据x1,x2,…,xn的方差为2,若数据ax1+b,ax2+b,…,axn+b(a>0)的方差为8,则a的值为________.
解析:
根据方差的性质可知,a2×2=8,故a=2.
答案:
2
9.某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:
女
男
总计
喜爱
40
20
60
不喜爱
20
30
50
总计
60
50
110
试根据样本估计总体的思想,估计在犯错误的概率不超过________的前提下(约有________的把握)认为“喜爱该节目与否和性别有关”.
参考附表:
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
参考公式:
K2=,其中n=a+b+c+d
解析:
分析列联表中数据,可得K2的观测值k=≈7.822>6.635,所以在犯错误的概率不超过0.01的前提下(有99%的把握)认为“喜爱该节目与否和性别有关”.
答案:
0.01 99%
三、解答题
10.某市教育学院从参加市级高中数学竞赛的考生中随机抽取60名学生,将其竞赛成绩(均为整数)分成六段:
[40,50),[50,60),[60,70),…,[90,100],得到如图所示的频率分布直方图.
(1)根据频率分布直方图,估计参加高中数学竞赛的考生的成绩的平均数、众数、中位数(小数点后保留一位有效数字);
(2)用分层抽样的方法在各分数段的考生中抽取一个容量为20的样本,则各分数段抽取的人数分别是多少?
解:
(1)由频率分布直方图可知,
(0.010+0.015+0.015+a+0.025+0.005)×10=1,所以a=0.03.
所以参加高中数学竞赛的考生的成绩的平均数为
45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71,
成绩的众数为75.
设参加高中数学竞赛的考生的成绩的中位数为x,
则0.1+0.15+0.15+(x-70)×0.03=0.5,解得x≈73.3,
所以中位数为73.3.
(2)因为各层人数分别为6,9,9,18,15,3,各层抽取比例为=,
所以各分数段抽取人数依次为2,3,3,6,5,1.
11.2017年8月22日金乡县首届“诚信文艺奖”评选暨2017“百姓大舞台”第一季大型才艺大赛决赛在红星美凯龙举行.在比赛现场,12名专业人士和12名观众代表分别组成评判小组A,B,给参赛选手打分,如图是两个评判组对同一选手打分的茎叶图:
(1)求A组数据的众数和极差,B组数据的中位数;
(2)对每一组计算用于衡量相似性的数值,回答:
小组A与小组B哪一个更像是由专业人士组成的?
并说明理由.
解:
(1)由茎叶图可得:
A组数据的众数为47,极差为55-42=13;
B组数据的中位数为=56.5.
(2)小组A更像是由专业人士组成的.理由如下:
小组A,B数据的平均数分别为
A=×(42+42+44+45+46+47+47+47+49+50+50+55)=47,
B=×(36+42+46+47+49+55+58+62+66+68+70+73)=56,
所以小组A,B数据的方差分别为
s=×[(42-47)2+(42-47)2+…+(55-47)2]=×(25+25+9+4+1+4+9+9+64)=12.5,
s=×[(36-56)2+(42-56)2+…+(73-56)2]=×(400+196+100+81+49+1+4+36+100+144+196+289)=133.
因为s
12.(2019届高三·武汉调研)从某工厂的一个车间抽取某种产品50件,产品尺寸(单位:
cm)落在各个小组的频数分布如下表:
数据
分组
[12.5,
15.5)
[15.5,
18.5)
[18.5,
21.5)
[21.5,
24.5)
[24.5,
27.5)
[27.5,
30.5)
[30.5,
33.5)
频数
3
8
9
12
10
5
3
(1)根据频数分布表,估计该产品尺寸落在[27.5,33.5)内的概率;
(2)求这50件产品尺寸的样本平均数(同一组中的数据用该组区间的中点值作代表);
(3)根据频数分布对应的直方图,可以认为这种产品尺寸Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2,经计算得s2=22.41.利用该正态分布,求P(Z≥27.43).
附:
①若随机变量Z服从正态分布N(μ,σ2),则
P(μ-σ②≈4.73.
解:
(1)根据频数分布表,估计该产品尺寸落在[27.5,33.5)内的概率P==0.16.
(2)样本平均数=0.06×14+0.16×17+0.18×20+0.24×23+0.20×26+0.10×29+0.06×32=22.7.
(3)依题意Z~N(μ,σ2),
而μ==22.7,σ2=s2=22.41,则σ≈4.73,
∴P(22.7-4.73∴P(Z≥27.43)==0.15865.
B组——大题专攻补短练
1.(2018·南昌一模)某校为了推动数学教学方法的改革,学校将高一年级部分生源情况基本相同的学生分成甲、乙两个班,每班各40人,甲班按原有模式教学,乙班实施教学方法改革.经过一年的教学实验,将甲、乙两个班学生一年来的数学成绩取平均数,两个班学生的平均成绩均在[50,100],按照区间[50,60),[60,70),[70,80),[80,90),[90,100]进行分组,绘制成如下频率分布直方图,规定不低于80分(百分制)为优秀.
(1)完成表格,并判断是否有90%以上的把握认为“数学成绩优秀与教学改革有关”;
甲班
乙班
总计
大于等于80分的人数
小于80分的人数
总计
(2)从乙班[70,80),[80,90),[90,100]分数段中,按分层抽样随机抽取7名学生座谈,从中选3名学生发言,记来自[80,90)分数段中发言的人数为随机变量X,求X的分布列和数学期望.
附:
P(K2≥k0)
0.10
0.05
0.025
k0
2.706
3.841
5.024
K2=,n=a+b+c+d.
解:
(1)补全表格如下:
甲班
乙班
总计
大于等于80分的人数
12
20
32
小于80分的人数
28
20
48
总计
40
40
80
依题意得K2=≈3.333>2.706.
故有90%以上的把握认为“数学成绩优秀与教学改革有关”.
(2)从乙班[70,80),[80,90),[90,100]分数段中抽取的人数分别为2,3,2,
依题意随机变量X的所有可能取值为0,1,2,3,
P(X=0)==,P(X=1)==,P(X=2)==,P(X=3)==.
其分布列为
X
0
1
2
3
P
所以E(X)=0×+1×+2×+3×=.
2.社会公众人物的言行在一定程度上影响着年轻人的人生观、价值观.某媒体机构为了解大学生对影星、歌星以及著名主持人方面的新闻(简称“星闻”)的关注情况,随机调查了某大学的200位大学生,得到信息如下表:
男大学生
女大学生
不关注“星闻”
80
40
关注“星闻”
40
40
(1)从所抽取的200人内关注“星闻”的大学生中,再抽取3人做进一步调查,求这3人性别不全相同的概率;
(2)是否有95%以上的把握认为关注“星闻”与性别有关?
并说明理由;
(3)把以上的频率视为概率,若从该大学被调查的男大学生中随机抽取4人,设这4人中关注“星闻”的人数为ξ,求ξ的分布列及数学期望.
附:
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
K2=,n=a+b+c+d.
解:
(1)由已知得,所求概率P=1-=.
(2)由于K2==≈5.556>3.841,
故有95%以上的把握认为关注“星闻”与性别有关.
(3)由题意可得,从被调查的男大学生中抽取一位关注“星闻”的男大学生的概率为=,不关注“星闻”的概率为,ξ的所有可能取值为0,1,2,3,4.
P(ξ=0)=4=;P(ξ=1)=C××3=;
P(ξ=2)=C×2×2==;
P(ξ=3)=C×3×=;P(ξ=4)=4=.
所以ξ的分布列为
ξ
0
1
2
3
4
P
因为ξ~B,所以E(ξ)=.
3.(2018·潍坊统一考试)某机构为研究某种图书每册的成本费y(单位:
元)与印刷数量x(单位:
千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值.
(xi-)2
(xi-)(yi-)
(ui-)2
(ui-)(yi-)
15.25
3.63
0.269
2085.5
-230.3
0.787
7.049
表中ui=,=i.
(1)根据散点图判断:
y=a+bx与y=c+哪一个模型更适合作为该图书每册的成本费y(单位:
元)与印刷数量x(单位:
千册)的回归方程?
(只要求给出判断,不必说明理由)
(2)根据
(1)的判断结果及表中数据,建立y关于x的回归方程(回归系数的结果精确到0.01).
(3)若该图书每册的定价为10元,则至少应该印刷多少册才能使销售利润不低于78840元?
(假设能够全部售出.结果精确到1)
附:
对于一组数据(ω1,v1),(ω2,v2),…,(ωn,vn),其回归直线=+ω的斜率和截距的最小二乘估计分别为=,=-.
解:
(1)由散点图判断,y=c+更适合作为该图书每册的成本费y(单位:
元)与印刷数量x(单位:
千册)的回归方程.
(2)令u=,先建立y关于u的线性回归方程,
由于==≈8.957≈8.96,
∴=-·=3.63-8.957×0.269≈1.22,
∴y关于u的线性回归方程为=1.22+8.96u,
∴y关于x的回归方程为=1.22+.
(3)假设印刷x千册,依题意得10x-1.22+x≥78.840,
∴x≥10,
∴至少印刷10000册才能使销售利润不低于78840元.
4.(2019届高三·广州调研)某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.根据过去50周的资料显示,该地周光照量X(小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周.根据统计,该基地的西红柿增加量y(千克)与使用某种液体肥料的质量x(千克)之间的关系为如图所示的折线图.
(1)依据折线图,是否可用线性回归模型拟合y与x的关系?
请计算相关系数r并加以说明(精确到0.01).(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合)
(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如下关系:
周光照量X(单位:
小时)
3050≤X≤70
X>70
光照控制仪运行台数
3
2
1
若某台光照控制仪运行,则该台光照控制仪周利润为3000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1000元.以频率作为概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?
附:
相关系数公式r=,
参考数据:
≈0.55,≈0.95.
解:
(1)由已知数据可得==5,
==4.
因为(xi-)(yi-)=(-3)×(-1)+0+0+0+3×1=6,
==2,
==.
所以相关系数r===≈0.95.
因为r>0.75,所以可用线性回归模型拟合y与x的关系.
(2)记商家周总利润为Y元,由条件可知至少需安装1台,最多安装3台光照控制仪.
①安装1台光照控制仪可获得周总利润3000元.
②安装2台光照控制仪的情形:
当X>70时,只有1台光照控制仪运行,此时周总利润Y=3000-1000=2000(元),P(Y=2000)==0.2,
当30故Y的分布列为
Y
2000
6000
P
0.2
0.8
所以E(Y)=2000×0.2+6000×0.8=5200(元).
③安装3台光照控制仪的情形:
当X>70时,只有1台光照控制仪运行,此时周总利润Y=1×3000-2×1000=1000(元),
P(Y=1000)==0.2,
当50≤X≤70时,有2台光照控制仪运行,此时周总利润Y=2×3000-1×1000=5000(元),
P(Y=5000)==0.7,
当30故Y的分布列为
Y
1000
5000
9000
P
0.2
0.7
0.1
所以E(Y)=1000×0.2+5000×0.7+9000×0.1=4600(元).
综上可知,为使商家周总利润的均值达到最大,应该安装2台光照控制仪.