【解析】选D.在简单随机抽样、系统抽样、分层抽样中每个个体被抽到的机会是均等的,即每个个体被抽到的概率是相等的,故p1=p2=p3.
2.(xx·福州一模)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )
类别
人数
老年教师
900
中年教师
1800
青年教师
1600
总计
4300
【解析】选C.设样本中的老年教师人数为x,则=,解得x=180.
3.(xx·合肥一模)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为 ( )
A.8B.15C.16D.32
【解析】选C.若x1,x2,…,xn的标准差为s,
则ax1+b,ax2+b,…,axn+b的标准差为as.
由题意s=8,则所求标准差为2×8=16.
【加固训练】(xx·宿州一模)如果数据x1,x2,x3,…,xn的平均数为,标准差为s,则数据3x1+2,3x2+2,…,3xn+2的平均数和标准差分别是 ( )
A.3和9s B.3和3s
C.3+2和9s D.3+2和3s
【解析】选D.
=
==3+2,
=3
=3s.
4.(xx·昆明二模)已知变量x与y之间的线性回归方程为=-3+2x,若xi=17,则yi的值等于 ( )
A.3B.4C.0.4 D.40
【解析】选B.依题意==1.7,
而直线=-3+2x一定经过样本点的中心(,),
所以=-3+2x=-3+2×1.7=0.4,
所以yi=0.4×10=4.
【加固训练】(xx·钦州一模)春节期间,某销售公司每天销售某种取暖商品的销售额y(单位:
万元)与当天的平均气温x(单位:
℃)有关.现收集了春节期间这个销售公司4天的x与y的数据列于下表:
平均气温(℃)
-2
-3
-5
-6
销售额(万元)
20
23
27
30
根据以上数据,用线性回归的方法,求得y与x之间的线性回归方程=x+的系数=-,则=__________.
【解析】由表中数据可得=-4,=25,
所以线性回归方程=-x+过点(-4,25),
代入方程得25=-×(-4)+,
解得=.
答案:
二、填空题(每小题5分,共10分)
5.(xx·太原一模)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为__________.
【解析】平均数==6.
答案:
6
6.(xx·吉林二模)某校举行了由全部学生参加的校园安全知识考试,从中抽出
60名学生,将其成绩分成六段[40,50),[50,60),…,[90,100]后,画出如图所示
的频率分布直方图.观察图形的信息,回答下列问题:
估计这次考试的及格率(60分及以上为及格)为__________.
【解析】由频率分布直方图可知60分以下的成绩频率为(0.01+0.015)×10=0.25,所以及格率为1-0.25=0.75.
答案:
0.75
三、解答题(7题12分,8题13分,共25分)
7.(15分)(xx·绵阳二模)微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为了调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:
(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.
(1)根据女性频率分布直方图估计女性使用微信的平均时间.
(2)若每天玩微信超过4小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成2×2的列联表,并判断是否在犯错误的概率不超过0.1的前提下(有90%的把握)认为“微信控”与“性别”有关?
微信控
非微信控
总计
男性
50
女性
50
总计
100
参考公式:
K2=,其中n=a+b+c+d.
参考数据:
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
【解析】
(1)女性平均使用微信的时间为:
0.16×1+0.24×3+0.28×5+0.2×7+0.12×9=4.76(小时).
(2)由2(0.04+a+0.14+2×0.12)=1,解得a=0.08,
可得
微信控
非微信控
总计
男性
38
12
50
女性
30
20
50
总计
68
32
100
K2的观测值k=≈2.941>2.706,
所以在犯错误的概率不超过0.1的前提下(有90%的把握)认为“微信控”与“性别”有关.
(20分钟 45分)
一、选择题(每小题5分,共20分)
1.从800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号,求得间隔数k==16,即每16人抽取一个人.在1~16中随机抽取一个数,如果抽到的是7,则从33~48这16个数中应取的数是 ( )
A.40B.39C.38D.37
【解析】选B.按系统抽样分组,33~48这16个数属第3组,则这一组应抽到的数是7+2×16=39.
2.已知某地的财政收入x与支出y满足线性回归方程=x++e(单位:
亿元),其中=0.8,=2,|e|≤0.5,如果今年该地区财政收入为10亿元,则今年支出预计不会超过 ( )
A.10亿B.9亿C.10.5亿D.9.5亿
【解析】选C.当x=10时,=0.8×10+2+e=10+e.
又|e|≤0.5,所以≤10.5.
3.一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为
( )
A.9B.3C.17D.-11
【解析】选A.设这个数为x,则平均数为,
众数为2,若x≤2,则中位数为2,此时x=-11;
若2若x≥4,则中位数为4,2×4=+2,x=17,
所有可能值为-11,3,17,故其和为-11+3+17=9.
【加固训练】将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为 ( )
A.B.C.36D.
【解析】选B.根据茎叶图,去掉1个最低分87,1个最高分99,
则[87+94+90+91+90+(90+x)+91]=91,所以x=4.
所以s2=[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=.
4.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
4
5
6
7
8
9
销量y(件)
90
84
83
80
75
68
由表中数据,求得线性回归方程=-4x+,若在这些样本点中任取一点,则它在回归直线左下方的概率为 ( )
A. B. C. D.
【解析】选B.由表中数据得=6.5,=80.
由(,)在直线=-4x+上,得=106.
即线性回归方程为=-4x+106.
经过计算只有(5,84)和(9,68)在直线的下方,
故所求概率为=.
二、填空题(每小题5分,共10分)
5.为了研究雾霾天气的治理情况,某课题组对部分城市进行空气质量调查,按地域特点把这些城市分成甲、乙、丙三组,已知三组城市的个数分别为4,y,z,依次构成等差数列,且4,y,z+4成等比数列,若用分层抽样抽取6个城市,则乙组中应抽取的城市个数为__________.
【解析】由题意可得即
解得z=12,或z=-4(舍去),故y=8.
所以甲、乙、丙三组城市的个数分别为4,8,12.
因为一共要抽取6个城市,所以抽样比为=.
故乙组城市应抽取的个数为8×=2.
答案:
2
6.某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:
女
男
总计
喜爱
40
20
60
不喜爱
20
30
50
总计
60
50
110
试根据样本估计总体的思想,估计在犯错误的概率不超过__________的前提下(约有__________的把握)认为“喜爱该节目与否和性别有关”.
参考附表:
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
(参考公式:
K2=,其中n=a+b+c+d)
【解析】假设喜爱该节目和性别无关,分析列联表中数据,可得K2的观测值k=≈7.822>6.635,所以在犯错误的概率不超过0.01的前提下(有99%的把握)认为“喜爱该节目与否和性别有关”.
答案:
0.01 99%
三、解答题
7.(15分)某品牌手机厂商推出新款的旗舰机型,并在某地区跟踪调查得到这款手机上市时间(x个月)和市场占有率(y%)的几组相关对应数据.
x
1
2
3
4
5
y
0.02
0.05
0.1
0.15
0.18
(1)根据上表中的数据,用最小二乘法求出y关于x的线性回归方程.
(2)根据上述回归方程,分析该款旗舰机型市场占有率的变化趋势,并预测自上市起经过多少个月,该款旗舰机型市场占有率能超过0.5%(精确到月)?
附:
=
=-.
【解析】
(1)根据表中数据,计算=×(1+2+3+4+5)=3,
=×(0.02+0.05+0.1+0.15+0.18)=0.1,
所以=
=0.042,
所以=0.1-0.042×3=-0.026,
所以线性回归方程=0.042x-0.026.
(2)由上面的回归方程可知,上市时间与市场占有率正相关,即上市时间每增加1个月,市场占有率约增加0.042个百分点;
由=0.042x-0.026>0.5,解得x≥13;
预计上市13个月时,市场占有率能超过0.5%.
1.(xx·唐山二模)二手车经销商小王对其所经营的某一型号二手汽车的使用年数x(0万元/辆)进行整理,得到如下的对应数据:
使用年数
2
4
6
8
10
售价
16
13
9.5
7
4.5
(1)试求y关于x的回归方程.(参考公式:
=
=-).
(2)已知每辆该型号汽车的收购价格为w=0.05x2-1.75x+17.2万元,根据
(1)中所求的回归方程,预测x为何值时,小王销售一辆该型号汽车所获得的利润z最大?
【解析】
(1)由表中数据得,=×(2+4+6+8+10)=6,
=×(16+13+9.5+7+4.5)=10,
由最小二乘法求得
=
=-1.45,
=10-(-1.45)×6=18.7,
所以y关于x的回归方程为=-1.45x+18.7.
(2)根据题意,利润函数为
z=y-w=(-1.45x+18.7)-(0.05x2-1.75x+17.2)
=-0.05x2+0.3x+1.5,
所以,当x=-=3时,二次函数z取得最大值,即预测x=3时,小王销售一辆该型号汽车所获得的利润z最大.
2.为了解春季昼夜温差大小与某种子发芽多少之间的关系,现在从4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天100颗种子浸泡后的发芽数,得到如下表格:
日期
4月1日
4月7日
4月15日
4月21日
4月30日
温差x/℃
10
11
13
12
8
发芽数y/颗
23
25
30
26
16
(1)从这5天中任选2天,记发芽的种子数分别为m,n,求事件“m,n均不小于25”的概率.
(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另3天的数据,求出y关于x的线性回归方程=x+.
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问
(2)中所得的线性回归方程是否可靠?
【解析】
(1)所有的基本事件为(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(26,16),共10个.
设“m,n均不小于25”为事件A,则事件A包含的基本事件为(25,30),(25,26),(30,26),共3个.所以P(A)=.
(2)由数据得,另3天的平均数=12,=27,3=972,3=432,xiyi=977,=434,
所以==,=27-×12=-3,
所以y关于x的线性回归方程为=x-3.
(3)依题意得,当x=10时,=22,|22-23|<2;
当x=8时,=17,|17-16|<2,
所以
(2)中所得到的线性回归方程是可靠的.
3.(xx·安庆二模)随着“全面二孩”政策推行,我市将迎来生育高峰,今年新春伊始,宜成各医院产科就已经是一片忙碌,至今热度不减.卫生部门进行调查统计,期间发现各医院的新生儿中,不少都是“二孩”;在市第一医院,共有40个猴宝宝降生,其中20个是“二孩”宝宝;市妇幼保健院共有30个猴宝宝降生,其中10个是“二孩”宝宝.
(1)从两个医院当前出生的所有宝宝中按分层抽样方法抽取7个宝宝做健康咨询.
①在市第一医院出生的一孩宝宝中抽取多少个?
②若从7个宝宝中抽取两个宝宝进行体检,求这两个宝宝恰出生不同医院且均属“二孩”的概率.
(2)根据以上数据,能否认为一孩或二孩宝宝的出生与医院有关?
附:
K2=.
P(K2≥k0)
0.4
0.25
0.15
0.10
k0
0.708
1.323
2.072
2.706
【解析】
(1)①7××=2.
②在抽取7个宝宝中,出生在市第一医院的二孩宝宝有2人,出生在市妇幼保健院的二孩宝宝有1人,从7个宝宝中随机抽取2个的可能事件共有=21个,其中两个宝宝恰出生不同医院且均属“二孩”的基本事件有·=2个.
所以两个宝宝恰出生不同医院且均属“二孩”的概率P=.
(2)列联表如下:
一孩
二孩
总计
第一医院
20
20
40
市妇幼保健院
20
10
30
总计
40
30
70
K2的观测值k==≈1.944<2.072,没有充分证据显示一孩、二孩宝宝的出生与医院有关.