高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理.docx

上传人:b****5 文档编号:11979119 上传时间:2023-04-16 格式:DOCX 页数:18 大小:220.68KB
下载 相关 举报
高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理.docx_第1页
第1页 / 共18页
高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理.docx_第2页
第2页 / 共18页
高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理.docx_第3页
第3页 / 共18页
高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理.docx_第4页
第4页 / 共18页
高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理.docx_第5页
第5页 / 共18页
点击查看更多>>
下载资源
资源描述

高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理.docx

《高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理.docx》由会员分享,可在线阅读,更多相关《高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理.docx(18页珍藏版)》请在冰豆网上搜索。

高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理.docx

高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理

考点测试67 变量间的相关关系与统计案例

一、基础小题

1.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是(  )

A.=-2x+100B.=2x+100

C.=-2x-100D.=2x-100

答案 A

解析 B、D为正相关,C中值恒为负,不符合题意.

2.某产品的广告费用x与销售额y的统计数据如下表:

广告费用x/万元

4

2

3

5

销售额y/万元

49

26

39

54

根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为(  )

A.63.6万元B.65.5万元

C.67.7万元D.72.0万元

答案 B

解析 ∵=-=-9.4×=9.1,∴回归方程为=9.4x+9.1.令x=6,得=9.4×6+9.1=65.5(万元).

3.设某大学的女生体重y(单位:

kg)与身高x(单位:

cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是(  )

A.y与x具有正的线性相关关系

B.回归直线过样本点的中心(,)

C.若该大学某女生身高增加1cm,则其体重约增加0.85kg

D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg

答案 D

解析 由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确.又线性回归方程必过样本点中心(,),因此B正确.由线性回归方程中系数的意义知,x每增加1cm,其体重约增加0.85kg,故C正确.当某女生的身高为170cm时,其体重估计值是58.79kg,而不是具体值,因此D不正确.

4.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为(  )

A.-1B.0C.D.1

答案 D

解析 样本点都在直线上时,其数据的估计值与真实值是相等的,即yi=i,代入相关系数公式r==1.

5.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是(  )

A.直线l过点(,)

B.x和y的相关系数为直线l的斜率

C.x和y的相关系数在0到1之间

D.当n为偶数时,分布在l两侧的样本点的个数一定相同

答案 A

解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以B、C错误;D中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以D错误;根据线性回归直线一定经过样本点中心可知A正确.

6.在一次对性别与说谎是否相关的调查中,得到如下数据:

说谎

不说谎

合计

6

7

13

8

9

17

合计

14

16

30

根据表中数据,得到如下结论中正确的一项是(  )

A.在此次调查中有95%的把握认为是否说谎与性别有关

B.在此次调查中有99%的把握认为是否说谎与性别有关

C.在此次调查中有99.5%的把握认为是否说谎与性别有关

D.在此次调查中没有充分的证据显示说谎与性别有关

答案 D

解析 由于K2=≈0.0024,由于K2很小,因此,在此次调查中没有充分的证据显示说谎与性别有关.故选D.

7.如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.

答案 D

解析 由散点图知呈带状区域时有较强的线性相关关系,故去掉D.

8.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:

又发作过心脏病

未发作过心脏病

合计

心脏搭桥手术

39

157

196

血管清障手术

29

167

196

合计

68

324

392

试根据上述数据计算K2=________.

根据表中所给的数据,能否在犯错误的概率不超过0.15的前提下认为这两种手术对病人又发作过心脏病的影响有差别?

________________________________________________________________________.

答案 1.779 不能作出这两种手术对病人又发作心脏病的影响有差别的结论

解析 根据列联表中的数据,

可以求得K2=≈1.779,而K2<2.072,

所以我们不能在犯错误的概率不超过0.15的前提下,作出这两种手术对病人又发作心脏病的影响有差别的结论.

二、高考小题

9.[2015·全国卷Ⅱ]根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:

万吨)柱形图,以下结论中不正确的是(  )

A.逐年比较,2008年减少二氧化硫排放量的效果最显著

B.2007年我国治理二氧化硫排放显现成效

C.2006年以来我国二氧化硫年排放量呈减少趋势

D.2006年以来我国二氧化硫年排放量与年份正相关

答案 D

解析 由柱形图,知2006年以来我国二氧化硫年排放量呈减少趋势,故其排放量与年份负相关,故D错误.

10.[2015·福建高考]为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:

收入x(万元)

8.2

8.6

10.0

11.3

11.9

支出y(万元)

6.2

7.5

8.0

8.5

9.8

根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为(  )

A.11.4万元B.11.8万元

C.12.0万元D.12.2万元

答案 B

解析 ∵==10,

==8,

∴=-0.76=8-0.76×10=0.4,

∴=0.76x+0.4.

当x=15时,=0.76×15+0.4=11.8.

11.[2014·江西高考]某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是(  )

表1

   成绩

性别   

不及格

及格

总计

6

14

20

10

22

32

总计

16

36

52

表2

   视力

性别   

总计

4

16

20

12

20

32

总计

16

36

52

表3

   智商

性别   

偏高

正常

总计

8

12

20

8

24

32

总计

16

36

52

表4

 阅读量

性别   

丰富

不丰富

总计

14

6

20

2

30

32

总计

16

36

52

A.成绩B.视力C.智商D.阅读量

答案 D

解析 根据K2=,代入题中数据计算得

表1:

K2=≈0.009;

表2:

K2=≈1.769;

表3:

K2=≈1.3;

表4:

K2=≈23.48.

∵D选项K2最大,

∴阅读量与性别有关联的可能性最大,故选D.

12.[2014·湖北高考]根据如下样本数据

x

3

4

5

6

7

8

y

4.0

2.5

-0.5

0.5

-2.0

-3.0

得到的回归方程为=bx+a,则(  )

A.a>0,b>0B.a>0,b<0

C.a<0,b>0D.a<0,b<0

答案 B

解析 把样本数据中的x,y分别当作点的横、纵坐标,在平面直角坐标系xOy中作出散点图,由图可知b<0,a>0.故选B.

13.[2014·重庆高考]已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是(  )

A.=0.4x+2.3B.=2x-2.4

C.=-2x+9.5D.=-0.3x+4.4

答案 A

解析 由变量x与y正相关知C、D均错,又回归直线经过样本中心(3,3.5),代入验证得A正确,B错误.故选A.

三、模拟小题

14.[2017·大连双基测试]已知x,y的取值如表所示:

x

2

3

4

y

6

4

5

如果y与x线性相关,且线性回归方程为=x+,则的值为(  )

A.-B.C.-D.

答案 A

解析 将=3,=5代入到=x+中,得=-.故选A.

15.[2016·兰州、张掖联考]对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,…,8),其回归直线方程是=x+,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,则实数的值是(  )

A.B.C.D.

答案 B

解析 依题意可知样本中心点为,则=×+a,解得=.

16.[2016·漳州二模]下列说法错误的是(  )

A.在回归模型中,预报变量y的值不能由解释变量x唯一确定

B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强

C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高

D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好

答案 B

解析 对于A,在回归模型中,预报变量y的值由解释变量x和随机误差e共同确定,即x只能解释部分y的变化,∴A正确;对于B,线性回归分析中,相关系数r的绝对值越接近1,两个变量的线性相关性越强,反之,线性相关性越弱,∴B错误;对于C,在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,C正确;对于D,在回归分析中,用相关指数R2来刻画回归的效果时,R2取值越大,说明模型拟合的效果越好,∴R2为0.98的模型比R2为0.80的模型拟合的效果好,D正确.故选B.

17.[2017·温州月考]为了检验某套眼保健操预防学生近视的作用,把500名做该套眼保健操的学生与另外500名未做该套眼保健操的学生的视力情况作记录并比较,提出假设H0:

“这套眼保健操不能起到预防近视的作用”,利用2×2列联表计算所得的K2≈3.918.经查对临界值表知P(K2≥3.841)≈0.05.对此,四名同学得出了以下结论:

①有95%的把握认为“这套眼保健操能起到预防近视的作用”;②若某人未做该套眼保健操,那么他有95%的可能得近视;③这套眼保健操预防近视的有效率为95%;④这套眼保健操预防近视的有效率为5%.

其中所有正确结论的序号是________.

答案 ①

解析 根据查对临界值表知P(K2≥3.841)≈0.05,故有95%的把握认为“这套眼保健操能起到预防近视的作用”,即①正确;95%仅是指“这套眼保健操能起到预防近视的作用”的可信程度,所以②③④错误.

18.[2016·兰州一模]从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:

千元)与月储蓄yi(单位:

千元)的数据资料,计算得i=80,i=20,iyi=184,=720.已知家庭的月储蓄y关于月收入x的线性回归方程为=x+,则变量x与y________(填“正相关”或“负相关”);若该居民区某家庭月收入为7千元,预测该家庭的月储蓄是________千元.

答案 正相关 1.7

解析 由题意,知n=10,=i=8,=i=2,∴==0.3,=2-0.3×8=-0.4,

∴=0.3x-0.4,∵0.3>0,∴变量x与y正相关.当x=7时,=0.3×7-0.4=1.7(千元).

一、高考大题

1.[2016·全国卷Ⅲ]下图是我国2008年至2014年生活垃圾无害化处理量(单位:

亿吨)的折线图.

(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;

(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.

附注:

参考数据:

yi=9.32,tiyi=40.17,=0.55,≈2.646.

参考公式:

相关系数r=,

回归方程=+t中斜率和截距的最小二乘估计公式分别为:

=,=-.

解 

(1)由折线图中数据和附注中参考数据得

=4,(ti-)2=28,=0.55,

(ti-)(yi-)=tiyi-yi

=40.17-4×9.32=2.89,

r≈≈0.99.

因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.

(2)由=≈1.331及

(1)得==≈0.103,

=-=1.331-0.103×4≈0.92.

所以y关于t的回归方程为=0.92+0.10t.

将2016年对应的t=9代入回归方程得

=0.92+0.10×9=1.82.

所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.

2.[2015·全国卷Ⅰ]某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:

千元)对年销售量y(单位:

t)和年利润z(单位:

千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.

(xi-)2

(wi-)2

(xi-)(yi-)

(wi-)(yi-)

46.6

563

6.8

289.8

1.6

1469

108.8

表中wi=,=wi.

(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?

(给出判断即可,不必说明理由)

(2)根据

(1)的判断结果及表中数据,建立y关于x的回归方程;

(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据

(2)的结果回答下列问题:

①年宣传费x=49时,年销售量及年利润的预报值是多少?

②年宣传费x为何值时,年利润的预报值最大?

附:

对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为

=,=-.

解 

(1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.

(2)令w=,先建立y关于w的线性回归方程.

由于===68,

=-=563-68×6.8=100.6,

所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.

(3)①由

(2),知当x=49时,年销售量y的预报值

=100.6+68=576.6,

年利润z的预报值

=576.6×0.2-49=66.32.

②根据

(2)的结果,知年利润z的预报值

=0.2×(100.6+68)-x=-x+13.6+20.12,

所以当==6.8,即x=46.24时,取得最大值,

故年宣传费为46.24千元时,年利润的预报值最大.

二、模拟大题

3.[2016·石家庄模拟]班主任对班级22名学生进行了作业量多少的调查,数据如下:

在喜欢玩电脑游戏的12人中,有10人认为作业多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多.

(1)根据以上数据建立一个2×2列联表;

(2)试问喜欢玩电脑游戏与认为作业多少是否有关系.

参考公式:

K2=,其中n=a+b+c+d.

参考数据:

P(K2≥k0)

0.050

0.010

0.001

k0

3.841

6.635

10.828

解 

(1)根据题中所给数据,得到如下列联表:

认为作业多

认为作业不多

总计

喜欢玩

电脑游戏

10

2

12

不喜欢玩

电脑游戏

3

7

10

总计

13

9

22

(2)K2=≈6.418,

∵3.841<6.418,

∴有95%的把握认为喜欢玩电脑游戏与认为作业多少有关.

4.[2016·广东模拟]2016年1月1日起全国统一实施全面两孩政策,为了解适龄民众对放开生育二胎政策的态度,某市选取70后和80后作为调查对象,随机调查了100位,得到数据如下表:

生二胎

不生二胎

合计

70后

30

15

45

80后

45

10

55

合计

75

25

100

(1)以这100个人的样本数据估计该市的总体数据,且以频率估计概率,若从该市70后公民中随机抽取3位,记其中生二胎的人数为X,求随机变量X的分布列和数学期望;

(2)根据调查的数据,是否有90%以上的把握认为“生二胎与年龄有关”,并说明理由.

参考公式:

K2=,其中n=a+b+c+d

参考数据:

P(K2≥k)

0.15

0.10

0.05

0.025

0.010

0.005

k

2.072

2.706

3.841

5.024

6.635

7.879

解 

(1)由已知得70后“生二胎”的概率为,

并且X~B,

所以P(X=k)=Ck3-k(k=0,1,2,3),

其分布列如下:

X

0

1

2

3

P

所以E(X)=3×=2.

(2)K2=

=≈3.030>2.706,

所以有90%以上的把握认为“生二胎与年龄有关”.

5.[2017·成都诊断]PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:

时间

周一

周二

周三

周四

周五

车流量x(万辆)

100

102

108

114

116

浓度y(微克/立方米)

78

80

84

88

90

(1)根据上表数据,用最小二乘法求出y与x的线性回归方程;

(2)若周六同一时段车流量是200万辆,试根据

(1)求出的线性回归方程,预测此时PM2.5的浓度为多少?

参考公式:

=,=-·.

解 

(1)由条件可知=i==108,

=i==84,

(xi-)(yi-)=(-8)×(-6)+(-6)×(-4)+0×0+6×4+8×6=144,

(xi-)2=(-8)2+(-6)2+02+62+82=200,

===0.72,

=-=84-0.72×108=6.24,

故y关于x的线性回归方程为=0.72x+6.24.

(2)当x=200时,=0.72×200+6.24=150.24.

所以可以预测此时PM2.5的浓度约为150.24微克/立方米.

6.[2017·厦门质检]某单位共有10名员工,他们某年的收入如下表:

员工编号

1

2

3

4

5

6

7

8

9

10

年薪(万元)

3

3.5

4

5

5.5

6.5

7

7.5

8

50

(1)求该单位员工当年年薪的平均值和中位数;

(2)从该单位中任取2人,此2人中年薪高于5万的人数记为ξ,求ξ的分布列和期望;

(3)已知员工年薪与工作年限成正线性相关关系,若某员工工作第一年至第四年的年薪分别为3万元、4.2万元、5.6万元、7.2万元,预测该员工第五年的年薪为多少.

附:

线性回归方程=x+中系数计算公式=,=-,其中,表示样本均值.

解 

(1)平均值为10万元,中位数为6万元.

(2)年薪高于5万的有6人,低于或等于5万的有4人,所以从该单位中任取2人,此2人中年薪高于5万的人数记为ξ,ξ的可能取值为0,1,2.

P(ξ=0)==,P(ξ=1)==,

P(ξ=2)==,

所以ξ的分布列为:

ξ

0

1

2

P

E(ξ)=0×+1×+2×=.

(3)设xi,yi(i=1,2,3,4)分别表示工作年限及相应年薪,则=2.5,=5,

(xi-)2=2.25+0.25+0.25+2.25=5,

(xi-)(yi-)=-1.5×(-2)+(-0.5)×(-0.8)+0.5×0.6+1.5×2.2=7,

===1.4,

=-=5-1.4×2.5=1.5,

所以线性回归方程为=1.4x+1.5.

当x=5时,=8.5.

故可预测该员工第五年的年薪为8.5万元.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 销售营销

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1