高考数学一轮复习专题变量间的相关关系与统计案例Word文档下载推荐.docx
《高考数学一轮复习专题变量间的相关关系与统计案例Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《高考数学一轮复习专题变量间的相关关系与统计案例Word文档下载推荐.docx(31页珍藏版)》请在冰豆网上搜索。
(1)分类变量:
变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
(2)列联表:
列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×
2列联表)为
2×
2列联表
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
a+c
b+d
a+b+c+d
构造一个随机变量K2=,其中n=a+b+c+d为样本容量.
(3)独立性检验
利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
【思考辨析】
判断下列结论是否正确(请在括号中打“√”或“×
”)
(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( ×
)
(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( √ )
(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( √ )
(4)某同学研究卖出的热饮杯数y与气温x(℃)之间的关系,得回归方程=-2.352x+147.767,则气温为2℃时,一定可卖出143杯热饮.( ×
(5)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.( √ )
(6)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( ×
1.(2015·
湖北)已知变量x和y满足关系=-0.1x+1,变量y与z正相关.下列结论中正确的是( )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
答案 C
解析 因为=-0.1x+1,-0.1<
0,所以x与y负相关.又y与z正相关,故可设=y+(>
0),所以=-0.1x++,-0.1<
0,所以x与z负相关.故选C.
2.(教材改编)下面是2×
2列联表:
则表中a,b的值分别为( )
合计
21
73
22
25
47
46
120
A.94,72B.52,50C.52,74D.74,52
解析 ∵a+21=73,∴a=52.又a+22=b,∴b=74.
3.(2016·
河南八市质检)为了研究某大型超市当天销售额与开业天数的关系,随机抽取了5天,其当天销售额与开业天数的数据如下表所示:
开业天数x
10
20
30
40
50
当天销售额y/万元
62
75
81
89
根据上表提供的数据,求得y关于x的线性回归方程为=0.67x+54.9,由于表中有一个数据模糊看不清,请你推断出该数据的值为( )
A.67B.68C.68.3D.71
答案 B
解析 设表中模糊看不清的数据为m,因为==30,
又样本中心点(,)在回归直线=0.67x+54.9上,
所以==0.67×
30+54.9,得m=68,故选B.
4.(2017·
湖南三校联考)某产品在某零售摊位的零售价x(单位:
元)与每天的销售量y(单位:
个)的统计资料如下表所示:
x
16
17
18
19
y
34
41
31
由上表可得线性回归方程=x+中的=-4,据此模型预测零售价为15元时,每天的销售量为( )
A.51个B.50个C.49个D.48个
解析 由题意知=17.5,=39,代入线性回归方程得
=109,109-15×
4=49,故选C.
5.(2016·
玉溪一中月考)利用独立性检验来判断两个分类变量X和Y是否有关系,通过查阅下表来确定“X和Y有关系”的可信度.为了调查用电脑时间与视力下降是否有关系,现从某地网民中抽取100位居民进行调查.经过计算得K2≈3.855,那么就有________%的把握认为用电脑时间与视力下降有关系.
P(K2≥k0)
0.05
0.025
0.010
0.005
0.001
k0
3.841
5.024
6.635
7.879
10.828
答案 95
解析 根据表格发现3.855>
3.841,3.841对应的是0.05,所以根据独立性检验原理可知有95%
的把握认为用电脑时间与视力下降有关系.
题型一 相关关系的判断
例1
(1)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423;
②y与x负相关且=-3.476x+5.648;
③y与x正相关且=5.437x+8.493;
④y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是( )
A.①②B.②③
C.③④D.①④
(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为________.
①x,y是负相关关系;
②在该相关关系中,若用y=c1拟合时的相关系数的平方为r,用=x+拟合时的相关系数的平方为r,则r>
r;
③x、y之间不能建立线性回归方程.
答案
(1)D
(2)①②
解析
(1)由线性回归方程=x+知当>
0时,y与x正相关,当<
0时,y与x负相关,∴①④一定错误.
(2)①显然正确;
由散点图知,用y=c1拟合的效果比用=x+拟合的效果要好,故②正确;
x,y之间能建立线性回归方程,只不过预报精度不高,故③不正确.
思维升华 判定两个变量正、负相关性的方法
(1)画散点图:
点的分布从左下角到右上角,两个变量正相关;
点的分布从左上角到右下角,两个变量负相关.
(2)相关系数:
r>
0时,正相关;
r<
0时,负相关.
(3)线性回归方程中:
>
<
(1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1B.0C.D.1
(2)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);
变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )
A.r2<r1<0B.0<r2<r1
C.r2<0<r1D.r2=r1
答案
(1)D
(2)C
解析
(1)所有点均在直线上,则样本相关系数最大,即为1,故选D.
(2)对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;
对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0,故选C.
题型二 线性回归分析
例2 (2016·
全国丙卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:
亿吨)的折线图.
注:
年份代码17分别对应年份2008-2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:
i=9.32,iyi=40.17,=0.55,≈2.646.
参考公式:
相关系数r=,
回归方程=+t中斜率和截距的最小二乘估计公式分别为:
=,=-.
解
(1)由折线图中数据和附注中参考数据得
=4,(ti-)2=28,=0.55.
(ti-)(yi-)=iyi-i=40.17-4×
9.32=2.89,
所以r≈≈0.99.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
(2)由=≈1.331及
(1)得==≈0.103,
=-≈1.331-0.103×
4≈0.92.
所以y关于t的回归方程为=0.92+0.10t.
将2016年对应的t=9代入回归方程得=0.92+0.10×
9=1.82.
所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.
思维升华 线性回归分析问题的类型及解题方法
(1)求线性回归方程
①利用公式,求出回归系数,.②待定系数法:
利用回归直线过样本点的中心求系数.
(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.
(3)利用回归直线判断正、负相关;
决定正相关还是负相关的是系数.
(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.
(2015·
课标全国Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:
千元)对年销售量y(单位:
t)和年利润z(单位:
千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
(xi-)2
(wi-)2
(xi-)·
(yi-)
(wi-)·
46.6
563
6.8
289.8
1.6
1469
108.8
表中wi=,=i.
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?
(给出判断即可,不必说明理由)
(2)根据
(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据
(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:
对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线=+u的斜率和截距的最小二乘估计分别为
=,=-.
解
(1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)令w=,先建立y关于w的线性回归方程,由于
===68,
=-=563-68×
6.8=100.6,
所以y关于