届高三文科数学一轮复习导学案教师用书第11章第4节变量间的相关关系与统计案例.docx
《届高三文科数学一轮复习导学案教师用书第11章第4节变量间的相关关系与统计案例.docx》由会员分享,可在线阅读,更多相关《届高三文科数学一轮复习导学案教师用书第11章第4节变量间的相关关系与统计案例.docx(24页珍藏版)》请在冰豆网上搜索。
届高三文科数学一轮复习导学案教师用书第11章第4节变量间的相关关系与统计案例
第四节 变量间的相关关系与统计案例
考点
高考试题
考查内容
核心素养
线性回归分析
2017·全国卷Ⅰ·T19·12分
相关系数、均值、标准差
数据分析
独立性检验
2017·全国卷Ⅱ·T18·12分
独立性检验、相互独立事件的概率、直方图
数据分析
线性回归方程
2016·全国卷Ⅲ·T18·12分
利用线性回归方程解决实际问题
数据分析
2015·全国卷Ⅰ·T19·12分
回归直线方程的求法和应用
数据分析
命题分析
本节是高考考查的热点,主要考查回归分析,回归直线方程的求法及应用,独立性检验.多以解答题形式出现.
1.变量间的相关关系
(1)常见的两变量之间的关系有两类:
一类是函数关系,另一类是__相关关系__;与函数关系不同,__相关关系__是一种非确定性关系.
(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为__正相关__,点散布在左上角到右下角的区域内,两个变量的相关关系为__负相关__.
2.两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有__线性相关关系__,这条直线叫作__回归直线__.
(2)回归方程为
=
x+
,其中
=
=
.
=
-
.
(3)通过求Q=
(yi-bxi-a)2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫作最小二乘法.
(4)相关系数:
当r>0时,表明两个变量__正相关__;
当r<0时,表明两个变量__负相关__.
r的绝对值越接近于1,表明两个变量的线性相关性__越强__.r的绝对值越接近于0时,表明两个变量之间__几乎不存在线性相关关系__.通常|r|大于__0.75__时,认为两个变量有很强的线性相关性.
3.独立性检验
假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
K2=
(其中n=a+b+c+d为样本容量).
提醒:
1.辨明三个易误点
(1)回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(
,
)点,可能所有的样本数据点都不在直线上.
(2)利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值).
(3)虽然任何一组不完全相同的数据都可以求出回归直线方程,但只有具有线性相关关系的一组数据才能得到有意义的回归直线方程,求出的方程才具有实际价值.
2.求回归方程的方法
求解回归方程的关键是确定回归系数
,
,因求解
的公式计算量太大,一般题目中给出相关的量,如
,
,
,
iyi等,便可直接代入求解.充分利用回归直线过样本中心点(
,
),即有
=
+
,可确定
.
1.判断下列结论的正误(正确的打“√”,错误的打“×”)
(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( )
(2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示.( )
(3)通过回归方程
=
x+
可以估计和观测变量的取值和变化趋势.( )
(4)任何一组数据都对应着一个回归直线方程.( )
(5)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.( )
答案:
(1)×
(2)√ (3)√ (4)× (5)√
2.(2015·湖北卷)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( )
A.x与y负相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y正相关,x与z负相关
D.x与y负相关,x与z正相关
解析:
选A 由回归直线方程定义知,x与y负相关.由y与z正相关,可设其回归直线为y=kz+b,且k>0,所以x=-10kz-10b+10,则x与z负相关.
3.(教材习题改编)已知x,y的取值如下表,从散点图可以看出y与x之间有线性相关关系,且回归方程为
=0.95x+a,则a=( )
x
0
1
3
4
y
2.2
4.3
4.8
6.7
A.3.25 B.2.6
C.2.2 D.0
解析:
选B 由已知得
=2,
=4.5,因为回归方程经过点(
,
),所以a=4.5-0.95×2=2.6.
4.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病
B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病
C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误
D.以上三种说法都不正确
解析:
选C 根据独立性检验的思想知C项正确.
相关关系的判断
[明技法]
判定两个变量正、负相关性的方法
(1)画散点图:
点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)相关系数:
r>0时,正相关;r<0时,负相关.
(3)线性回归方程中:
>0时,正相关;
<0时,负相关.
[提能力]
【典例】
(1)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,分别得到以下四个结论:
①y与x负相关且
=2.347x-6.423;
②y与x负相关且
=-3.476x+5.648;
③y与x正相关且
=5.437x+8.493;
④y与x正相关且
=-4.326x-4.578.
其中一定不正确的结论的序号是( )
A.①② B.②③
C.③④D.①④
(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为________.
①x,y是负相关关系;
②在该相关关系中,若用y=c1ec2x拟合时的相关系数的平方为r
,用
=
x+
拟合时的相关系数的平方为r
,则r
>r
;
③x、y之间不能建立线性回归方程.
解析:
(1)
>0,正相关;
<0,负相关.
(2)由相关关系定义知①②正确.
答案:
(1)D
(2)①②
[刷好题]
1.(2018·资阳模拟)在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是( )
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%
B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%
C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%
D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%
解析:
选B 观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%,故选B.
2.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )
A.r2<r1<0 B.0<r2<r1
C.r2<0<r1D.r2=r1
解析:
选C 变量Y随X的增大而增大,故Y与X正相关,所以r1>0;变量V随U的增大而减小,故V与U负相关,即r2<0,所以r2<0<r1.
线性回归分析
[析考情]
回归方程的求解与运用计算量大,主要是通过最小二乘法求解回归直线方程,并进行相应的估计预测,题型既有小题也有解答题,难度不大,另外非线性回归分析问题也应引起足够重视.
[提能力]
【典例】
(1)(2017·山东卷)为了研究某班学生的脚长x(单位:
厘米)和身高y(单位:
厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系.设其回归直线方程为
=
x+
.已知
i=225,
i=1600,
=4.该班某学生的脚长为24,据此估计其身高为( )
A.160 B.163
C.166 D.170
解析:
选C ∵
i=225,∴
=
i=22.5.
∵
i=1600,∴
=
i=160.
又
=4,∴
=
-
=160-4×22.5=70.
∴回归直线方程为
=4x+70.
将x=24代入上式得
=4×24+70=166.故选C.
(2)(2015·重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2010
2011
2012
2013
2014
时间代号t
1
2
3
4
5
储蓄存款y(千亿元)
5
6
7
8
10
①求y关于t的回归方程
=
t+
;
②用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.
解:
①列表计算如下:
i
ti
yi
t
tiyi
1
1
5
1
5
2
2
6
4
12
3
3
7
9
21
4
4
8
16
32
5
5
10
25
50
∑
15
36
55
120
这里n=5,
=
i=
=3,
=
i=
=7.2.
又ltt=
-n
2=55-5×32=10,
lty=
iyi-n
=120-5×3×7.2=12,
从而
=
=
=1.2,
=
-
=7.2-1.2×3=3.6,
故所求回归方程为
=1.2t+3.6.
②将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为
=1.2×6+3.6=10.8(千亿元).
[悟技法]
1.回归直线方程中系数的2种求法
(1)利用公式,求出回归系数b,a.
(2)待定系数法:
利用回归直线过样本点中心求系数.
2.回归分析的2种策略
(1)利用回归方程进行预测:
把回归直线方程看作一次函数,求函数值.
(2)利用回归直线判断正、负相关:
决定正相关还是负相关的是回归系数r.
[刷好题]
(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:
千元)对年销售量y(单位:
t)和年利润z(单位:
千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
(xi-
)2
(wi-
)2
(xi-
)
(yi-
)
(wi-
)
(yi-
)
46.6
563
6.8
289.8
1.6
1469
108.8
表中wi=
,
=
i.
(1)根据散点图判断,y=a+bx与y=c+d
哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?
(给出判断即可,不必说明理由)
(2)根据
(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=