第2章 23 变量间的相关关系学案.docx
《第2章 23 变量间的相关关系学案.docx》由会员分享,可在线阅读,更多相关《第2章 23 变量间的相关关系学案.docx(17页珍藏版)》请在冰豆网上搜索。
第2章23变量间的相关关系学案
§2.3 变量间的相关关系
2.3.1变量之间的相互关系
2.3.2两个变量的线性相关
【明目标、知重点】
1.理解两个变量的相关关系的概念.
2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.
3.会求回归直线的方程.
【填要点、记疑点】
1.两个变量的线性相关
(1)散点图:
将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到的图形.
(2)正相关与负相关:
①正相关:
散点图中的点散布在从左下角到右上角的区域.
②负相关:
散点图中的点散布在从左上角到右下角的区域.
2.回归直线的方程
(1)回归直线:
如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归方程:
回归直线对应的方程叫做回归直线的方程,简称回归方程.
(3)回归方程
=
x+
,其中
是回归方程的斜率,
是截距.
3.最小二乘法
通过求Q=
(yi-bxi-a)2的最小值而得出回归直线的方法,即求出的回归直线使样本数据中的点到它的距离的平方和最小的方法叫做最小二乘法.
【探要点、究所然】
[情境导学] 在学校里,老师对学生经常这样说:
“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,显然,这种关系不能用我们熟悉的函数关系来描述,那么这究竟是一种什么关系?
下面我们共同来研究.
探究点一 变量之间的相关关系
思考1 当一个变量的取值一定时,另一个变量的取值被唯一确定,则这两个变量之间是怎样的关系?
考察下列问题中两个变量之间是什么关系?
为什么?
(1)商品销售收入与广告支出经费;
(2)粮食产量与施肥量;
(3)人体内的脂肪含量与年龄.
答 当一个变量的取值一定时,另一个变量的取值被唯一确定,这两个变量是一个函数关系.
(1)、
(2)、(3)都不是函数关系,因为当其中一个变量变化时,另一个变量的变化还受其它因素的影响.
思考2 “名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?
为什么?
答 不是函数关系.因为学生的成绩提高的原因是多个因素的共同结果,并不由老师这一个因素唯一确定.况且一个老师教几十个学生,也有成绩差的.
小结 思考1、思考2中两个变量之间的关系是一种非确定性关系,称之为相关关系.
思考3 函数关系与相关关系之间的区别与联系是怎样的?
答 函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.函数关系是一种因果关系而相关关系不一定是因果关系,也可能是伴随关系,函数关系与相关关系之间有着密切联系,在一定条件下可以互相转化.
例1 在下列两个变量的关系中,哪些是相关关系?
①正方形边长与面积之间的关系;
②作文水平与课外阅读量之间的关系;
③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系.
解 两变量之间的关系有两种:
函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系.
反思与感悟 如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.
跟踪训练1 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?
有人认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?
解 从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.
探究点二 散点图
问题 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:
年龄
23
27
39
41
45
49
50
脂肪
9.5
17.8
21.2
25.9
27.5
26.3
28.2
年龄
53
54
56
57
58
60
61
脂肪
29.6
30.2
31.4
30.8
33.5
35.2
34.6
思考1 观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?
答 随着年龄的增加,人体中脂肪的百分比也有所增加.
思考2 以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?
答
思考3 阅读教材85页,你能说出散点图的定义吗?
答 在平面直角坐标系中,表示两个变量的一组数据图形,称为散点图.
思考4 阅读教材86页上半页后,你能说出正相关是如何定义的吗?
类比正相关的定义,你能给负相关下个定义吗?
答 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.一个变量随另一个变量的变大而变小称为负相关,散点图中的点散布在从左上角到右下角的区域.
思考5 你能列举一些生活中的变量成正相关或负相关的实例吗?
答 成正相关的如:
商品销售收入与广告支出经费;作文水平与课外阅读量;粮食产量与施肥量.成负相关的如:
在一定范围内汽车的重量和汽车每消耗1L汽油所行驶的平均路程.
例2 以下是某地搜集到的新房屋的销售价格和房屋面积的数据:
房屋面积m2
61
70
115
110
80
135
105
销售价格(万元)
12.2
15.3
24.8
21.6
18.4
29.2
22
画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关.
解 散点图如下:
由上图可看出,销售价格与房屋面积这两个变量正相关.
反思与感悟 画散点图时应注意合理选择单位长度,避免图形过大或过小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.
跟踪训练2 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:
零件数x(个)
10
20
30
40
50
60
70
80
90
100
加工时间y(min)
62
68
75
81
89
95
102
108
115
122
(1)画出散点图;
(2)关于加工零件的个数与加工时间,你能得出什么结论?
解
(1)散点图如下:
(2)加工零件的个数与所花费的时间呈正线性相关关系.
探究点三 回归直线
思考1 在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?
答 这些点大致分布在一条直线附近.
小结 回归直线的定义:
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
思考2 在样本数据的散点图中,能否用直尺准确画出回归直线?
借助计算机怎样画出回归直线?
答 不能用直尺准确画出回归直线.用计算机中Excel可以方便地画出回归直线(见教材).
探究点四 回归方程
问题 在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为回归方程.对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计,那么如何求出回归直线的方程呢?
思考1 回归直线与散点图中各点的位置应具有怎样的关系?
答 整体上最接近.选择能反映直线变化的两个点.
思考2 对一组具有线性相关关系的样本数据:
(x1,y1),(x2,y2),…,(xn,yn),设其回归方程为
=bx+a,可以用哪些数量关系来刻画各样本点与回归直线的接近程度?
答 可以用|yi-
i|或(yi-
i)2,其中
i=bxi+a.(如图)
思考3 为了从整体上反映n个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适?
答 Q=
(yi-
i)2
=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2.
小结 根据有关数学原理分析,当
=
=
,
=
-
时,总体偏差Q=
(yi-
i)2为最小,这样就得到了回归方程,这种求回归方程,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.
思考4 回归方程中,
,
的几何意义分别是什么?
答
是回归方程的斜率,
是截距.
思考5 利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程
=0.577x-0.448,由此我们可以根据一个人的年龄预测其体内脂肪含量的百分比的回归值.若某人37岁,则其体内脂肪含量的百分比约为多少?
答 将x=37代入方程
=0.577x-0.448,
得0.577×37-0.448=20.901.
所以其体内脂肪含量的百分比约为20.901%.
例3 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:
摄氏温度/℃
-5
0
4
7
12
15
19
23
27
31
36
热饮杯数
156
150
132
128
130
116
104
89
93
76
54
(1)画出散点图;
(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;
(3)求回归方程;
(4)如果某天的气温是2℃,预测这天卖出的热饮杯数.
解
(1)散点图如图所示:
(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.
(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式求出回归方程的系数.利用计算器容易求得回归方程
=-2.352x+147.767.
(4)当x=2时,
=143.063.因此,某天的气温为2℃时,这天大约可以卖出143杯热饮.
反思与感悟 对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b的计算公式,算出a,b.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的计算顺序:
计算平均数
,
;计算xi与yi的积,求∑xiyi;计算∑x
;将结果代入公式求
;用
=
-
求
;写出回归直线方程.
思考6 气温为2℃时,小卖部一定能够卖出143杯左右热饮吗?
为什么?
答 小卖部不一定能够卖出143杯左右热饮,原因如下:
(1)回归方程中的截距和斜率都是通过样本估计出来的,存在误差,这种误差可以导致预测结果的偏差.
(2)即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x的预报值,能够与实际值y很接近.我们不能保证点(x,y)落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近.
跟踪训练3 下表为某地近几年机动车辆数与交通事故数的统计资料.
机动车辆数x/千台
95
110
112
120
129
135
150
180
交通事故数y/千件
6.2
7.5
7.7
8.5
8.7
9.8
10.2
13
(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说明理由;
(2)如果具有线性相关关系,求出回归直线方程.
解
(1)在直角坐标系中画出数据的散点图,如下图.
直观判断散点在一条直线附近,故具有线性相关关系.
(2)计算相应的数据之和:
i=1031,
i=71.6,
=137835,
iyi=9611.7.
将它们代入公式计算得
≈0.0774,
≈-1.0249,
所以,所求回归方程为
=0.0774x-1.0249.
【当堂测、查疑缺】
1.下列两个变量之间的关系,哪个不是函数关系()
A.正方体的棱长和体积
B.圆半径和圆的面积
C.正n边形的边数和内角度数之和
D.人的年龄和身高
答案 D
解析A、B、C都是函数关系,对于A,V=a3;对于B,S=πr2;对于C,g(n)=(n-2)π.而对于年龄确定的不同的人可以有不同的身高,∴选D.
2.设某大学的女生体重y(单位:
kg)与身高x(单位:
cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为
=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(
,
)
C.若该大学某女生身高增加1cm,则其体重约增加0.85kg
D.若该大学某女生身高为170cm,则可判定其体重必为58.79kg
答案 D
解析 当x=170时,
=0.85×170-85.71=58.79,体重的估计值为58.79kg.
3.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程
=
x+
中的
为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元B.65.5万元
C.67.7万元D.72.0万元
答案 B
解析 由题意可知
=3.5,
=42,则42=9.4×3.5+
,
=9.1,
=9.4×6+9.1=65.5,答案应选B.
4.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且
=2.347x-6.423;
②y与x负相关且
=-3.476x+5.648;
③y与x正相关且
=5.437x+8.493;
④y与x正相关且
=-4.326x-4.578.
其中一定不正确的结论的序号是( )
A.①②B.②③C.③④D.①④
答案 D
解析 ①回归方程中x的系数为正,不是负相关;④方程中的x的系数为负,不是正相关,
∴①④一定不正确.
【呈重点、现规律】
1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关.
2.求回归直线方程时应注意的问题
(1)知道x与y呈线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.
(2)用公式计算
、
的值时,要先算出
,然后才能算出
.
3.利用回归方程,我们可以进行估计和预测.若回归直线方程为
=
x+
,则x=x0处的估计值为
0=
x0+
.