1、变量间的相关关系与线性回归方程11. 3变量间的相关关系与线性回归方程1.变量间的相关关系常见的两变量之间的关系有两类:一类是确定性的函数关系,另一类是 ;与函数关系不同,相关关系是一种 关系,带有随机性.2.两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在一条直线附近, 我们就称这两个变量之间具有 ,这条直线叫 .(2)从散点图上看,如果点分布在从左下角到右上角的区域内, 那么两个变量的这种相关关系称为 ;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为 .n(x -x)(y -y)相关系数r = i- ,当r 0时,表示两个变量正相关;当r v 0时,表示两
2、个变量负相关.r巨(x x)2送(yj -y)2I i i j 1的绝对值越接近 ,表示两个变量的线性相关性越强; r的绝对值越接近 ,表示两个变量的线性相关性越弱.通常当r的绝对值大于0.75时,认为两个变量具有很强的线性相关关系.3.回归直线方程n(1)通过求Q( a 3 =送(yi - Bx -G)2的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的i经距离的平方和最小的方法叫做 该式取最小值时的 a 3的值即分别为?, b?. 两个具有线性相关关系的变量的一组数据: (xi, yi) , (X2, y2),(xn, yn),其回归方程为 ? = |?x a?,则 n nZ (
3、x -x)(yy) Z Xjyi nxvr= = n 一 nZ (% _x)2 Z x2 -nx2i iT:a? -ibx.自查自纠1. 相关关系非确定性2. (1)线性相关关系 回归直线 (2)正相关负相关(3)1 03.最小二乘法 某公司201220,17年的年利润 x(单位:百万元”)与年广告支出 y(单位:百万元)的统计资料如下表所示:年份201220132014201520162017利润x12.214.6161820.422.3支出y0.620.740.810.8911.11根据统计资料,则() (2016 西八所重点中学联考)为了解某商品的销售量 y(件)与销售价格x(元/件)的
4、关系,统计了(x, y)的10组值,并画成如图所示的散点图,则其回归方程可能是 ( )A.y= 10x 198 cf = 10x+ 198解:由图象可知回归直线方程的斜率小于零,截距大于零. 故选B. 已知数组(X1, y1), (X2, y2),,(X10, y10)满足线性回归方程y= bx+ a,则“ (xo, y)满足线性回归方程 ,=bxX1 + x2 + + x10 丫1+ y2+ y10”+ a 是 x0=A .充分不必要条件 B .必要不充分条件C.充要条件 D .既不充分也不必要条件解:xo, yo为这10组数据的平均值,又因为线性回归方程 y= bx+ a必过样本中心(x,
5、 y),因此(x, y)一定满足线性回归方程,但满足线性回归方程的除了 (x, y)外,可能还有其他样本点. 故选B.下列命题:1线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;2利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;3通过回归直线y=bx+ a,可以估计和预测变量的取值和变化趋势.其中正确命题的序号是 .解:易知均正确,故填.(2017 东)为了研究某班学生的脚长 x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生, A A 10 10 根据测量数据的散点图可以看出 y与x之间有线性相关关系,设其回归直线方程为y= bx+
6、.已知xi =225 , yii=1 i W=1600, b= 4.该班某学生的脚长为 24,据此估计其身高为 厘米.解:由已知得 x = 22.5, y= 160,则=160 4X 22.5 = 70,当 x = 24 时,y= 4X 24+ 70= 166,故填 166.类型一相关关系的判断EE1 (2015石家庄调研)下列结论正确的是( )1函数关系是一种确定性关系;2相关关系是一种非确定性关系;3回归分析是对具有函数关系的两个变量进行统计分析的一种方法;4回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A . B.C. D.解:由回归分析的方法及概念判断 正确.故选C.【
7、点拨】要注意函数关系与相关关系的区别:函数关系是确定性关系,而相关关系是随机的、不确定的回归分 析是对具有相关关系的两个变量进行统计分析的一种常用方法.变式1汽车的重量和汽车每消耗 1升汽油所行驶的平均路程;2平均日学习时间和平均学习成绩;3某人每日吸烟量和身体健康情况;4圆的半径与面积;5电瓶车的重量和行驶每千米的耗电量.其中两个变量成正相关的是 ( )A . B .C. D .解:为负相关,为确定的函数关系,并非相关关系. 故选C.类型二 线性回归方程的有关概念GE)为了考查两个变量 x和y之间的线性关系,甲、乙两位同学各自独立做了 10次和15次试验,并且利用线 性回归方法,求得回归直线
8、分别为 li, I2,已知两人得到的试验数据中,变量 x的平均值都等于s,变量y的平均 值都等于t,那么下列说法正确的是( )A .直线li和12一定有公共点(S, t)B .直线11和12相交,但交点不- -定是 (s, t)C.必有直线11 / 12D .直线11和12必定重合解:线性回归直线方程为y= a+bx,而a= y b x,即a = tbs.t= a +bs.所以(s, t)在回归直线上,即直线 11和12必有公共点(s, t).故选A.【点拨】回归方程一定通过样本点的中心 (x, y);中心相同的样本点的回归方程不一定相同.由一组样本数据(X1, y1),(x2, y2),,(
9、Xn, yn)得到回归直线方程y = bx+ a,那么下面说法错误.的是()A .直线y=bx+ a必经过点(x, y)B .直线y= bx+ a至少经过点(X1, y” ,(X2, y2),(Xn, yn)中的一个点n 为 Kyi nX yA A A A .C.直线y= bx+ a的斜率b= i dn2 2_ x _ nxi dd .直线y=bx+ a和各点(n;Xi, yi), (X2, y2),,(Xn, yn)的偏差送yi (bx+a)i丄是该坐标平面上所有直线与这些点的偏差中最小的解:回归直线方程y = bx + a经过样本点的中心(X, y),可能不经过(X1, yi) , (X2
10、, y2),,(Xn, yn)中的任何一点,这些点都分布在这条直线附近. 故选B类型三散点图解:A合要求,故选A.【点拨】点分布在从左下角到右上角的区域时,两个变量的相关关系为正相关;点分布在从左上角到右下角的区 域时,两个变量的相关关系为负相关.(2)下面是一块田的水稻产量与施化肥量的一组观测数据 (单位:kg):施化肥量15 20 25 30 35 40 45水稻产量320 330 360 410 460 470 480(I )将上述数据制成散点图;(n)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗? 解:(I)散点图如下:500400300
11、200施化肥屋/飓I I I I I I I I I _5 10 15 20 25 30 35 40 45 ”100 0(n)从图中可以发现施化肥量与水稻产量具有线性相关关系, 当施化肥量由小到大变化时, 水稻产量由小变大.图中的数据点大致分布在一条直线的附近, 因此施化肥量和水稻产量近似成线性相关关系, 但水稻产量只是在一定范围内随着施化肥量的增加而增长,不会一直随施化肥量的增加而增长.【点拨】任何一组数据(二元数据)都可以作出散点图,散点图可以直观地观察两个变量间的关系.不相关记作)。口 7 b c x解:散点图在左上角至右下角区域则负相关,反之,则正相关,散乱则不相关. 故填.(2) 段
12、时间内,某地区手足口病流行,当地相关部门果断采取措施防、治结合,很快使病情得到控制下表是某 医院记载的5月1日到5月12日每天治愈者数据及根据数据绘制的散点图日期5.15.25.35.45.55.6人数100109115118121134日期5.75.85.95.105.115.12人数141152168175186203人数200 .150- . mo八50 -I I I I I K 2 4 6 S 10 12 H 期则下列说法:1根据此散点图,可以判断日期与治愈人数具有线性相关关系;2根据此散点图,可以判断日期与治愈人数具有一次函数关系;3根据此散点图,可以判断日期与治愈人数呈正相关.其中
13、正确的有( )A . 0个 B . 1个C. 2个D . 3个解:正确,错误,故选C.类型四求回归方程及用回归方程进行估计03 (湖南省2017届高三考前演练卷)某大学生利用寒假参加社会实践, 对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价 x和销售量y之间的一组数据如下表所示:月份i789101112销售单价Xi(元)99.51010.5118销售量yi(件)111086514(1) 根据7至11月份的数据,求出y关于x的回归直线方程;(2) 若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过 0.5元,则认为所得到的回归直线方程是理想的,试问(
14、1)中所得到的回归直线方程是否理想?预计在今后的销售中,销售量与销售单价仍然服从 中的关系,若该种机器配件的成本是 2.5元/件,那么该配件的销售单价应定为多少元才能获得最大利润? (注:利润=销售收入-成本 )nAAA A Xi% ny 5 n参考公式:回归直线方程y= bx+ a,其中b= ,参考数据:xiyi =392,瓦x2v 2 2 i =1 i d-xi - nxu=502.5. 1 1 解:(1)因为x= 5(9 + 9.5+ 10+ 10.5 + 11)= 10, y= 5(11 + 10+ 8+ 6+ 5) = 8,所以b=392-5X 10X 8502.5- 5 X 102则 a= 8-(-3.2) X 10 = 40,于是y关于x的回归直线方程为y = 3.2x + 40.(2)当 x = 8 时,y= 3.2 X 8 + 40= 14.4,则 |y y| = 14.4 14= 0.40.5,所以可以认为所得到的回归直线方程
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1