1、下表是x和y之间的一组数据,则y关于x的线性回归方程必过().A点(2,3)B点(1.5,4)C点(2.5,4)D点(2.5,5)x 1 2 3 4y 1 3 5 73刻画回归效果的方式残差 样本编号 身高数据 体重估计值 越小 解释 预报 想一想:回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么?提示不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等4非线性回归分析 (1)非线性相关关系:样本点分布在某一条曲线的周围,而不是一条直线附近我们就称这两个变量之间不
2、具有线性相关关系而是非线性相关关系(2)非线性回归方程线性化yaxn(其中a,x,y均为正值)(幂函数型函数)lg ylg an lg x,令ulg y,vlg x,blg a,则unvb,图象为一直线ycax(a0,c0)(指数型函数)lg yx lg alg c,令ulg y,blg c,dlg a,则udxb,图象为一直线2线性回归分析(1)由线性回归方程给出的是一个预报值而非精确值(2)随机误差的主要来源线性回归模型与真实情况引起的误差;省略了一些因素的影响产生的误差;观测与计算产生的误差(3)残差分析是回归分析的一种方法(4)用相关指数R2来刻画回归效果R2越大,意味着残差平方和越小
3、,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等)(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程)(4)按一定规则(如最小二乘法)估计回归方程中的参数(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大或残差呈现不随机的规律性等)若存在异常,则检查数据是否有误,或模型是否合适等3建立回归模型的基本步骤题型一求线性回归方程【例1】某班5名学生的数学和物理成绩如下表:学生学科ABCDE数学成
4、绩(x)88 76 73 66 63物理成绩(y)78 65 71 64 61(1)画出散点图;(2)求物理成绩y对数学成绩x的回归直线方程;(3)一名学生的数学成绩是96,试预测他的物理成绩思路探索 先利用散点图分析物理成绩与数学成绩是否线性相关,若相关再利用线性回归模型求解规律方法(1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义【变式1】以下是某地搜集到的新房屋的
5、销售价格y和房屋的面积x的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150 m2时的销售价格房屋面积/m211511080135 105销售价格/万元 24.8 21.6 18.4 29.222题型二线性回归分析【例2】为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:(1)作出散点图并求线性回归方程;(2)求出R2;(3)进行残差分析x51015202530y 7.25 8.12 8.95 9.90 10.9 11.8思路探索 作残差分析时,一般从以下几个方面予以
6、说明:(1)散点图;(2)相关指数;(3)残差图中的异常点和样本点的带状分布区域的宽窄(2)列表如下:(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系规律方法当资料点较少时,也可以利用残差表进行残差分析,注意计算数据要认真细心,残差分析要全面【变式2】已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:求y对x的回归直线方程,并说明回
7、归模型拟合效果的好坏x 14 16 18 20 22y 12 10753题型三非线性回归分析【例3】下表为收集到的一组数据:(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x40时y的值x 21 23 25 27 293235y711 21 24 66 115 325 (1)画出散点图或进行相关性检验,确定两变量x、y是否线性相关由散点图得x、y之间的回归模型(2)进行拟合,预报回归模型,求回归方程规范解答(1)作出散点图如下图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线
8、yc1ec2x的周围,其中c1、c2为待定的参数(4分)(2)对两边取对数把指数关系变为线性关系,令zln y,则有变换后的样本点应分布在直线zbxa,aln c1,bc2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:x21232527293235z 1.946 2.398 3.045 3.178 4.190 4.745 5.784求得回归直线方程为0.272x3.849,e0.272x3.849.(8分)残差yi711212466115325i6.44311.10119.12532.95056.770128.381290.325i0.557 0.101
9、1.8758.9509.2313.38134.675【题后反思】解决非线性回归问题的方法及步骤(1)确定变量:确定解释变量为x,预报变量为y;(2)画散点图:通过观察散点图并与学过的函数(幂、指数、对数函数、二次函数)作比较,选取拟合效果好的函数模型;(3)变量置换:通过变量置换把非线性问题转化为线性回归问题;(4)分析拟合效果:通过计算相关指数等来判断拟合效果;(5)写出非线性回归方程【变式3】为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:(1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数据的散点图;(2)描述解释变量x与预报变量y之间的关系;(3)计算相关指数天数x/天123456繁殖个数y/个 6 12 25 49 95 190解(1)所作散点图如图所示(2)由散点图看出样本点分布在一条指数函数yc1ec2x的周围,于是令zln y,则有变换后的样本点应分布在直线zbxa,aln c1,bc2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:x123456z 1.79 2.48 3.22 3.89 4.55 5.25用相关指数R2来比较模型的拟合效果,R2越大,模型的拟合效果越好,并不是R2越小拟合效果更好
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1