1、高中数学选修23优质学案1231 回归分析的基本思想及其初步应用3.1 回归分析的基本思想及其初步应用知识导学知识点一线性回归模型(1)函数关系是一种关系,而相关关系是一种关系(2)回归分析是对具有关系的两个变量进行统计分析的一种常用方法(3)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),回归直线x的斜率和截距的最小二乘估计公式分别为,其中(,)称为样本点的中心(4)线性回归模型ybxae,其中a和b是模型的未知参数,e称为,自变量x称为,因变量y称为知识点二线性回归分析1残差平方和法(1)i(i1,2,n)称为相应于点(xi,yi)的(2)残差平方和 (yii
2、)2越小,模型拟合效果越好2残差图法残差点落在水平的带状区域内,说明选用的模型比较合适,其中这样的带状区域宽度,说明模型的精确度越高3利用相关指数R2刻画回归效果其计算公式为:R21.其几何意义:,表示回归效果越好知识拓展1建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性相关关系等)(3)由经验确定回归方程的类型(如观察到数据呈线性相关关系,则选用线性回归方程x )(4)按一定规则估计回归方程中的参数(如最小二乘法)(5)得出结果后分析残差图是否有异常,若存在异常,则检查数据是否有误或模
3、型是否合适等2线性回归模型中随机误差的主要来源(1)用线性回归模型作为真实模型的近似所引起的误差可能存在非线性的函数能够更好地描述y与x之间的关系,但是现在却用线性函数来表述这种关系,结果会产生误差(2)忽略了某些因素的影响影响变量y的因素不仅有变量x,可能还包括其他许多因素,例如,在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响(3)观测误差由于测量工具等原因,导致y的观测值产生误差3残差分析的结果(1)残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高(2
4、)若是有个别样本点的残差比较大,需要确认在采集这些样本点的过程中是否有人为的错误如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因4对R2的理解(1)预报变量的变化与解释变量和随机误差的关系预报变量的变化程度可以分解为解释变量引起的变化程度与残差变量的变化程度之和,其中这个变化与解释变量和随机误差(即残差平方和)有关的程度是由相关指数R2的值决定的在线性回归模型中,R2表示解释变量对预报变量变化的贡献率R2越接近于1,表示解释变量和预报变量的线性相关性越强;反之,R2越小,说明随机误差对预报变量的效应越大(2)R2与r的关系相关系数可
5、较好地反映变量的相关性及正相关或负相关,而R2反映了回归模型拟合数据的效果;R2是相关系数的平方,其变化范围为0,1,而相关系数的变化范围为1,1;当相关系数|r|接近于1时说明两变量的相关性较强,当|r|接近于0时说明两变量的相关性较弱,而当R2接近于1时,说明线性回归方程的拟合效果较好自诊小测1判一判(正确的打“”,错误的打“”)(1)残差平方和越小,线性回归方程的拟合效果越好()(2)在画两个变量的散点图时,预报变量在x轴上,解释变量在y轴上()(3)R2越接近于1,线性回归方程的拟合效果越好()2做一做(1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为_(
6、2)在残差分析中,残差图的纵坐标为_(3)如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于_,解释变量和预报变量之间的相关系数等于_课堂互动探究探究求线性回归方程例1某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据x681012y2356(1)请画出上表数据的散点图;(要求:点要描粗)(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程x;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力(相关公式:,)拓展提升求线性回归方程的步骤(1)列出散点图从直观上分析数据间是否存在线性相关关系(2)计算,x,y,xiyi.(3)代入公式求出x中参数,
7、的值(4)写出回归方程并对实际问题作出估计跟踪训练1某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程,x,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?注:,.探究线性回归分析例2已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:x1416182022y1210753求y对x的回归直线方程,并说明回归模型拟合效果的好坏拓展提升这类题目的数据运算繁琐,通常采用分步计算的方法,由R2可
8、以看出回归模型的拟合效果,也可以计算相关系数r,看两个变量的相关关系是否很强跟踪训练2为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散点图并求线性回归方程;(2)求出R2;(3)进行残差分析探究非线性回归分析例3为了研究某种细菌随时间x变化繁殖的个数,收集数据如下:天数x/天123456繁殖个数y/个612254995190(1)将天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;(2)描述解释变量与预报变量之间的关系;(3)计算残差、相关指数R
9、2.拓展提升非线性回归方程的求法(1)根据原始数据(x,y)作出散点图;(2)根据散点图,选择恰当的拟合函数;(3)作恰当的变换,将其转化成线性函数,求线性回归方程;(4)在(3)的基础上通过相应的变换,即可得非线性回归方程跟踪训练3某电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式UAebt(b0)表示,现测得时间t(s)时的电压U(V)如下表:t/s012345678910U/V100755540302015101055试求:电压U对时间t的回归方程(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)随堂自测1关于回归分析,下列说法错误
10、的是()A回归分析是研究两个具有相关关系的变量的方法B散点图中,解释变量在x轴,预报变量在y轴C回归模型中一定存在随机误差D散点图能明确反映变量间的关系2甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:甲乙丙丁R20.980.780.500.85哪位同学建立的回归模型拟合效果最好?()A甲 B乙C丙 D丁3设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B
11、回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg4某单位为了了解用电量y度与气温x之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温()1813101用电量(度)24343864由表中数据得线性回归方程bxa中b2,预测当气温为4 时,用电量的度数约为_5假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x15.025.830.036.644.4y39.442.942.943.149.2(1)以x为解释变量,y为预报变量,作出散点图;(2)求y
12、与x之间的回归方程,对于基本苗数56.7预报有效穗;(3)计算各组残差,并计算残差平方和;(4)求相关指数R2,并说明残差变量对有效穗的影响占百分之几? 参 考 答 案 知识导学知识点一线性回归模型(1)确定性非确定性(2)相关(4)随机误差解释变量预报变量知识点二线性回归分析1(1)残差2比较均匀地越窄3R2越接近于1自诊小测1答案(1)(2)(3)2答案(1)正相关(2)残差(3)01或1解析(1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关(2)由残差图的定义知道,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形
13、称为残差图(3)设样本点为(xi,yi),i1,2,3,n,回归直线为x;若散点图中所有的样本点都在一条直线上,则此直线方程就是回归直线方程所以有yii;残差平方和 (yii)20;解释变量和预报变量之间的相关系数R满足R211,所以R1.课堂互动探究探究求线性回归方程例1解:(1)如图:(2)xiyi6283105126158,9,4,x6282102122344,0.7,40.792.3,故线性回归方程为0.7x2.3.(3)由(2)中线性回归方程当x9时,0.792.34,预测记忆力为9的同学的判断力约为4.跟踪训练1解:(1)散点图如图(2)由表中数据得iyi52.5,3.5,3.5,54,所以0.7.所以1.05.所以0.7x1.05.回归直线如图中所示(3)将x10代入回归直线方程,得0.7101.058.05(小时),所以预测加工10个零件大约需要8.05小时探究线性回归分析例2解:(1416182022)18,
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1