回归分析.ppt
《回归分析.ppt》由会员分享,可在线阅读,更多相关《回归分析.ppt(22页珍藏版)》请在冰豆网上搜索。
+1.1.线性回归模型线性回归模型:
e=e=y-(bx+ay-(bx+a)称称为随机误差为随机误差RR22越大模越大模型越好型越好残差平方和越残差平方和越小精确度越高小精确度越高3.3.相关指数相关指数RR22引例引例:
从某大学中随机选出从某大学中随机选出88名女大学生,其身名女大学生,其身高和体重数据如下表:
高和体重数据如下表:
编号编号1122334455667788身高身高165165165165157157170170175175165165155155170170体重体重48485757505054546464616143435959残差残差
(1)
(1)求每个点求每个点(xxi,i,yyii)的残差的残差
(2)
(2)画出残差的散点图画出残差的散点图(3)(3)求出相关指数求出相关指数RR22,说明身高在多大程度说明身高在多大程度上解释了体重的变化上解释了体重的变化.二二.探求新知探求新知-6.373-6.3732.6272.6272.4192.419-4.618-4.6181.1371.1376.6276.627-2.883-2.8830.3820.382-8-8-6-6-4-4-2-222446688OO2211334466557788991010编号编号残差残差.R.R22=0.64,=0.64,表明女大学生的身高解释了表明女大学生的身高解释了64%64%的体重变的体重变化。
化。
残差点比较均匀地落在(以x轴为中心)水平带状区域内.模型较合适带状区域的宽度越窄,模型拟合精度越高,回归方程的预报精度越高.43210-1-2-3-401002003004005006007008009001000454035302520151050-5010203040506070809010025002000150010005000-500-10000102030405060708090100200150100500-50-100-1500102030405060708090100.()()分析下列残差图分析下列残差图,所选用的回归模型效果最好的是()所选用的回归模型效果最好的是()牛刀小试牛刀小试
(2)有下列说法:
)有下列说法:
在残差图中,残差点比在残差图中,残差点比较均匀地落在水平的带状区域内,说明选较均匀地落在水平的带状区域内,说明选用的模型比较合适。
用的模型比较合适。
相关指数相关指数R2来刻画来刻画回归的效果回归的效果,R2值越大,说明模型的拟合效值越大,说明模型的拟合效果越好。
果越好。
比较两个模型的拟和效果,可比较两个模型的拟和效果,可以比较残差平方的大小,残差平方和越小以比较残差平方的大小,残差平方和越小的模型,拟合效果越好。
的模型,拟合效果越好。
正确的是(正确的是()建立回归模型的基本步骤建立回归模型的基本步骤画出散点图画出散点图;确定回归方程类型确定回归方程类型;求出回归方程求出回归方程;利用相关指数或残差进行分析利用相关指数或残差进行分析.确定解释变量和预报变量确定解释变量和预报变量;被害棉花红铃红铃虫喜高温高湿,适宜各虫虫喜高温高湿,适宜各虫态发育的温度为态发育的温度为25一一32,相对湿度为相对湿度为80一一100,低于,低于20和高于和高于35卵不能孵化,相对卵不能孵化,相对湿度湿度60以下成虫不产卵。
冬季月以下成虫不产卵。
冬季月平均气温低于一平均气温低于一48时,红铃虫时,红铃虫就不能越冬而被冻死。
就不能越冬而被冻死。
创设情景创设情景19531953年,年,1818省发生红铃虫大灾害,受灾省发生红铃虫大灾害,受灾面积面积300300万公顷,损失皮棉约二十万吨。
万公顷,损失皮棉约二十万吨。
因材施教因材施教温度温度xoC21232527293235产卵数产卵数y/个个711212466115325例例22现现收收集集了了一一只只红红铃铃虫虫的的产产卵卵数数yy和和温温度度xxooCC之间的之间的77组观测数据列于下表:
组观测数据列于下表:
(11)试试建建立立产产卵卵数数yy与与温温度度xx之之间间的的回回归归方方程;并预测温度为程;并预测温度为2828ooCC时产卵数目。
时产卵数目。
(22)你所建立的模型中温度在多大程度上)你所建立的模型中温度在多大程度上解释了产卵数的变化?
解释了产卵数的变化?
问题呈现:
画散点图画散点图假设线性回归方程为假设线性回归方程为:
选选模模型型分析和预测分析和预测当当x=28时,时,y=19.8728-463.7393选变量选变量解:
选取气温为解释变量解:
选取气温为解释变量xx,产卵数产卵数为预报变量为预报变量yy。
合作探究合作探究050100150200250300350036912151821242730333639方案1当当x=28时,时,y=19.8728-463.7393估计参数估计参数由计算器得:
线性回归方程为由计算器得:
线性回归方程为残差残差编号12345671020304050607080-10-20-30-40-50-6090100xy残差21723112521272429663211535325线性模型线性模型53.4617.72-12.02-48.76-46.5-57.1193.2819818.919818.9相关指数相关指数RR220.74640.7464所以,一次函数模型中温度解释了所以,一次函数模型中温度解释了74.64%的产卵数变化。
的产卵数变化。
y=bx2+a变换变换y=bx+a非线性关系非线性关系线性关系线性关系方案2问题问题选用选用y=bx2+a,还是还是y=bx2+cx+a?
问题问题3产卵数产卵数气气温温问题问题2如何求如何求a、b?
合作探究合作探究t=x2温度温度xoC21232527293235产卵数产卵数y/个个711212466115325方案2解答平方变换:
平方变换:
令令t=xt=x22,产卵数产卵数yy和温度和温度xx之间二次函数模型之间二次函数模型y=bxy=bx22+a+a就转化为产卵数就转化为产卵数yy和温度的平方和温度的平方tt之间线性回归模型之间线性回归模型y=y=bt+abt+a作散点图,并由计算器得:
作散点图,并由计算器得:
将将t=xt=x22代入线性回归方程得:
代入线性回归方程得:
y=y=0.3670.367xx22-202.54-202.54tt温度温度21232527293235温度的平方温度的平方t44152962572984110241225产卵数产卵数y/个个711212466115325yy和和tt之间的线性回归方程为之间的线性回归方程为y=y=0.3670.367tt-202.54-202.54,当当xx=28=28时时,yy=0.36728=0.3672822-202.5485202.5485残差残差编号12345671020304050607080-10-20-30-40-50-6090100xy残差21723112521272429663211535325二次函数模型二次函数模型47.69619.400-5.832-41.000-40.104-58.26577.96815448.415448.4相关指数相关指数RR22=0.802=0.802所以二次函数模型中温度解释了所以二次函数模型中温度解释了80.2%80.2%的产的产卵数变化。
卵数变化。
问题问题变换变换y=bx+a非线性关系非线性关系线性关系线性关系问题问题如何选取指数函数的底如何选取指数函数的底?
产卵数产卵数气气温温指数函数模型指数函数模型方案3合作探究合作探究对数对数令令,则,则就转换为就转换为zz=bx+abx+a对数变换:
在对数变换:
在中两边取常用对数得中两边取常用对数得方案3解答xz当当x=28x=28ooCC时,时,y44y44温度温度xoC21232527293235产卵数产卵数y/个个711212466115325温度温度xoC21232527293235z=lgy0.851.041.321.381.822.062.51产卵数产卵数y/个个711212466115325残差残差编号12345671020304050607080-10-20-30-40-50-6090100xy残差21723112521272429663211535325指数函数模型指数函数模型-0.19441.7248-9.18948.8521-14.121933.25731471.51471.5指数回归模型中温度解释了指数回归模型中温度解释了98.5%98.5%的产卵数的产卵数的变化的变化0.49870.4987最好的模型是哪个最好的模型是哪个?
产卵产卵数数气气温温产卵产卵数数气气温温线性模型二次函数模型指数函数模型比比一一比比函数模函数模型型相关指相关指数数R2残差平残差平方和方和线性回线性回归模型归模型二次函二次函数模型数模型指数函指数函数模型数模型最好的模型是最好的模型是哪个哪个?
0.74640.74640.8020.8020.9850.9851981819818154481544814711471编号编号编号编号编号编号1234567残差残差1020304050607080-10-20-30-40-50-6090100残差残差1020304050607080-10-20-30-40-50-609010012345671234567残差残差1020304050607080-10-20-30-40-50-6090100结论:
无论从图形上直观观察,还是从数结论:
无论从图形上直观观察,还是从数据上分析,指数函数模型是更好的模型。
据上分析,指数函数模型是更好的模型。
数学思想:
数学思想:
数学方法:
数学方法:
数形结合的思想,化归思想及整体思想数形结合的思想,化归思想及整体思想数形结合法,转化法,换元法数形结合法,转化法,换元法数学知识数学知识:
建立回归模型及残差图分析的基本步骤建立回归模型及残差图分析的基本步骤不同模型拟合效果的比较方法:
相关指不同模型拟合效果的比较方法:
相关指数和残差的分析数和残差的分析非线性模型向线性模型的转换方法非线性模型向线性模型的转换方法课堂总结课堂总结