1、高中数学人教选修12课件第一章统计案例11回归分析的基本思想及其初步应用第一章统计案例a1.1回归分析的基本思想及其初步应用学习目标1了解随机误差、殘差、残差分析的概念(重点)2会用残差分析判断线性回归模型的拟合效果.3 掌握建立回归模型的步骤(重点).4 通过对典型案例的探 究,了解回归分析的基本思想方法和初步应用(重点、难 点)知识提炼梳理回归分析是对具有相关关系的两个变量进行统计分 析的一种常用方法,回归分析的基本步骤是画出两个变量的散点图,求回归方程,并用回归方程进行预报.2.线性回归模型Exiy -nxy -i -i w= ,a= y-l)x.其中 x-= E y = E y,V 9
2、 _2 72 3=1 H i=l乙咒;n工 1 = 1(恥v)称为样本点的中心.J线性回归模型y=bx+a+e,n中称为随机误差,自变量兀称为健餐变量,因变量V称为预报变量.增加一个单位的平均塔加单位数.3.刻画回归效果的方式方式方法计算公式刻画效果R2丈(丁厂y)2R? = l S(y-y)21=1疋越接近于1,表示回 归的效果越好残差图称为相应于点(无, Pi)的残差,&=比一必残差点比较均匀地落 在水平的带状区域中, 说明选用的模型比较 合适,其中这样的带状 区域的宽度越窄,说明 模型拟合精度越高.差方和 残平利丈(少一y)21=1残差平方和越生,模型 的拟合效果越好思考尝试夯基求线性回
3、归方程前可以不进行相关性检验.()(2)在残差图中,纵坐标为残差,横坐标可以选为样 本编号.()(3)利用线性回归方程求出的值是准确值.()答案:X (2)V (3)X2.如图四个散点图中,适合用线性回归模型拟合其中两个变量的是(yy y44 0X 0i 0X 0X A. B.C. D.解析:图、中的点大致在一条直线附近,适合用线性回归模型拟合.答案:B3.己知回归方程y=2x+l,而试验得到一组数据是(2, 4.9), (3, 7.1), (4, 9.1),则残差平方和是()A. 0.01 B. 0.02C. 0.03 D. 0.04解析:(4.9 - 5)2 + (7.1 - 7)2 +
4、(9.1 - 9)2 = 0.03.答案:C4-已知工厂加工零件的个数X与花费时间y(h)之间的线性回归方程为丿=0.01卄0.5,则加工200个零件大约需要 小时.解析:将200代入线性回归方程;=001兀+仇5 ,得丿5.有下列说法:在残差图中,残差点比较均匀地 落在水平的带状区域内,说明选用的模型比较合适; 用相关指数,来刻画回归的效果,/值越大,说明模型的拟合效果越好;比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.其中正确命题的序号是类型1求线性回归方程(自主研析) 典例1 (2014课标全国II卷)某地区2007年至2013年农村居民家庭人均纯
5、收入y(单位:千元)的数据如表:年份2007200820092010201120122013年份代号r1234567人均纯收 入丿2.933364.44.85.25.9求y关于f的线性回归方程;利用中的回归方程,分析2007年至2013年该 地区农村居民家庭人均纯收入的变化情况,并预测该地 区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:J =(1 + 2 + 3 + 4 + 5 + 6 + 7) = 4 ,y = *2.9 + 3.3 + 3.6 + 4.4 + 4.8 + 5.2 + 5.9) = 4.3 ,1=1fa厂 )(%*) = ( 3)X(
6、1.4)+ ( 2)X( 1) + 1=1 ( 1)X( 0. 7) + 0X0. 1 + 1X0. 5 + 2X0. 9 + 3X1. 6i=lA 八.a - y - b t =4.3 - 0.5X4 = 23 ,A所求回归方程为尸05f + 23由知,b = 0.50 ,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年塔加0.5千元将2015年的年份代号心9代入中的回归方程,得y =0.5X9 + 23 = 6.8 ,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.A归纳升华求线性回归方程方法:1.般步骤:1 作出散点图,判定两变量是否线性相关3写出线性回归
7、方程y=bx + a,并进行预测2求解回归方程的关键点:求线性回归方程必须判断两个变量是否线性相关,常用散点图进行判定;若不线性相关,求出的回归方程毫无意义(2)回归直线必过样本点中心(工,j ).重视数据分析和计算,正确运用公式计算$ ,:是求线性回归方程的关健.变式训练某个服装店经营某种服装,在某周内获纯利y(元)与该周每天销售这种服装件数工之间的一组数据关系见表:已知丘=280,朋=45 209,St=3 487.求回归方程.解:(l)x =;X(3 + 4 + 5 + 6 + 7 + 8 + 9) = 6 , y #X(66 + 69 + 73 + 81 + 89 + 90 + 91)
8、 =孚559A 3487 - 7X6X四(2)b= = T ,280 -7X36 4所以:浑弓X6晋,A 10 7I9所以所求回归方程为y =亍+亓类型2线性回归分析(互动探究) 典例2为研究重量工(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如 下表所示:X51015202530y7.258.128.959.9010.911.8作出散点图,并求线性回归方程;(2)求出,;(3)进行残差分析.解:散点图如图所示.x = X (5 +10 +15 + 20 + 25 + 30) = 17.5 , $ = X (7.25 + &12 + &95 + 9.90 +
9、10.9 +11.8)9.487 ,6 fc 6Z j: 2 275S 工1 076. 2.产i i=i1 - 0.013 18 所以届帀寸阿1 ,(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要码认在采集这个数据的时候是否有人为的错 误,如果有的话,需要纠正数据,重新建立回归模型;由 表中数据可以看岀残差点比较均勻地落在不超过0.15的 狭窄的水平带状区域中,说明选用的线性回归模型的精度 较高,由以上分析可知,弹簧长度与拉力呈线性关系迁移探究1(改变问法)在条件不变的情况下,画出残差图.解:由例题第问,作出残差图如图所示0.050.04 0.030.020.01由残差图知,残差是
10、比较均勻地落在不超过0.15的狭窄的水平带状区域中.迁移探究2(变换条件,改变结论)关于兀与y有如下数据:X2456y3040605070为了对兀、y两个变量进行统计分析,现有以下两种A A线性模型:甲模=6.5x4-17.5,乙模型y=7+17,试 比较哪一个模型拟合的效果好.解:0845082 ,.用选用的模型拟合效果好.加纳升华1.本题求解注意:要根据散点图粗略判断是否线性相关,是否可以用线性回归模型来拟合数据 (2)正确A A计算 ,afR这是求解本题的关键2 .拟合效果分析:沪是用来刻画回归效果的,由工( *)2,=1 .旦 可知用越大,残差平方和越小i=l回归模型的拟合效果越好.(
11、2)残差图(表)也可刻画拟合效 果,残差图均勻水平带状区域分布,带状区域的宽度越窄: 说明模型拟合精度越高,回归方程的预报精度越高.典例3在一次抽样调查中测得样本的5个样本点,数值如表:X0.250.5124y1612521试建立y与工之间的回归方程.解:作出变量y与工之间的散点图如图所示.y161412108642J 1 1_2 3 4 %由图可知变量y与工近似地呈反比例函数关系.k设尸笃令4,则y=ktAy与兀的数据表可得y与t的数据表:t4210.50.25y1612521作出y与t的散点图如图所示.八 764208642由图可知y与/呈近似的线性相关关系.94.25 - 5 X 1.5
12、5 X 7.2 =4.134 4 ,21.312 5 - 5X1.552A . 八.ay - bt =7.2 - 4.134 4X1.550.8 ,AAV :=4.134 4( + 0.8.a 4134所以y与兀的回归方程是y =釘尹+ 0.8.归纳升华 求非线性回归方程的步骤:1 确定变童,作出散点图2根据散点图,选择恰当的拟合函数.3变置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.4分析拟合效果:通过计算相关指数或画残差图来判断拟合效果.5根据相应的变换,写出非线性回归方程.变式训练两个变量的散点图如图,可考虑用如下函数进行拟合比较合理的是()A. y=a-xb
13、C. y =atxB. y=a+bnxhD.解析:由散点图可知,此曲线类似对数函数型曲线,因此可用函数y =+Mnx模型进行拟合.答案:B课堂小结1.对线性回归方程的理解:A从参数计算公式a = y -bx中,我们可以看出,回归直线方程尸处+a定经过点(工,y )我们把(工,y)称为样本点的中心.A A A A A(2)线性回归方y=bx+a中的截距a和斜率都是 通过估计而得来的,存在着误差,这种误差可能导致预 测结果的偏差.因此由回归方程可预测丿的估计值.A A A A(3)线性回归方程y =bx+a中的表示兀增加1个单位A时,y的平均变化量为人2.残差图中的可疑数据的特征表现:个别样本点的残差过大,即大多数的残差点比较均匀地落在水平的带状区域中,而个别残差点偏离该区 域过于明显,需要确认在采集这些样本点的过程中是否 有人为的错误,如果采集数据有错误,那么需要纠正.(2)残差图有异常,即残差呈现不随机的规律性,此 时需要考虑所采用的线性回归模型是否合适.3.研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型 来拟合数据.然后通过图形来分析残差特性,用残差A A2,,5来判断原始数据中是否存在可疑数据,用, 来刻画模型拟合的效果.
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1