一元线性回归原理.ppt

上传人:b****2 文档编号:2217332 上传时间:2022-10-28 格式:PPT 页数:22 大小:1.29MB
下载 相关 举报
一元线性回归原理.ppt_第1页
第1页 / 共22页
一元线性回归原理.ppt_第2页
第2页 / 共22页
一元线性回归原理.ppt_第3页
第3页 / 共22页
一元线性回归原理.ppt_第4页
第4页 / 共22页
一元线性回归原理.ppt_第5页
第5页 / 共22页
点击查看更多>>
下载资源
资源描述

一元线性回归原理.ppt

《一元线性回归原理.ppt》由会员分享,可在线阅读,更多相关《一元线性回归原理.ppt(22页珍藏版)》请在冰豆网上搜索。

一元线性回归原理.ppt

统计思维回归的直观理解与原理:

一元线性回归

(一)问题的提出

(一)问题的提出例例11假定需要研究化肥施用量与粮食产量的关系,以便准确地定出化肥施用量的单位变化如何影响粮食产量的平均单位变化,进而确定合理的化肥施用量。

表表1化肥施用量与粮食化肥施用量与粮食产量量化肥施用量x(万吨)4541.054541.053637.872287.493056.894883.73779.34021.09粮食产量y(万吨)48526.6948526.6945110.8740753.7943824.5850890.1146370.8846577.91化肥施用量x(万吨)2989.062989.063021.93953.973212.133804.761598.281998.56粮食产量y(万吨)42947.4442947.4441673.2147244.3443061.5347336.7837127.8939515.07化肥施用量x(万吨)3710.563710.563269.031017.121864.232797.241034.09粮食产量y(万吨)46598.0446598.0444020.9234866.9137184.1441864.7733717.78图图1化肥施用量与粮食产量的散点图化肥施用量与粮食产量的散点图上述变量间关系的特点:

1.变量间关系不能用函数关系精确表达2.一个变量的取值不能由另一个变量唯一确定3.当变量x取某个值时,变量y的取值可能有几个4.各观测点分布在直线周围xxyy问题问题两个变量之间有着密切的关系,但它们之间密切的程度并不能由一个变量唯一确定另一个变量,即它们间的关系是一种非确定性的关系。

它们之间到底有什么样的关系呢?

u例1中由20组数据,粮食产量与化肥施用量的关系式是如何得到的?

解决方案运用模型来拟合这些数据点。

观测值分解成两部分:

y=00+11x+l一元线性回归模型xxyy观测项观测项=+结构项结构项随机项随机项=+

(二)一元线性回归模型1.描描述述因因变量量y如如何何依依赖于于自自变量量x和和误差差项的的方程称方程称为回回归模型模型2.一元线性回归模型可表示为一元线性回归模型可表示为y=00+11x+y是是x的的线性函数性函数(部分部分)加上加上误差差项线性部分反映了由于性部分反映了由于x的的变化而引起的化而引起的y的的变化化误差项误差项是随机变量是随机变量反反映映了了除除x和和y之之间的的线性性关关系系之之外外的的随随机机因因素素对y的影响的影响是不能由是不能由x和和y之之间的线性关系所解释的变异性的线性关系所解释的变异性0和和1称为模型的称为模型的参数参数xxyy一元线性回归模型(基本假定)1.因因变量量x与自与自变量量y之之间具有具有线性关系性关系2.在重复抽在重复抽样中,自中,自变量量x的取的取值是固定的,即假定是固定的,即假定x是是非随机的非随机的3.误差差项是一个期望是一个期望值为0的随机的随机变量,即量,即E()=0。

对于于一个一个给定的定的x值,y的期望的期望值为E(y)=0+1x4.对于所有的于所有的x值,的方差的方差2都相同都相同5.误差差项是是一一个个服服从从正正态分分布布的的随随机机变量量,且且相相互互独独立立。

即即N(0,2)独独立立性性意意味味着着对于于一一个个特特定定的的x值,它它所所对应的的与与其其他他x值所所对应的的不相关不相关对于于一一个个特特定定的的x值,它它所所对应的的y值与与其其他他x所所对应的的y值也不相关也不相关回归方程(regressionequation)1.描描述述y的的平平均均值或或期期望望值如如何何依依赖于于x的的方方程称程称为回回归方程方程2.一元一元线性回性回归方程的形式如下方程的形式如下E(y)=0+1x方方程程的的图图示示是是一一条条直直线线,也也称称为为直线回归方程直线回归方程00是是回回归归直直线线在在y轴轴上上的的截截距距,是当是当x=0时时y的期望值的期望值1是是直直线线的的斜斜率率,称称为为回回归归系系数数,表表示示当当x每每变变动动一一个个单单位位时时,y的平均变动值的平均变动值xxyyxy(xn,yn)(x1,y1)(x2,y2)(xi,yi)问题:

回归直线如何确定?

KarlGauss的最小化图xxyy(xxnn,yynn)(xx11,yy11)(xx22,yy22)(xxii,yyii)eeii=yyii-yyii目标:

找一条直线尽可能的拟合这目标:

找一条直线尽可能的拟合这n个样本点。

个样本点。

(三)最小二乘估计(least-squaresestimation)1.1.德国科学家德国科学家KarlGauss(17771855)提出用提出用最小化图中垂直方向的误差平方和最小化图中垂直方向的误差平方和来估计参数来估计参数2.2.使因变量的观察值与估计值之间的误差平方和使因变量的观察值与估计值之间的误差平方和达到最小来求得达到最小来求得和和的方法。

即的方法。

即3.3.用用最最小小二二乘乘法法拟拟合合的的直直线线来来代代表表x与与y之之间间的的关系与实际数据的误差比其他任何直线都小关系与实际数据的误差比其他任何直线都小问题如何估计使得最小解决方法根据微积分法求极值的原理,通过求偏导数并命其为0而得到:

这组方程称为正规方程组经过整理,可得?

其中,u记u可以简写为经过整理,可得例例11假定需要研究化肥施用量与粮食产量的关系,以便准确地定出化肥施用量的单位变化如何影响粮食产量的平均单位变化,进而确定合理的化肥施用量。

表表1粮食粮食产量与化肥施用量量与化肥施用量化肥施用量x(万吨)4541.054541.053637.872287.493056.894883.73779.34021.09粮食产量y(万吨)48526.6948526.6945110.8740753.7943824.5850890.1146370.8846577.91化肥施用量x(万吨)2989.062989.063021.93953.973212.133804.761598.281998.56粮食产量y(万吨)42947.4442947.4441673.2147244.3443061.5347336.7837127.8939515.07化肥施用量x(万吨)3710.563710.563269.031017.121864.232797.241034.09粮食产量y(万吨)46598.0446598.0444020.9234866.9137184.1441864.7733717.78最小二乘法求解回归方程实例最小二乘法求解回归方程实例解:

回归方程为:

直观来看,回归直线与20个样本数据点都很接近,说明回归直线对数据的拟合效果是好的。

图图1化肥施用量与粮食产量的散点图化肥施用量与粮食产量的散点图最小二乘估计的软件实现、输出结果最小二乘估计的软件实现、输出结果回归方程为:

小结:

估计的回归方程小结:

估计的回归方程3.3.一元线性回归中估计的回归方程为一元线性回归中估计的回归方程为2.2.用用样样本本统统计计量量和和代代替替回回归归方方程程中中的的未未知知参参数数和和,就得到了,就得到了估计的回归方程估计的回归方程1.1.总总体体回回归归参参数数和和是是未未知知的的,必必须须利利用用样样本本数数据去估计据去估计其其中中:

是是估估计计的的回回归归直直线线在在y轴轴上上的的截截距距,是是直直线线的的斜斜率率,它它表表示示对对于于一一个个给给定定的的x的的值值,是是y的的估估计计值值,也也表表示示x每每变变动一个单位时,动一个单位时,y的平均变动值的平均变动值.“回归”名称的由来十九世纪,英国生物学家兼统计学家高尔顿研究父母身高与其子女身高的遗传问题时,观察了1078对夫妇,以每对夫妇的平均身高作为x(单位:

英寸,1英寸=2.54厘米),取他们的一个成年儿子的身高作为y,绘制散点图发现趋势近乎一条直线,计算出的直线方程为:

这种趋势表明子代的身高向中心回向中心回归,才使得人类的身高在一定时间内相对稳定,没有出现两极分化现象。

其后研究变量x和变量y的统计关系时借用这个名词。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试认证 > 财会金融考试

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1