回归分析北师大版.ppt

上传人:b****3 文档编号:2707897 上传时间:2022-11-08 格式:PPT 页数:61 大小:2.92MB
下载 相关 举报
回归分析北师大版.ppt_第1页
第1页 / 共61页
回归分析北师大版.ppt_第2页
第2页 / 共61页
回归分析北师大版.ppt_第3页
第3页 / 共61页
回归分析北师大版.ppt_第4页
第4页 / 共61页
回归分析北师大版.ppt_第5页
第5页 / 共61页
点击查看更多>>
下载资源
资源描述

回归分析北师大版.ppt

《回归分析北师大版.ppt》由会员分享,可在线阅读,更多相关《回归分析北师大版.ppt(61页珍藏版)》请在冰豆网上搜索。

回归分析北师大版.ppt

3.1.1回归分析回归分析回归分析的基本思想及其初步应用回归分析的基本思想及其初步应用1、两个变量的关系、两个变量的关系不相关不相关相关关系相关关系函数关系函数关系线性相关线性相关非线性相关非线性相关问题问题1:

现实生活中两个变量间的关系有哪些呢?

现实生活中两个变量间的关系有哪些呢?

相关关系:

相关关系:

对于两个变量,当自变量取值一定对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量时,因变量的取值带有一定随机性的两个变量之间的关系。

之间的关系。

回顾复习回顾复习思考:

相关关系与函数关系有怎样的不同?

函数关系中的两个变量间是一种确定性关系相关关系是一种非确定性关系函数关系是一种理想的关系模型相关关系在现实生活中大量存在,是更一般的情况问题问题2:

对于线性相关的两个变量用什么方法:

对于线性相关的两个变量用什么方法来刻划之间的关系呢?

来刻划之间的关系呢?

2、最小二乘估计、最小二乘估计最小二乘估计下的线性回归方程:

最小二乘估计下的线性回归方程:

ybxa其中其中,ybxa最小二乘估计下的线性回归方程:

最小二乘估计下的线性回归方程:

回归直线必过样本点的中心回归直线必过样本点的中心3、解、解线性相关问题线性相关问题的基本步骤的基本步骤:

画散点图画散点图求线性相关方程求线性相关方程预报、决策预报、决策例某医院用光例某医院用光电比色比色计检验尿汞尿汞时,得尿汞含量,得尿汞含量(毫克毫克/升升)与消光系数如下表:

与消光系数如下表:

汞含量汞含量x246810消光系数消光系数y64138205285360

(1)作散点作散点图;

(2)如果如果y与与x之之间具有具有线性相关关系,求性相关关系,求线性回性回归方程方程解:

解:

(1)散点散点图如如图1(2011辽宁高考辽宁高考)调查了某地若干了某地若干户家庭的年收入家庭的年收入x(单位:

位:

万元万元)和年和年饮食支出食支出y(单位:

万元位:

万元),调查显示年收入示年收入x与年与年饮食支出食支出y具有具有线性相关关系,并由性相关关系,并由调查数据得到数据得到y对x的的线性回性回归方程:

方程:

y0.254x0.321.由由线性回性回归方程可知,家庭方程可知,家庭年收入每增加年收入每增加1万元,年万元,年饮食支出平均增加食支出平均增加_万元万元解析:

解析:

以以x1代代x,得,得y0.254(x1)0.321,与,与y0.254x0.321相减可得,年相减可得,年饮食支出平均增加食支出平均增加0.254万元万元答案:

答案:

0.2542(2011江西高考江西高考)为了解儿子身高与其父了解儿子身高与其父亲身高的关系,身高的关系,随机抽取随机抽取5对父子的身高数据如下:

父子的身高数据如下:

父父亲身高身高x(cm)174176176176178儿子身高儿子身高y(cm)175175176177177答案:

答案:

C复习回顾复习回顾用线性回归方程进行回归分析:

用线性回归方程进行回归分析:

(1)画散点图;)画散点图;

(2)求回归系数)求回归系数:

(3)写回归直线方程)写回归直线方程,并用方程进,并用方程进行预测说明行预测说明.任何数据,不管它们的线性相关关系如何,都可任何数据,不管它们的线性相关关系如何,都可以用最小二乘法求出线性回归方程,为使建立的线以用最小二乘法求出线性回归方程,为使建立的线性回归方程有意义,在利用最小二乘法求线性回归性回归方程有意义,在利用最小二乘法求线性回归方程之前,先要对变量间的线性相关关系作个判断,方程之前,先要对变量间的线性相关关系作个判断,通常可以作散点图。

但在某些情况下,从散点图中通常可以作散点图。

但在某些情况下,从散点图中不容易判断变量间的线性关系不容易判断变量间的线性关系,另外,如果,另外,如果数据量数据量较大时,画散点图比较麻烦,较大时,画散点图比较麻烦,此时我们此时我们有没有其他有没有其他方法方法来刻画变量之间的线性相关关系呢?

来刻画变量之间的线性相关关系呢?

新课探究为解决这个问题,我们可通过计算线性相关系数为解决这个问题,我们可通过计算线性相关系数r,来判断变量间相关程度的大小,计算公式为:

,来判断变量间相关程度的大小,计算公式为:

新课探究的最小值为:

的最小值为:

据前面的分析,回归系数据前面的分析,回归系数使得误差使得误差由由知知,即,即,则,则新课探究值越大,误差值越大,误差越小,则变量的线性相关程度越小,则变量的线性相关程度就越高;就越高;值越接近于值越接近于0,越大,线性相关程度就越大,线性相关程度就越低。

越低。

当当时,时,两变量的值总体上呈现同,两变量的值总体上呈现同时增加的趋势,则称两变量时增加的趋势,则称两变量正相关正相关;当当时,时,一变量增加,另一变量有,一变量增加,另一变量有减小的趋势,则称两变量减小的趋势,则称两变量负相关负相关;当当时,则称两变量时,则称两变量线性不相关线性不相关。

相关系数相关系数r的性质的性质新课探究相关系数相关系数1.1.计算公式计算公式22相关系数的性质相关系数的性质

(1)|r|1

(1)|r|1;

(2)|r|

(2)|r|越接近于越接近于11,相关程度越大;,相关程度越大;|r|r|越接近越接近于于00,相关程度越小,相关程度越小问题:

达到怎样程度,问题:

达到怎样程度,xx、yy线性相关呢?

它们线性相关呢?

它们的相关程度怎样呢?

的相关程度怎样呢?

负相关负相关正相关正相关思考交流思考交流对于课本对于课本P73给出的例题,变量的线性相关系数给出的例题,变量的线性相关系数r如何求?

如何求?

我们知道,相关系数的计算公式为:

我们知道,相关系数的计算公式为:

要求要求r,只需求出相关的量:

,只需求出相关的量:

,和和。

,可得,可得,由数据表,经过计算,可知(由数据表,经过计算,可知(P77):

):

这能说明什么?

这能说明什么?

这说明肱骨这说明肱骨和股骨和股骨有较强的线性相关程度。

有较强的线性相关程度。

计算下表变量的线性相关系数计算下表变量的线性相关系数r。

并观察,通过计算可以发现什么?

并观察,通过计算可以发现什么?

根据数据列表计算如下:

根据数据列表计算如下:

解析(解析(P78):

1-5025002-43169-123-34916-12405025053491612643169127502500019100750由表可知:

由表可知:

,则可得,则可得,你发现什么了?

你发现什么了?

r=0,则变量间并不存在线性相关关系。

即此时,则变量间并不存在线性相关关系。

即此时建立线性回归方程是没有意义的。

建立线性回归方程是没有意义的。

实际上,从散点图上我们也可以验证这一点:

实际上,从散点图上我们也可以验证这一点:

易看出,几个样本点都落在同一个半圆上,而不易看出,几个样本点都落在同一个半圆上,而不是条状分布,此时建立线性回归方程无任何意义,这是条状分布,此时建立线性回归方程无任何意义,这与相关系数与相关系数r的计算结果相一致。

的计算结果相一致。

许多先进国家对驾驶员的培训,大多采用室内模拟教学和许多先进国家对驾驶员的培训,大多采用室内模拟教学和训练,而后再进行实地训练并考试,这种方法可以大大节训练,而后再进行实地训练并考试,这种方法可以大大节约训练的费用。

问题是这种方法有效吗?

下表是约训练的费用。

问题是这种方法有效吗?

下表是12名学员名学员的模拟驾驶成绩的模拟驾驶成绩x与实际考试成绩与实际考试成绩y的记录(单位:

分):

的记录(单位:

分):

试问:

两者的相关性如何?

请画出散点图,并求出试问:

两者的相关性如何?

请画出散点图,并求出y与与x间的线性相关系数间的线性相关系数.动手做一做动手做一做x985550877789y956045857587x799894837473y759792807172解答:

解答:

可求出可求出r=0.9871,说明实际考试成绩,说明实际考试成绩y与模拟驾与模拟驾驶成绩驶成绩x有较强的线性相关程度有较强的线性相关程度.拓展思考拓展思考相关系数相关系数r越大,变量间的线性关系就越越大,变量间的线性关系就越强,那么强,那么r的值究竟大到什么程度就认为线性的值究竟大到什么程度就认为线性关系较强?

关系较强?

相关系数相关系数正相关;负相关通常,正相关;负相关通常,rr-1,-0.75-1,-0.75负相关很强负相关很强;rr0.75,10.75,1正相关很强正相关很强;r;r-0.75,-0.3-0.75,-0.3负相关一般负相关一般;rr0.3,0.750.3,0.75正相关一般正相关一般;r;r-0.25,0.25-0.25,0.25相关性较弱相关性较弱;相关关系的测度相关关系的测度(相关系数取值及其意义)-1.0+1.00-0.5+0.5完全负相关完全负相关无线性相关无线性相关完全正相关完全正相关负相关程度增加负相关程度增加r正相关程度增加正相关程度增加小结小结线性相关系数线性相关系数r:

值越大,误差值越大,误差越小,则变量的线性相关程度越小,则变量的线性相关程度就越高;就越高;值越接近于值越接近于0,越大,线性相关程度就越大,线性相关程度就越低。

越低。

,其中,其中。

当当时,两变量时,两变量正相关正相关;当;当时,两变量时,两变量负相关负相关;当;当时,两变量时,两变量线性不相关线性不相关。

4对四四对变量量y和和x进行行线性相关性相关检验,已知,已知n是是观测值组数,数,r是相关系数,且已知:

是相关系数,且已知:

n7,r0.9533;n15,r0.3012;n17,r0.4991;n3,r0.9950.则变量量y和和x线性相关程度最高的两性相关程度最高的两组是是()A和和B和和C和和D和和解析:

解析:

相关系数相关系数r的的绝对值越大,越大,变量量x,y的的线性相关性相关程度越高,故程度越高,故选B.答案:

答案:

B5某厂的生某厂的生产原料耗原料耗费x(单位:

百万元位:

百万元)与与销售售额y(单位:

位:

百万元百万元)之之间有如下的有如下的对应关系:

关系:

()x2468y30405070判断判断x与与y之之间是否存在是否存在线性相关关系性相关关系解:

解:

画出画出(x,y)的散点的散点图,如,如图所示,由所示,由图可知可知x,y呈呈现线性相关关系性相关关系复习回顾复习回顾线性相关系数线性相关系数r及性质:

及性质:

值越大,变量的线性相关程度就越高;值越大,变量的线性相关程度就越高;值越接近于值越接近于0,线性相关程度就越低。

,线性相关程度就越低。

,其中,其中。

当当时,两变量时,两变量正相关正相关;当当时,两变量时,两变量负相关负相关;当当时,两变量时,两变量线性不相关线性不相关。

新课讲解新课讲解下表按年份给出了下表按年份给出了19812001年我国出口贸易年我国出口贸易量(亿美元)的数据,根据此表你能预测量(亿美元)的数据,根据此表你能预测2008年我年我国的出口贸易量么?

国的出口贸易量么?

从散点图中观察,数据与直线的拟合性不好,从散点图中观察,数据与直线的拟合性不好,若用直线来预测,误差将会很大。

若用直线来预测,误差将会很大。

而图像近似指数函数,呈现出非线性相关性。

而图像近似指数函数,呈现出非线性相关性。

分析:

分析:

考虑函数考虑函数来拟合数据的变化关系,将其转来拟合数据的变化关系,将其转化成线性函数,两边取对数:

化成线性函数,两边取对数:

即线性回归方程,记即线性回归方程,记1981年为年为x=1,1982年为年为x=2,变换后的数据如下表:

变换后的数据如下表:

设设,则上式变为,则上式变为,对上表数据求线性回归方程得:

对上表数据求线性回归方程得:

即:

即:

由此可得:

由此可得:

,曲线如图:

,曲线如图:

这样一来,预测这样一来,预测2008年的出口贸易量就容易多了。

年的出口贸易量就容易多了。

将下列常见的非线性回归模型转化为线性回归模型。

将下列常见的非线性回归模型转化为线性回归模型。

作变换作变换得线形函数得线形函数。

1.幂函数:

幂函数:

2.指数曲线:

指数曲线:

作变换作变换得线形函数得线形函数。

作怎样的变换,得

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1