ImageVerifierCode 换一换
格式:PPT , 页数:61 ,大小:2.92MB ,
资源ID:2707897      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/2707897.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(回归分析北师大版.ppt)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

回归分析北师大版.ppt

1、3.1.1 回归分析回归分析回归分析的基本思想及其初步应用回归分析的基本思想及其初步应用1、两个变量的关系、两个变量的关系不相关不相关相关关系相关关系函数关系函数关系线性相关线性相关非线性相关非线性相关问题问题1:现实生活中两个变量间的关系有哪些呢?:现实生活中两个变量间的关系有哪些呢?相关关系:相关关系:对于两个变量,当自变量取值一定对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量时,因变量的取值带有一定随机性的两个变量之间的关系。之间的关系。回顾复习回顾复习思考:相关关系与函数关系有怎样的不同?函数关系中的两个变量间是一种确定性关系相关关系是一种非确定性关系 函数关系

2、是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般的情况问题问题2:对于线性相关的两个变量用什么方法:对于线性相关的两个变量用什么方法来刻划之间的关系呢?来刻划之间的关系呢?2、最小二乘估计、最小二乘估计最小二乘估计下的线性回归方程:最小二乘估计下的线性回归方程:ybx a其中其中,ybx a最小二乘估计下的线性回归方程:最小二乘估计下的线性回归方程:回归直线必过样本点的中心回归直线必过样本点的中心3、解、解线性相关问题线性相关问题的基本步骤的基本步骤:画散点图画散点图求线性相关方程求线性相关方程预报、决策预报、决策例某医院用光例某医院用光电比色比色计检验尿汞尿汞时,得尿汞含量,得尿

3、汞含量(毫克毫克/升升)与消光系数如下表:与消光系数如下表:汞含量汞含量x246810消光系数消光系数y64138205285360(1)作散点作散点图;(2)如果如果y与与x之之间具有具有线性相关关系,求性相关关系,求线性回性回归方程方程解:解:(1)散点散点图如如图1(2011辽宁高考辽宁高考)调查了某地若干了某地若干户家庭的年收入家庭的年收入x(单位:位:万元万元)和年和年饮食支出食支出y(单位:万元位:万元),调查显示年收入示年收入x与年与年饮食支出食支出y具有具有线性相关关系,并由性相关关系,并由调查数据得到数据得到y对x的的线性回性回归方程:方程:y0.254x0.321.由由线性

4、回性回归方程可知,家庭方程可知,家庭年收入每增加年收入每增加1万元,年万元,年饮食支出平均增加食支出平均增加_万元万元解析:解析:以以x1代代x,得,得y0.254(x1)0.321,与,与y0.254x0.321相减可得,年相减可得,年饮食支出平均增加食支出平均增加0.254万元万元答案:答案:0.2542(2011江西高考江西高考)为了解儿子身高与其父了解儿子身高与其父亲身高的关系,身高的关系,随机抽取随机抽取5对父子的身高数据如下:父子的身高数据如下:父父亲身高身高x(cm)174176176176178儿子身高儿子身高y(cm)175175176177177答案:答案:C复习回顾复习回

5、顾 用线性回归方程进行回归分析:用线性回归方程进行回归分析:(1)画散点图;)画散点图;(2)求回归系数)求回归系数 :(3)写回归直线方程)写回归直线方程 ,并用方程进,并用方程进行预测说明行预测说明.任何数据,不管它们的线性相关关系如何,都可任何数据,不管它们的线性相关关系如何,都可以用最小二乘法求出线性回归方程,为使建立的线以用最小二乘法求出线性回归方程,为使建立的线性回归方程有意义,在利用最小二乘法求线性回归性回归方程有意义,在利用最小二乘法求线性回归方程之前,先要对变量间的线性相关关系作个判断,方程之前,先要对变量间的线性相关关系作个判断,通常可以作散点图。但在某些情况下,从散点图中

6、通常可以作散点图。但在某些情况下,从散点图中不容易判断变量间的线性关系不容易判断变量间的线性关系,另外,如果,另外,如果数据量数据量较大时,画散点图比较麻烦,较大时,画散点图比较麻烦,此时我们此时我们有没有其他有没有其他方法方法来刻画变量之间的线性相关关系呢?来刻画变量之间的线性相关关系呢?新课探究 为解决这个问题,我们可通过计算线性相关系数为解决这个问题,我们可通过计算线性相关系数r,来判断变量间相关程度的大小,计算公式为:,来判断变量间相关程度的大小,计算公式为:新课探究的最小值为:的最小值为:据前面的分析,回归系数据前面的分析,回归系数 使得误差使得误差由由 知知 ,即,即 ,则,则新课

7、探究 值越大,误差值越大,误差 越小,则变量的线性相关程度越小,则变量的线性相关程度就越高;就越高;值越接近于值越接近于0,越大,线性相关程度就越大,线性相关程度就越低。越低。当当 时,时,两变量的值总体上呈现同,两变量的值总体上呈现同时增加的趋势,则称两变量时增加的趋势,则称两变量正相关正相关;当当 时,时,一变量增加,另一变量有,一变量增加,另一变量有减小的趋势,则称两变量减小的趋势,则称两变量负相关负相关;当当 时,则称两变量时,则称两变量线性不相关线性不相关。相关系数相关系数r的性质的性质新课探究相关系数相关系数1.1.计算公式计算公式2 2相关系数的性质相关系数的性质(1)|r|1(

8、1)|r|1;(2)|r|(2)|r|越接近于越接近于1 1,相关程度越大;,相关程度越大;|r|r|越接近越接近于于0 0,相关程度越小,相关程度越小问题:达到怎样程度,问题:达到怎样程度,x x、y y线性相关呢?它们线性相关呢?它们的相关程度怎样呢?的相关程度怎样呢?负相关负相关正相关正相关思考交流思考交流 对于课本对于课本P73给出的例题,变量的线性相关系数给出的例题,变量的线性相关系数r如何求?如何求?我们知道,相关系数的计算公式为:我们知道,相关系数的计算公式为:要求要求r,只需求出相关的量:,只需求出相关的量:,和和 。,可得,可得,由数据表,经过计算,可知(由数据表,经过计算,

9、可知(P77):):这能说明什么?这能说明什么?这说明肱骨这说明肱骨 和股骨和股骨 有较强的线性相关程度。有较强的线性相关程度。计算下表变量的线性相关系数计算下表变量的线性相关系数r。并观察,通过计算可以发现什么?并观察,通过计算可以发现什么?根据数据列表计算如下:根据数据列表计算如下:解析(解析(P78):1-5025002-43169-123-34916-12405025053491612643169127502500019100750由表可知:由表可知:,则可得,则可得,你发现什么了?你发现什么了?r=0,则变量间并不存在线性相关关系。即此时,则变量间并不存在线性相关关系。即此时建立线性

10、回归方程是没有意义的。建立线性回归方程是没有意义的。实际上,从散点图上我们也可以验证这一点:实际上,从散点图上我们也可以验证这一点:易看出,几个样本点都落在同一个半圆上,而不易看出,几个样本点都落在同一个半圆上,而不是条状分布,此时建立线性回归方程无任何意义,这是条状分布,此时建立线性回归方程无任何意义,这与相关系数与相关系数r的计算结果相一致。的计算结果相一致。许多先进国家对驾驶员的培训,大多采用室内模拟教学和许多先进国家对驾驶员的培训,大多采用室内模拟教学和训练,而后再进行实地训练并考试,这种方法可以大大节训练,而后再进行实地训练并考试,这种方法可以大大节约训练的费用。问题是这种方法有效吗

11、?下表是约训练的费用。问题是这种方法有效吗?下表是12名学员名学员的模拟驾驶成绩的模拟驾驶成绩x与实际考试成绩与实际考试成绩y的记录(单位:分):的记录(单位:分):试问:两者的相关性如何?请画出散点图,并求出试问:两者的相关性如何?请画出散点图,并求出y与与x间的线性相关系数间的线性相关系数.动手做一做动手做一做 x 98 55 50 87 77 89 y 95 60 45 85 75 87 x 79 98 94 83 74 73 y 75 97 92 80 71 72解答:解答:可求出可求出r=0.9871,说明实际考试成绩,说明实际考试成绩y与模拟驾与模拟驾驶成绩驶成绩x有较强的线性相关

12、程度有较强的线性相关程度.拓展思考拓展思考 相关系数相关系数r越大,变量间的线性关系就越越大,变量间的线性关系就越强,那么强,那么r的值究竟大到什么程度就认为线性的值究竟大到什么程度就认为线性关系较强?关系较强?相关系数相关系数正相关;负相关通常,正相关;负相关通常,r r-1,-0.75-1,-0.75负相关很强负相关很强;r r0.75,10.75,1正相关很强正相关很强;r;r-0.75,-0.3-0.75,-0.3负相关一般负相关一般;r r0.3,0.750.3,0.75正相关一般正相关一般;r;r-0.25,0.25-0.25,0.25相关性较弱相关性较弱;相关关系的测度相关关系的

13、测度(相关系数取值及其意义)-1.0+1.00-0.5+0.5完全负相关完全负相关无线性相关无线性相关完全正相关完全正相关负相关程度增加负相关程度增加r正相关程度增加正相关程度增加小结小结 线性相关系数线性相关系数r:值越大,误差值越大,误差 越小,则变量的线性相关程度越小,则变量的线性相关程度就越高;就越高;值越接近于值越接近于0,越大,线性相关程度就越大,线性相关程度就越低。越低。,其中,其中 。当当 时,两变量时,两变量正相关正相关;当;当 时,两变量时,两变量负相关负相关;当;当 时,两变量时,两变量线性不相关线性不相关。4对四四对变量量y和和x进行行线性相关性相关检验,已知,已知n是

14、是观测值组数,数,r是相关系数,且已知:是相关系数,且已知:n7,r0.9533;n15,r0.3012;n17,r0.4991;n3,r0.9950.则变量量y和和x线性相关程度最高的两性相关程度最高的两组是是()A和和B和和C和和D和和解析:解析:相关系数相关系数r的的绝对值越大,越大,变量量x,y的的线性相关性相关程度越高,故程度越高,故选B.答案:答案:B5某厂的生某厂的生产原料耗原料耗费x(单位:百万元位:百万元)与与销售售额y(单位:位:百万元百万元)之之间有如下的有如下的对应关系:关系:()x2468y30405070判断判断x与与y之之间是否存在是否存在线性相关关系性相关关系解

15、:解:画出画出(x,y)的散点的散点图,如,如图所示,由所示,由图可知可知x,y呈呈现线性相关关系性相关关系复习回顾复习回顾 线性相关系数线性相关系数r及性质:及性质:值越大,变量的线性相关程度就越高;值越大,变量的线性相关程度就越高;值越接近于值越接近于0,线性相关程度就越低。,线性相关程度就越低。,其中,其中 。当当 时,两变量时,两变量正相关正相关;当当 时,两变量时,两变量负相关负相关;当当 时,两变量时,两变量线性不相关线性不相关。新课讲解新课讲解 下表按年份给出了下表按年份给出了19812001年我国出口贸易年我国出口贸易量(亿美元)的数据,根据此表你能预测量(亿美元)的数据,根据

16、此表你能预测2008年我年我国的出口贸易量么?国的出口贸易量么?从散点图中观察,数据与直线的拟合性不好,从散点图中观察,数据与直线的拟合性不好,若用直线来预测,误差将会很大。若用直线来预测,误差将会很大。而图像近似指数函数,呈现出非线性相关性。而图像近似指数函数,呈现出非线性相关性。分析:分析:考虑函数考虑函数 来拟合数据的变化关系,将其转来拟合数据的变化关系,将其转化成线性函数,两边取对数:化成线性函数,两边取对数:即线性回归方程,记即线性回归方程,记1981年为年为x=1,1982年为年为x=2,变换后的数据如下表:变换后的数据如下表:设设 ,则上式变为,则上式变为 ,对上表数据求线性回归方程得:对上表数据求线性回归方程得:即:即:由此可得:由此可得:,曲线如图:,曲线如图:这样一来,预测这样一来,预测2008年的出口贸易量就容易多了。年的出口贸易量就容易多了。将下列常见的非线性回归模型转化为线性回归模型。将下列常见的非线性回归模型转化为线性回归模型。作变换作变换得线形函数得线形函数 。1.幂函数:幂函数:2.指数曲线:指数曲线:作变换作变换得线形函数得线形函数 。作怎样的变换,得

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1