ImageVerifierCode 换一换
格式:DOCX , 页数:10 ,大小:81.88KB ,
资源ID:7353987      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7353987.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(232线性回归方程学案.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

232线性回归方程学案.docx

1、232线性回归方程学案2、3、2线性回归方程讲义编写者:数学教师孟凡洲某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:气温/261813104-1杯数202434385064 如果某天的气温是-5 ,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?为解决这个问题我们接着学习两个变量的线性相关回归直线及其方程.一、【学习目标】1、理解相关关系,能判断两个变量之间是否是相关关系;2、会求线性回归方程,理解其真正含义(估计).二、【自学内容和要求及自学过程】阅读教材8689页内容,回答问题(回归直线方程)请你说出作散点图的步骤和方法.请你说出正、负

2、相关的概念.什么是线性相关?看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?什么叫做回归直线?如何求回归直线的方程?什么是最小二乘法?它有什么样的思想?结论:建立相应的平面直角坐标系,将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)如果散点图中的点散布在从左下角到右上角的区域内,

3、称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系.大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加,呈正相关的趋势,我们可以从散点图上来进一步分析.如下图;从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(regression line).如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代

4、表一样,这条直线可以作为两个变量具有线性相关关系的代表.从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线. 那么,我们应当如何具体求出这个回归方程呢? 有的同学可能会想,我可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测量出此时的斜率和截距,就可得到回归方程了.但是,这样做可靠吗? 有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同.同样地,这样做能保证各点与此直线在整体上是最接近的吗? 还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、

5、截距的平均数,将这两个平均数当成回归方程的斜率和截距. 同学们不妨去实践一下,看看这些方法是不是真的可行?(学生讨论:1.选择能反映直线变化的两个点.2.在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.3.多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.)教师:分别分析各方法的可靠性.如下图: 上面这些方法虽然有一定的道理,但总让人感到可靠性不强. 实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”.人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式其中,b是回归方程的斜率

6、,a是截距.推导公式的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理.假设我们已经得到两个具有线性相关关系的变量(x1,y1),(x2,y2),(xn,yn),且所求回归方程是=bx+a,其中a、b是待定参数.当变量x取xi(i=1,2,n)时可以得到=bxi+a(i=1,2,n),它与实际收集到的yi之间的偏差是yi-=yi-(bxi+a)(i=1,2,n).这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.由于(yi-)可正可负,为了避免相互抵消,可以考虑用来代替,但由于它含有绝对值,运算不太方便,所以改用Q=(y1-bx1-a)2+(y2-bx2-a)2

7、+(yn-bxn-a)2 来刻画n个点与回归直线在整体上的偏差.这样,问题就归结为:当a,b取什么值时Q最小,即总体偏差最小.经过数学上求最小值的运算,a,b的值由公式给出.通过求 式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法(method of least square).三、【综合练习与思考探索】例1 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:温度/-504712151923273136热饮杯数15615013212813011610489937654(1)

8、画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;(3)求回归方程;(4)如果某天的气温是2 ,预测这天卖出的热饮杯数.结论:(1)散点图如下图所示:(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式求出回归方程的系数.利用计算器容易求得回归方程=-2.352x+147.767.(4)当x=2时, =143.063.因此,某天的气温为2 时,这天大约可以卖出143杯热饮. 思考:气温为2 时,小卖部一定能够卖出143杯左右热饮吗?

9、为什么? 这里的答案是小卖部不一定能够卖出143杯左右热饮,原因如下:1.线性回归方程中的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差.2.即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x的预报值,能够与实际值y很接近.我们不能保证点(x,y)落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近,事实上,y=bx+a+e=+e. 这里e是随机变量,预报值与实际值y的接近程度由随机变量e的标准差所决定. 一些学生可能会提出问题:既然不一定能够卖出143杯左右热饮,那么为什么我们还以“这天大约可以卖出143杯热饮”作为结论呢?这是因为这个结论出现

10、的可能性最大.具体地说,假如我们规定可以选择连续的3个非负整数作为可能的预测结果,则我们选择142,143和144能够保证预测成功(即实际卖出的杯数是这3个数之一)的概率最大.例2 下表为某地近几年机动车辆数与交通事故数的统计资料.机动车辆数x千台95110112120129135150180交通事故数y千件6.27.57.78.58.79.810.213(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说明理由;(2)如果具有线性相关关系,求出线性回归方程.结论:(1)在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系(2)

11、计算相应的数据之和:=1 031, =71.6, =137 835, =9 611.7.将它们代入公式计算得b0.077 4,a=-1.024 1,所以,所求线性回归方程为=0.077 4x-1.024 1.四、【作业】1、必做题:习题2.3A组3、4,B组1、2;2、选做题:完成课后练习.五、【课后练习】1、下列两个变量之间的关系哪个不是函数关系( )A.角度和它的余弦值 B.正方形边长和面积C.正边形的边数和它的内角和 D.人的年龄和身高答案:2、三点(3,10),(7,20),(11,24)的线性回归方程是( )A. =5.75-1.75x B. =1.75+5.75x C. =1.75

12、-5.75x D. =5.75+1.75x答案:3、已知关于某设备的使用年限x与所支出的维修费用y(万元),有如下统计资料:使用年限x23456维修费用y2238556570 设y对x呈线性相关关系试求:(1)线性回归方程=bx+a的回归系数a,b;(2)估计使用年限为10年时,维修费用是多少?答案:(1)b=1.23,a=0.08;(2)12.38.4、我们考虑两个表示变量x与y之间的关系的模型,为误差项,模型如下:模型1:y=6+4x;模型2:y=6+4x+e(1)如果x=3,e=1,分别求两个模型中y的值;(2)分别说明以上两个模型是确定性模型还是随机模型解:(1)模型1:y=6+4x=

13、6+43=18;模型2:y=6+4x+e=6+43+1=19.(2)模型1中相同的x值一定得到相同的y值,所以是确定性模型;模型2中相同的x值,因的不同,所得y值不一定相同,且为误差项是随机的,所以模型2是随机性模型5、以下是收集到的新房屋销售价格y与房屋大小x的数据:房屋大小x(m2)80105110115135销售价格y(万元)18.42221.624.829.2(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程.解:(1)散点图如下图.(2)n=5, =545, =109, =116, =23.2,=60 952, =12 952,b=0.199,a=23.2-0.199109

14、1.509,所以,线性回归方程为y=0.199x+1.5096、下列关系中,是带有随机性相关关系的是1 正方形的边长面积之间的关系;水稻产量与施肥量之间的关系人的身高与年龄之间的关系降雪量与交通事故的发生率之间的关系.答案:两变量之间的关系有两种:函数关系与带有机性的相关关系.正方形的边长与面积之间的关系是函数关系.水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.降雪量与交通事故的发生率之间具有相关关系,因此填、.7、现随机抽取某校10名

15、学生在入学考中的数学成绩X与入学后的第一次数学考试成绩Y,数据如下:学号12345678910X12010911710410311010410599108Y84648468696869465771问这10名同学的两次数学考试成绩是否具有相关关系?答案:应用散点图分析,(图略)这10名同学的两次数学考试成绩具有相关关系.8、在下列各图中,每个图的两个变量具有相关关系的图是( ) A、(1)(2) B、(1)(3) C、(2)(4) D、(2)(3)9、线性回归方程必过 A、(0,0)点 B、(,0)点 C、(0,)点心 D、()点10、设有一个直线回归方程为y=21.5x, 则变量x增加一个单位

16、时A、y平均增加1.5个单位于 B、y平均增加2个单位C、y平均减少1.5个单位 D、y平均减少2个单位10、下列变量之间的关系是相关关系的是.球的体积与半径的关系;动物大脑容量的百分比与智力水平的关系;人的年龄与体重之间的关系;降雨量与农作物产量之间的关系.11、要分析学生初中升学的数学成绩对高一学习情况的影响,在高一年级学生中随机抽取了10名学生,他们的入学成绩与期末考试成绩如下表:学生编号12345678910入学成绩X63674588817152995876期末成绩Y65785282928973985675(1)若变量X与Y之间具有线性相关关系,求出回归直线方程.(2)若某学生的入学成绩为80分,试估计他的期末成绩;

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1