ImageVerifierCode 换一换
格式:DOCX , 页数:24 ,大小:251.22KB ,
资源ID:2022652      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/2022652.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第3节 相关性最小二乘估计与统计案例.docx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第3节 相关性最小二乘估计与统计案例.docx

1、第3节 相关性最小二乘估计与统计案例第3节相关性、最小二乘估计与统计案例考试要求1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用.知 识 梳 理1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系

2、称为正相关,点散布在左上角到右下角的区域内,两个变量的相关关系为负相关.2.回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:()画散点图;()求回归直线方程;()用回归直线方程作预报.(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫作回归直线.(2)回归直线方程的求法最小二乘法.设具有线性相关关系的两个变量x,y的一组观察值为(xi,yi)(i1,2,n),则回归直线方程yabx的系数为:其中i,yi,(x,y)称为样本点的中心.(3)相关系数 当r0时,表明两个变量正相关; 当r0时,表明两个变量负相

3、关. r的绝对值越接近于1,表明两个变量的线性相关性越强. r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.3.独立性检验(1)设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=;变量B:B1,B2=.22列联表BAB1B2总计A1ababA2cdcd总计acbdabcd构造一个随机变量2,其中nabcd为样本容量.(2)独立性检验利用随机变量来判断“两个变量有关联”的方法称为独立性检验.(3)当数据量较大时,在统计中,用以下结果对变量的独立性进行判断当22.706时,没有充分的证据判定变量A,B有关联,可

4、以认为变量A,B是没有关联的;当22.706时,有90%的把握判定变量A,B有关联;当23.841时,有95%的把握判定变量A,B有关联;当26.635时,有99%的把握判定变量A,B有关联. 常用结论与微点提醒1.求解回归方程的关键是确定回归系数,应充分利用回归直线过样本点的中心(,).2.根据回归方程计算的值,仅是一个预报值,不是真实发生的值.3.根据2的值可以判断两个分类变量有关的可信程度,若2越大,则两分类变量有关的把握越大.诊 断 自 测1.判断下列结论正误(在括号内打“”或“”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.()(2)通过回归直线方程x可以估

5、计预报变量的取值和变化趋势.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()(4)事件X,Y关系越密切,则由观测数据计算得到的2值越大.()答案(1)(2)(3)(4)2.(老教材选修12P21问题提出改编)为调查中学生近视情况,测得某校在150名男生中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力()A.回归分析 B.均值与方差C.独立性检验 D.概率解析“近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.答案C3.(老教材选修12P7讲解改编)两个变量y与x的回归模型中,分别选择了4个不同模型,它们

6、的相关系数r如下,其中拟合效果最好的模型是()A.模型1的相关系数r为0.98B.模型2的相关系数r为0.80C.模型3的相关系数r为0.50D.模型4的相关系数r为0.25解析在两个变量y与x的回归模型中,它们的相关系数r越近于1,模拟效果越好,在四个选项中A的相关系数最大,所以拟合效果最好的是模型1.答案A4.(2019濮阳一模)根据下表中的数据,得到的回归方程为x9,则()x45678y54321A.2 B.1 C.0 D.1解析由题意可得(45678)6,(54321)3,回归方程为x9且回归直线过点(6,3),369,解得1.答案D5.(2020陕西联考)随着国家二孩政策的全面放开,

7、为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样的方法从不同地区调查了100位育龄妇女,结果如下表.非一线一线总计愿生452065不愿生132235总计5842100由2,得29.616.则正确的结论是()A.有95%的把握认为“生育意愿与城市级别有关”B. 有95%的把握认为“生育意愿与城市级别无关”C.有99%的把握认为“生育意愿与城市级别有关”D.有99%的把握认为“生育意愿与城市级别无关”解析29.6166.635.有99%的把握认为“生育意愿与城市级别有关”.答案C6.(2020昆明一中联考)x和y的散点图如图所示,在相关关系中,若用yc1ec2x拟合时的相关指数为R

8、,用x拟合时的相关指数为R,则R,R中较大的是_.解析由散点图知,用yc1ec2x拟合的效果比x拟合的效果要好,所以RR,故较大者为R.答案R考点一相关关系的判断【例1】 (1)下列四个散点图中,变量x与y之间具有负的线性相关关系的是()(2)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为()A.1 B.0 C. D.1解析(1)观察散点图可知,只有D选项的散点图表示的是变量x与y之间具有负的线性相关关系.故选D.(2)完全的线性关系,且为负相关

9、,故其相关系数为1,故选A.答案(1)D(2)A规律方法判断相关关系的两种方法:(1)散点图法:如果样本点的分布从整体上看大致在某一曲线附近,变量之间就有相关关系;如果样本点的分布从整体上看大致在某一直线附近,变量之间就有线性相关关系.(2)相关系数法:利用相关系数判定,|r|越趋近于1,相关性越强.【训练1】 在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组样本数据,并制成如图所示的人体脂肪含量与年龄的关系的散点图,下列结论中正确的是_(填序号).人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%;人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%;人体脂肪含量与年龄负相

10、关,且脂肪含量的中位数等于20%;人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%.解析观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%.答案考点二回归分析 多维探究角度1线性回归方程及应用【例21】 (2020南昌统考)某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:月份123456广告投入量/万元24681012收益/万元14.2120.3131.831.1837.8344.67他们用两种模型x,yaebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值

11、:xiyix7301 464.24364(1)根据残差图,比较模型,的拟合效果,应选择哪个模型?并说明理由.(2)残差绝对值大于2的数据被认为是异常数据,需要剔除:()剔除异常数据后,求出(1)中所选模型的回归方程;()广告投入量x18时,(1)中所选模型收益的预报值是多少?附:对于一组数据(x1,y1),(x2,y2),(xn,yn),其回归直线x的斜率和截距的最小二乘估计分别为:,.解(1)应该选择模型,因为模型的残差点比较均匀地落在水平的带状区域中,且模型的带状区域比模型的带状区域窄,所以模型的拟合精度高,回归方程的预报精度高.(2)()剔除异常数据,即3月份的数据后,得(766)7.2

12、,(30631.8)29.64.xiyi1 464.24631.81 273.44,x36462328.3,29.6437.28.04.所以y关于x的回归方程为3x8.04.()把x18代入()中所求回归方程得3188.0462.04,故预报值为62.04万元.角度2非线性回归方程及应用【例22】 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值. (xi)2 (wi)2 (xi)(yi) (wi)(yi)46.6

13、5636.8289.81.61 469108.8表中wi,wi.(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型(给出判断即可,不必说明理由)?(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为:,.解(1)由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w,先建立y关于w的线性回归方程,由于68,563686.8100.6,所以y关于w的线性回归方程为100.668w,因此y关于x的回归方程为100.668.(3)由(2)知,当x49时,年销售量y的预报值100.668576.6,年利润z的预报值576.60.24966.32.根据(2)的结果知,年利润z的预报值0.2(100.668)xx13.620.12.所以当6.8,即x46.24

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1