ImageVerifierCode 换一换
格式:DOCX , 页数:23 ,大小:23.57KB ,
资源ID:15904355      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/15904355.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第十章 直线回归与相关Word文件下载.docx)为本站会员(b****4)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第十章 直线回归与相关Word文件下载.docx

1、的个体身高值是不确定的,而是以该年龄的身高均数为中心而随机变化。这和一般数学研究两个变量的个体函数关系或确定关系不同。两个变量的数量关系就研究目的来说有依存关系和互依关系。依存关系中一个为自变量,常以X表示;一个为应变量,常以Y表示。研究X对Y的作用或Y 对X 的依赖,用回归分析。互依关系中两个变量可令为X 和 Y。研究X和Y的彼此关系或彼此影响,用相关分析。一般说来,相关分析只适用于双随机变量。两个变量的数量关系就数学形式来说有直线关系和曲线关系(或非直线关系)。直线关系为最简单和最基本关系,用直线回归与直线相关描述。本节介绍直线回归。如果选定变量各 X 值处随机变量 Y 服从正态分布且方差

2、相等,各 X 值处 Y 的总体均数Y.x不等且在一条直线上,则该直线称为总体的Y.X对 X的回归直线。双变量正态分布总体若X和Y的总体相关系数(见下节)不等于零,则存在对X和(Y值处X的总体均数)对 Y的两条回归直线,但实际应用中一般只研究一条回归直线,可定自变量为X,应变量为Y。设样本的n对变量值为:(X1,Y2),(X),(Xn)。如果观察到Y随X的变化有直线趋势,即Y随X增大而有相应的增大或减小趋势,把 n 对变量值在直角坐标图上描出相应的 n 点,散点图(scatterdiagram)呈直线趋势(并非所有散点恰在 1 条直线上),则可拟合样本 Y对X的直线回归方程(linear reg

3、ression equation),作为总体直线回归方程的估计。据样本 n 对变量值拟合直线回归方程的方法用最小二乘法(leastsquare method),即使各散点离回归直线的纵向距离平方和为最小。样本直线回归方程及其计算公式为)Y a bX=+( )101bX X Y YX XXYY nXXn=?()()()() /222( )102( )a Y bXY n bX n=?/() /( )103Y为 值处 的总体均数( )的估计值。 为常数项,是回归直线XYa线在 Y 轴上的截距。b 称为直线回归系数,简称回归系数(regressioncoefficient),是直线的斜率。回归系数b描

4、述Y依赖X的直线变化的数量关系的方向与大小。为了进行直观分析,可据直线回归方程绘制回归直线。在X的实测全距范围内任取相距较远且易读数的两个X值,代入直线回归方程求得两个Y值,把这两对变量值在直角坐标图上描两点,通过两点连直线。直线回归方程及相应的回归直线的主要用途有:描述应变量依赖自变量变化而变化的数量关系。例如描述儿童身高依赖年龄变化而变化的数量关系。由易测的变量值来估算难测的变量值。如用病人体重来估算其体表面积。由现在的变量值来预测将来的变量值。如由父亲身高来预测儿子成人后的身高。由于引入自变量,缩减了应变量的变异,因此能更精密地确定不同自变量值处应变量值的正常值范围。例如若不考虑年龄,小

5、儿体重的变异范围大,即正常值范围宽,引入年龄作为体重的自变量,各年龄处小儿体重的变异减小,正常值范围变窄。例 101 某地10名女中学生的体重与肺活量如表101的第(1)、(2)、(3)栏。以体重为 X(kg)、肺活量为 Y(L),绘制散点图,观察有无直线趋势。若有直线趋势,拟合Y对X的直线回归方程。如图101,把表101的10对(X,Y)值在直角坐标图上描出相应的10点。观察到散点图有直线趋势。于是拟合Y对X的直线回归方程。计算表如表101,其相关系数的计算见下节。b =94655 405 2315 1016501 405 10897598500911. /.a = 23.15/10-0.0

6、911 405/10= -1.3746故得女中学生肺活量Y(L)对体重X(kg)的直线回归方程为Y = -1.3746+0.0911X据拟合的直线回归方程绘制回归直线:取则X = 35 Y = -1.3746+0.0911 35=1.81X = 45 Y = -1.3746+0.0911 45= 2.721122如图101,把(35,1.81)和(45,2.72)在直角坐标图上描出2点,通过这2点连直线即得回归直线。回归直线应在X的实测全距范围内或估计的实际可应用范围内绘制,不要任意延长。表 10 1 某地 10 名女中学生的体重 X ( kg )与肺活量 Y ( L )的直线回归方程及相关系

7、数的计算编号XYXYXY(1)(2)(3)(4)(5)(6)1351.6012252.560056.002371.6013692.560059.203372.4013695.760088.804402.1016004.410084.005402.6016006.7600104.006422.5017646.2500105.007422.6517647.0225111.308432.7518497.5625118.259442.7519367.5625121.0010452.2020254.840099.00合计40523.151650155.2875946.55图101 10名女中学生体重与肺

8、活量的散点图及拟合的肺活量对体重的回归直线二、总体回归系数的假设检验总体(X值处Y 的总体均数)对X 的直线回归方程的回归系数用表示。若=0,则各X 值处相等,Y 的变化不依赖 X,即总体不存在对X的直线回归方程及相应回归直线;只有0时总体才存在对X因此推断总体是否存在对X的回归直线,即推断总体回归系数是否等于零。样本回归系数b为总体回归系数的点估计,样本直线回归方程为总体直线回归方程的估计。显然只有0,所拟合的样本直线回归方程及绘制样本回归直线才有意义。总体回归系数的假设检验的检验假设(或无效假设)H为=0;备择假设H一般用双侧0。如果H成立,则 b和0的差别完全由抽样误差造成。样本检验统计

9、量为t,称为样本回归系数b和总体回归系数0比较的t检验。计算t值的公式为tsv nbb= ?| | |02( )104式中s为回归系数的标准误,计算公式为:SYX= )105 Y.X为Y的剩余标准差,是扣除X的影响后Y的变异指标,计算公式为Y YYX. )106式中 () 为 的剩余平方和,即直角坐标图上各散点离回归Y-YY2直线的纵向距离平方和,计算公式为Y YY Y=? )107式中,其他可用求 值的( )式的()Y-Y=Y-(Y)/nb102222分子和分母数据。2 据例101中某地10名女中学生的体重与肺活量资料,问是否存在该地女中学生的肺活量对体重的回归直线?即例101中所拟合的样本

10、直线回归方程是否有意义?设该地女中学生总体肺活量对体重的回归系数为,假设为:H:=00=0.05在例 中已算得,101b=0.0911X-XY-=8.975X- X()()()Y=98.5。现据表101中数据算得()./.YY?=552875 2315 10 16953然后算得()./ .YY?16953 8975 985 08775YX0877510 20331200334据(109)式有t = ?272810 2 8查t界值表得P0.05。按 a=0.05水准拒绝H,接受H,认为存在该地女中学生的肺活量对体重的回归直线,因此例101中所拟合的样本直线回归方程有意义。第二节 直线相关一、相关

11、系数直线相关适用于服从双变量正态分布的双随机变量。直线相关研究两个变量X和Y的互依关系,即X和Y协同变化的数量关系。直线相关系数简称相关系数(correlation coefficient),用以描述两个变量直线相关的方向与紧密程度。总体相关系数用表示,样本相关系数用r表示。由样本n对变量值(X)求r的公式为rX XY YXYXY nXXnYYn ()( _ )()() /() /() /222222 )108相关系数没有单位,其取值范围为:-1r(或)1。相关系数 r 的意义可用图 102 说明。若散点图呈椭圆形分布,X 和 Y有同时增大或减小的趋势,则 0r1,称为正相关;若 X和Y有一个增大、另一个减

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1