ImageVerifierCode 换一换
格式:DOCX , 页数:27 ,大小:689.23KB ,
资源ID:9131470      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/9131470.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(SPSS学习系列27回归分析报告.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

SPSS学习系列27回归分析报告.docx

1、SPSS学习系列27回归分析报告27. 回归分析回归分析是研究一个或多个变量(因变量)与另一些变量(自变量)之间关系的统计方法。主要思想是用最小二乘法原理拟合因变量与自变量间的最佳回归模型(得到确定的表达式关系)。其作用是对因变量做解释、控制、或预测。回归与拟合的区别:拟合侧重于调整曲线的参数,使得与数据相符;而回归重在研究两个变量或多个变量之间的关系。它可以用拟合的手法来研究两个变量的关系,以及出现的误差。 回归分析的步骤: (1)获取自变量和因变量的观测值;(2)绘制散点图,并对异常数据做修正;(3)写出带未知参数的回归方程;(4)确定回归方程中参数值;(5)假设检验,判断回归方程的拟合优

2、度;(6)进行解释、控制、或预测。(一)一元线性回归一、基本原理 一元线性回归模型: Y=𝛽0+𝛽1X+其中 X是自变量,Y是因变量,𝛽0,𝛽1是待求的未知参数,𝛽0也称为截距;是随机误差项,也称为残差,通常要求满足: 的均值为0; 的方差为𝜎2; 协方差COV(i, j)=0,当ij时。即对所有的ij, i与j 互不相关。二、用最小二乘法原理,得到最佳拟合效果的值:, 三、假设检验1. 拟合优度检验计算R2,反映了自变量所能解释的方差占总方差的百分比,值越大说明模型拟合效果越好。通常可以认为当R2

3、大于0.9时,所得到的回归直线拟合得较好,而当R2小于0.5时,所得到的回归直线很难说明变量之间的依赖关系。2. 回归方程参数的检验回归方程反应了因变量Y随自变量X变化而变化的规律,若𝛽1=0,则Y不随X变化,此时回归方程无意义。所以,要做如下假设检验:H0: 𝛽1=0, H1: 𝛽10; (1) F检验 若𝛽1=0为真,则回归平方和RSS与残差平方和ESS/(N-2)都是𝜎2的无偏估计,因而采用F统计量:来检验原假设1=0是否为真。(2)T检验对H0: 𝛽1=0的T检验与F检验是等价的(t2=F)

4、。3. 用回归方程做预测得到回归方程后,预测X=x0处的Y值.的预测区间为:其中t/2的自由度为N-2. 二、实例例1 有30名儿童棒球选手的数据:变量Height表示“击球高度”,Distance表示“球飞出的距离”,用回归分析研究球飞出的距离与击球高度的关系。 1. 【分析】【回归】【线性】,打开“线性回归”窗口,将变量“Distance”选入【因变量】框,“Height”选入【自变量】框;注:【选择变量+规则】:可以对某个变量,只对满足某条件的个案做回归分析;【WLS权重】:可选择加权变量进行加权最小二乘法的回归分析;2. 点【统计量】,打开“统计量”子窗口,勾选【回归系数】下的“估计”

5、、“置信区间”,勾选【残差】下的“Durbin-Watson”,勾选“模型拟合度”、“描述性”;点【继续】;3. 【保存】可选项点【保存】,打开“保存”子窗口,【预测值】给出用回归方程计算的预测值;勾选“未标准化”,【残差】给出做残差分析模型诊断用的各种残差,勾选“标准化”;将在原数据上增加两列PRE_1和ZRE_1分别存储预测值和残差值;点【继续】;点【确定】,得到描述性统计量均值标准 偏差N球飞出的距离130.7311.19430击球高度48.972.37130相关性球飞出的距离击球高度Pearson 相关性球飞出的距离1.000.613击球高度.6131.000Sig. (单侧)球飞出的

6、距离.000击球高度.000.N球飞出的距离3030击球高度3030 给出了两个变量的相关性描述,相关系数为0.613. 输入移去的变量a模型输入的变量移去的变量方法1击球高度b.输入a. 因变量: 球飞出的距离b. 已输入所有请求的变量。选入回归模型的变量以及剔除的变量,本例只有一个自变量。模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.613a.376.3539.0011.569a. 预测变量: (常量), 击球高度。b. 因变量: 球飞出的距离模型的R2反映了自变量所能解释的方差占总方差的百分比,值越大说明模型拟合效果越好,本例R2=0.376,说明线性回

7、归关系并不强,球飞出的距离可能还和其它因素如选手的年龄、经验有关。Durbin-Watson 检验值=1.569,说明残差基本上是独立的(靠近2说明误差基本上是独立的,小于2说明是正相关。Anovaa模型平方和df均方FSig.1回归1365.50811365.50816.855.000b残差2268.3582881.013总计3633.86729a. 因变量: 球飞出的距离b. 预测变量: (常量), 击球高度。回归模型的F检验,原假设H0:回归系数=0;本例P值0.0010.05, 故拒绝原假设H0, 即回归系数不为0. 注:对一元线性回归模型,由于T值=F值的平方根,故T检验与F检验是等

8、价的。系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准 误差试用版下限上限1(常量)-11.00934.564-.319.752-81.80959.792击球高度2.895.705.6134.106.0001.4504.339a. 因变量: 球飞出的距离给出回归方程的常数项、回归系数的估计值及置信区间,以及检验结果(原假设H0:其值=0),得到回归方程:Distance = -11.009 + 2.895 * Height斜率2.895的t检验P值=0.00030.05,说明该结果在显著水平下有统计学意义;但截距的t检验结果并不显著。残差统计量a极小值极大值均值标准

9、偏差N预测值119.25142.41130.736.86230残差-23.72420.276.0008.84430标准 预测值-1.6731.701.0001.00030标准 残差-2.6362.253.000.98330a. 因变量: 球飞出的距离(二)多元线性回归一、基本原理 多元线性回归模型:Y=𝛽0+𝛽1X1+ 𝛽NXN+其中 X1, , XN是自变量,Y是因变量,𝛽0, 𝛽1, 𝛽N是待求的未知参数,是随机误差项(残差),若记多元线性回归模型可写为矩阵形式:Y=X+通常要求:矩阵X的秩为k

10、+1(保证不出现共线性), 且k= .100 的概率)。3.体重向后(准则: F-to-remove = .100 的概率)。a. 因变量: 耗氧量b. 已输入所有请求的变量。 采用“向后法”筛选变量结果为:第2步剔除了变量“休息时每分钟心跳次数”、第3步剔除了变量“体重”;最终选入变量“跑步时每分钟心跳次数”、“年龄”、“跑15英里的时间”。模型汇总d模型RR 方调整 R 方标准 估计的误差更改统计量Durbin-WatsonR 方更改F 更改df1df2Sig. F 更改1.904a.817.7802.497982.81722.288525.0002.904b.816.7882.45133

11、3.000.038125.8473.901c.811.7902.440634-.005.765126.3901.960a. 预测变量: (常量), 跑步时每分钟心跳次数, 体重, 休息时每分钟心跳次数, 年龄, 跑15英里的时间。b. 预测变量: (常量), 跑步时每分钟心跳次数, 体重, 年龄, 跑15英里的时间。c. 预测变量: (常量), 跑步时每分钟心跳次数, 年龄, 跑15英里的时间。d. 因变量: 耗氧量 整个回归模型的修正R2=0.790,表明模型拟合程度较好,Durbin-Watson值=1.96接近2,表明残差的度量性很好。Anovaa模型平方和df均方FSig.1回归695

12、.3845139.07722.288.000b残差155.998256.240总计851.382302回归695.1474173.78728.921.000c残差156.235266.009总计851.382303回归690.5513230.18438.643.000d残差160.831275.957总计851.38230a. 因变量: 耗氧量b. 预测变量: (常量), 跑步时每分钟心跳次数, 体重, 休息时每分钟心跳次数, 年龄, 跑15英里的时间。c. 预测变量: (常量), 跑步时每分钟心跳次数, 体重, 年龄, 跑15英里的时间。d. 预测变量: (常量), 跑步时每分钟心跳次数,

13、年龄, 跑15英里的时间。回归模型的F值较大,P值远小于0.05,故回归模型是有统计学意义的。系数a模型非标准化系数标准系数tSig.相关性共线性统计量B标准 误差试用版零阶偏部分容差VIF1(常量)116.04611.6079.998.000年龄-.280.103-.274-2.719.012-.305-.478-.233.7211.387体重-.051.058-.079-.875.390-.163-.172-.075.8961.117跑15英里的时间-2.743.402-.714-6.819.000-.862-.806-.584.6681.497休息时每分钟心跳次数-.012.063-.0

14、19-.195.847-.346-.039-.017.7661.306跑步时每分钟心跳次数-.128.052-.246-2.444.022-.398-.439-.209.7231.3832(常量)115.66211.22610.303.000年龄-.276.099-.270-2.783.010-.305-.479-.234.7481.338体重-.049.056-.077-.875.390-.163-.169-.073.9081.102跑15英里的时间-2.772.365-.722-7.597.000-.862-.830-.638.7811.280跑步时每分钟心跳次数-.129.051-.24

15、9-2.544.017-.398-.446-.214.7371.3563(常量)111.71810.23510.915.000年龄-.256.096-.251-2.664.013-.305-.456-.223.7901.267跑15英里的时间-2.825.358-.736-7.886.000-.862-.835-.660.8041.244跑步时每分钟心跳次数-.131.051-.252-2.588.015-.398-.446-.216.7381.355a. 因变量: 耗氧量根据回归系数的估计,可以得到多元线性回归方程:Oxygen=111.718-0.256*age-2.825*runtime

16、-0.131*runpulse共线性诊断a模型维数特征值条件索引方差比例(常量)年龄体重跑15英里的时间休息时每分钟心跳次数跑步时每分钟心跳次数115.9501.000.00.00.00.00.00.002.02017.067.00.11.02.01.54.003.01420.412.00.19.35.07.02.014.01024.954.01.07.02.81.23.005.00534.721.03.16.51.00.21.266.00177.423.96.47.10.10.01.73214.9671.000.00.00.00.00.002.01418.529.00.30.29.03.013.01120.838.01.12.04.83.004.00629.476.03.11.59.06.215.00170.426.96.46.09.09.79313.9781.000.00.00.00.002.01218.340.00.38.

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1