SPSS学习系列27回归分析报告.docx

资源描述

SPSS学习系列27回归分析报告.docx

《SPSS学习系列27回归分析报告.docx》由会员分享，可在线阅读，更多相关《SPSS学习系列27回归分析报告.docx（27页珍藏版）》请在冰豆网上搜索。

SPSS学习系列27回归分析报告.docx

SPSS学习系列27回归分析报告

27.回归分析

回归分析是研究一个或多个变量（因变量）与另一些变量（自变量）之间关系的统计方法。

主要思想是用最小二乘法原理拟合因变量与自变量间的最佳回归模型（得到确定的表达式关系）。

其作用是对因变量做解释、控制、或预测。

回归与拟合的区别：

拟合侧重于调整曲线的参数，使得与数据相符；而回归重在研究两个变量或多个变量之间的关系。

它可以用拟合的手法来研究两个变量的关系，以及出现的误差。

回归分析的步骤：

（1）获取自变量和因变量的观测值；

（2）绘制散点图，并对异常数据做修正；

（3）写出带未知参数的回归方程；

（4）确定回归方程中参数值；

（5）假设检验，判断回归方程的拟合优度；

（6）进行解释、控制、或预测。

（一）一元线性回归

一、基本原理

一元线性回归模型：

Y=𝛽0+𝛽1X+ε

其中X是自变量，Y是因变量，𝛽0,𝛽1是待求的未知参数，𝛽0也称为截距；ε是随机误差项，也称为残差，通常要求ε满足：

①ε的均值为0；

②ε的方差为𝜎2；

③协方差COV（εi,εj）=0，当i≠j时。

即对所有的i≠j,εi与εj互不相关。

二、用最小二乘法原理，得到最佳拟合效果的

值：

，

三、假设检验

1.拟合优度检验

计算R2，反映了自变量所能解释的方差占总方差的百分比，值越大说明模型拟合效果越好。

通常可以认为当R2大于0.9时，所得到的回归直线拟合得较好，而当R2小于0.5时，所得到的回归直线很难说明变量之间的依赖关系。

2.回归方程参数的检验

回归方程反应了因变量Y随自变量X变化而变化的规律，若𝛽1=0，则Y不随X变化，此时回归方程无意义。

所以，要做如下假设检验：

H0:

𝛽1=0,H1:

𝛽1≠0；

（1）F检验

若𝛽1=0为真，则回归平方和RSS与残差平方和ESS/（N-2）都是𝜎2的无偏估计，因而采用F统计量：

来检验原假设β1=0是否为真。

（2）T检验

对H0:

𝛽1=0的T检验与F检验是等价的（t2=F）。

3.用回归方程做预测

得到回归方程

后，预测X=x0处的Y值

的预测区间为：

其中tα/2的自由度为N-2.

二、实例

例1有30名儿童棒球选手的数据：

变量Height表示“击球高度”，Distance表示“球飞出的距离”，用回归分析研究球飞出的距离与击球高度的关系。

1.【分析】——【回归】——【线性】，打开“线性回归”窗口，将变量“Distance”选入【因变量】框，“Height”选入【自变量】框；

注：

【选择变量+规则】：

可以对某个变量，只对满足某条件的个案做回归分析；

【WLS权重】：

可选择加权变量进行加权最小二乘法的回归分析；

2.点【统计量】，打开“统计量”子窗口，勾选【回归系数】下的“估计”、“置信区间”，勾选【残差】下的“Durbin-Watson”，勾选“模型拟合度”、“描述性”；点【继续】；

3.【保存】可选项

点【保存】，打开“保存”子窗口，【预测值】给出用回归方程计算的预测值；勾选“未标准化”，【残差】给出做残差分析模型诊断用的各种残差，勾选“标准化”；将在原数据上增加两列PRE_1和ZRE_1分别存储预测值和残差值；点【继续】；

点【确定】，得到

描述性统计量

均值

标准偏差

球飞出的距离

130.73

11.194

击球高度

48.97

2.371