spss多元回归分析案例讲解.ppt

资源描述

spss多元回归分析案例讲解.ppt

《spss多元回归分析案例讲解.ppt》由会员分享，可在线阅读，更多相关《spss多元回归分析案例讲解.ppt（30页珍藏版）》请在冰豆网上搜索。

spss多元回归分析案例讲解.ppt

SPSS多元线性回归模型建立基于逐步回归法多元线性回归模型回归：

区别相关。

因变量对解释变量的依赖关系，意义在于通过已知后者的值去预测前者的均值。

线性：

用于研究一种特殊的关系，即用直线或多维直线描述其依赖关系。

多元：

解释变量大于等于两个。

建立一个模型：

Y=0+1X1+2X2+.+iXi确定一些标准，判断进入的变量，和得出对应的系数。

简要回顾一些计量经济学知识vT检验，F检验。

都是对于系数为0假设检验。

vT检验针对的假设是某一个系数为0。

分布。

vF检验针对的假设是所有的回归系数均为0.总显著性检验。

分布。

vSig.值significance即eviews中的p值。

小于设置的显著性水平如0.05，则拒绝原假设，统计量显著。

vR2、调整R2指标揭示拟合程度。

随着进入模型的变量个数增加，R2不断增大，同时代价是残差自由度的减少，意味着估计和预测可靠性低。

举例说明本例给出的是某企业职员调查的数据。

共有样本量474.所给变量共有6个：

当前工资、初始工资、工作种类、过去经验、受雇时间、受教育程度。

准备建立一个以当前工资为因变量，其他变量为自变量的回归方程。

判断哪些变量进入方程，并且给出对应系数。

1、选变量v要建立一个模型首先要选择变量，解释变量和因变量之间要有一定的关系。

v方法：

散点图直接判断相关性和偏相关性系数。

v所要判断的变量：

初始工资、工作种类、过去经验、受雇时间、受教育程度散点图检验线性关系v散点图可以很直观地判断是否存在线性关系。

v操作：

Graphs-LegacyDialogs-Scatter/Dot-SimpleScatter结论：

当前工资和初始工资存在线性关系。

偏相关系数检验线性关系v各因素之间有相互作用，仅仅看每个自变量分别和因变量之间觉得相关系数不能反映出各个变量之间的真实情况。

v检验偏相关系数，控制其他的变量对两个变量相关关系的影响。

v由偏相关系数和对应T值可以判断，这些变量和因变量的有关，可以建立一个以它们为自变量的回归模型。

偏相关系数检验线性关系v操作：

Analyze-Correlate-PartialCorrelationv选择分析变量：

当前工资、受教育程度v选择控制变量：

其他变量v结论：

T值的显著性水平为0，拒绝当前工资和受教育程度不相关的假设。

偏相关系数为0.161.变量和因变量是相关的。

v其他分析变量操作同，初步判断得出变量均可进入模型。

2、选数据v我们建立回归模型是在若干假定前提之下的,即对数据是有要求的。

因变量数据的要求。

（1）是否满足“残差的方差齐性”要求v方法：

散点图v操作在后面做回归模型建立时一同分析。

PP图检验正态性v

（2）因变量数据是否满足正态性要求v方法：

PP图。

所有点聚集在直线上，则说明该变量的数据分布是服从于所要检测的分布的PP图检验正态性v操作：

Analyze-DescriptiveStatistics-vP-Pplotsv检验变量：

当前工资v检验分布：

正态分布Normalv结论：

满足正态性假设要求3、进行回归v介绍回归方法：

vEnter：

强行进入法。

所有变量直接全部进入模型。

只有一个模型。

v向前回归：

根据自变量对因变量的贡献率，首先选择一个贡献率最大的自变量进入，一次只加入一个进入模型。

然后，再选择另一个最好的加入模型，直至选择所有符合标准者全部进入回归。

v向后回归：

将自变量一次纳入回归，然后根据标准删除一个最不显著者，再做一次回归判断其余变量的取舍，直至保留者都达到要求。

逐步回归Stepwise：

是向前回归法和向后回归法的结合。

v首先按自变量对因变量的贡献率进行排序，按照从大到小的顺序选择进入模型的变量。

每将一个变量加入模型，就要对模型中的每个变量进行检验，剔除不显著的变量，然后再对留在模型中的变量进行检验。

直到没有变量可以纳入，也没有变量可以剔除为止。

进行回归操作v进行回归操作：

Analyze-Regression-Linear选择自变量和因变量v选择回归方法：

Stepwise设置操作Statistics：

系统默认选项：

1、Estimates（输出回归系数，标准化回归系数，回归系数为0的假设T值等）2、Modelfit（要引入模型的和要从模型中剔除的变量，每一步模型R2调整R2、ANOVA方差分析表。

设置操作vPlots制图，检查方差齐性，vY:

ZRESID（标准化残差）vX:

ZPRED（标准化预测值）v残差的方差齐性v分析依据：

如果v它的大部分都落v在（-3,3）范围之v内,就可以认为v它满足这个条件。

逐步回归中不在方程中变量一、判断模型中各个要进入变量的系数显著性：

1、注释中是模型已有的变量，表中是排除在回归方程外变量。

2、举例分析第一步：

方程中已有的（第一个进入）变量是初始工资，还有4个未进入模型。

在这个方程的基础上，如果4个变量中每一个单独进入这个方程，会形成一个新的二元解释变量方程，这个二元方程的统计量结果如表。

通过判断PartialCorrelation绝对值来确定哪个是贡献率最大的，从而这个变量先进入模型。

3、第3列是针对每一个变量前面的系数为零的假设的t检验值,第四列给出了这个检验结果。

从中可以看出,sig.值均0.05。

故拒绝系数为零的假设,即每一个变量都对因变量有贡献,所以都不剔除。

4、结论：

第二个进入方程的变量是0.372的职务分类。

分析ANOVA表二、判断每一步模型总显著性1、方差分析表显示了回归拟合过程中每一步的方差分析结果。

2、F值的Sig.值均0.05,不影响。

其他的系数的显著性水平为0.000,它们都0.05,故属于小概率事件,即拒绝回归系数为零的假设,即每个回归方程都有意义。

y=-15038.574+1.365X1+5859.585X2-19.553X3+154.698X4+539.642X5注释：

X1初始工资、X2工作种类、X3过去经验、X4受雇时间、X5受教育程度注意：

B（偏回归系数）,有一个缺点就是单位数量级不一致时,对它的比较毫无意义。

如：

初始工资的单位为1,而工作种类的单位为1000,显然这时工作种类前面的回归系数可能很小。

故对它需要进行改进,这就是Beta系数。

把所有变量都事先进行标准化，消除偏回归系数带来的数量单位的影响。

谢谢观看

展开阅读全文