spss线性回归分析PPT文件格式下载.ppt

资源描述

spss线性回归分析PPT文件格式下载.ppt

《spss线性回归分析PPT文件格式下载.ppt》由会员分享，可在线阅读，更多相关《spss线性回归分析PPT文件格式下载.ppt（87页珍藏版）》请在冰豆网上搜索。

spss线性回归分析PPT文件格式下载.ppt

距距消防站距离消防站距离3.41.84.62.33.15.50.73.0火灾损失火灾损失26.217.831.323.127.536.014.122.3距距消防站距离消防站距离2.64.32.11.16.14.83.8火灾损失火灾损失19.631.324.017.343.236.426.1一、根据研究的目的，设置指标变量试验指标：

火灾损失试验因素：

距离消防站的距离因此建立两个变量：

x距离消防站的距离y火灾损失二、获取相关数据三、确定理论回归模型的数学形式1.判断x变量与y变量之间的关系是否为线性相关关系？

判断方法：

1）散点图2）相关系数法2.如果是显著线性相关关系，可以选择一元回归方程做为理论回归模型。

1）绘制散点图线性相关线性回归模型2）相关系数2.一元线性回归模型的数学形式参数的估计（xi，yi）四、模型参数的估计应用Spss软件进行回归参数的估计1、执行AnalyzeRegressionLinear命令，打开对话框

（1）从源文件量清单中选择一个数值型变量移入Dependent框中，选择一个变量作为自变量移入Independent框中

（2）点击OK多元线性回归模型一、多元线性回归模型的一般形式二、多元线性回归方程的解释以p2为例。

在建立空调机销售量的预测模型时，用y来表示空调机的销售量，用x1表示空调机的价格，用x2表示消费者可用于支配的收入。

则可以建立二元线性回归模型：

三、回归参数的估计回归参数可以应用普通最小二乘估计。

具体计算可以通过spss软件进行。

未标准化回归方程为：

y=35316.885+6.696x1+0.097x2标准化回归方程为：

y=0.809x1+0.18x2四、模型的检验与修改4.1相关系数的显著性检验4.2F检验4.3t检验4.4样本决定系数4.5残差分析4.1相关系数的显著性检验由于一元线性回归方程讨论的是变量x与y之间的线性关系，所以我们可以用变量x与y之间的相关系数来检验回归方程的显著性。

当r=0时，说明变量之间不存在线性相关关系；

当0r1时，说明变量之间存在一定程度的正相关关系；

当-1r0时，说明变量之间存在一定程度的负相关关系；

当r=1或r=-1时说明变量之间完全正相关或完全负相关。

设总体X和Y的相关系数为r，则检验的原假设和对立假设为：

其中零假设表示：

假设变量之间不存在线性相关关系。

检验时采用的统计量为：

4.2回归方程的显著性检验检验因变量与所有自变量之间的线性关系是否显著，是否可以用线性模型来描述因变量和自变量之间的关系。

也就是检验所有回归系数是否同时与零无显著差异。

应用F检验法加以检验。

注：

检验是否可以用回归方程方法进行模型估计，也就是回归方程是否有效？

回归方程的显著性检验F检验F检验是根据平方和分解式，直接从回归效果检验回归方程的显著性。

F检验总平方和反映因变量y的波动程度或称不确定性，在建立了y对x的线性回归后，总平方和SST就分解成回归平方和SSR与残差平方和SSE这两个组成部分，其中SSR是由回归方程确定的，也就是由自变量x的波动引起的，SSE是不能用自变量解释的波动，是由x之外的未加控制的因素引起的。

这样，总平方和SST中，能够由自变量解释的部分为SSR，不能由自变量解释的部分为SSE。

这样，回归平方和SSR越大，回归效果就越好，可以据此构造F检验统计量：

在零假设成立的情况下，F统计量服从F分布，第一个自由度为1，第二个自由度为n2，即FF（1，n2）。

决策的规则是：

对于给定的显著水平，若FF（1，n2）就拒绝原假设。

回归平方和SSR841.766，残差平方和SSE69.751总平方和SST841.76669.751911.517SIG=0.0000.05,拒绝原来的假设，表示所有的回归系数不同时为0，也就是说，回归方程总体达到显著程度，即回归方程是有效的。

5.3t检验回归方程显著性检验只能检验所有系数是否同时与零有显著性差异。

如果检验出所有回归系数不同时为零，仍然不能保证方程中仍存在与零无显著差异的回归系数，也就是说不能保证所有回归系数同时不为零。

回归系数的显著性检验就是要检验是否所有自变量xi对因变量y的影响程度均显著。

如果原假设成立，则因变量y与自变量x1之间并没有真正的线性关系，也就是说自变量x1的变化对因变量y并没有影响。

构造的t检验统计量为：

SPSS统计结果中对回归系数是否显著为0的t检验SPSS统计结果中对多元回归系数是否显著为0的t检验5.4回归方程的拟合优度检验就是要检验样本数据点聚集在回归直线周围的密集程度，从而评价回归方程对样本数据的代表程度。

一般用判别系数R2实现。

因变量总的变差平方和由自变量引起的因变量变差的平方和由其他随机因素引起的因变量变差的平方和用数学语言表示为：

式中：

由自变量引起的变差平方和能够由回归方程表示，称为回归平方和，由其他随机因素引起的变差平方和无法用回归方程表示，称为残差平方和或剩余平方和。

样本决定系数由回归平方和与残差平方和的意义我们知道，如果在总的离差平方和中，回归平方和所占的比重越大，则线性回归效果就越好，这说明回归直线与样本观测值拟合优度就越好；

如果残差平方和所占比重大，则回归直线与样本观测值拟合得就不理想。

这里把回归平方和与总离差平方和之比定义为样本决定系数，记为：

性质1：

决定系数r2是一个回归直线与样本观测值拟合优度的相对指标，反映了因变量的波动中能用自变量解释的比例。

r2的值总是在0和1之间，也可以用百分数表示。

一个线性回归模型如果充分利用了x的信息，因变量不确定性的绝大部分能由回归方程解释，则r2越接近于1，拟合优度就越好，反之亦然。

性质2：

回归方程的显著性检验与r2值的大小是一致的，即检验越显著，r2就越大，但是这种关系并不是完全确定的，在样本容量n很大时，对高度显著的检验结果仍然可能得到一个小的r2。

导致r2小的可能原因有两个，第一是线性回归不成立，第二是y与x之间的确符合线性模型，只是误差项方差大导致r2小，这时在样本容量n很大时，检验结果仍然可能得出线性回归显著的结论。

5.5残差分析一个线性回归方程通过了t检验或F检验，只是表明变量y与x之间的线性关系是显著的，或者说线性回归方程是有效的，但不能保证数据拟合得很好，也不能排除由于意外原因而导致的数据不完全可靠。

只有当与模型中的残差项有关的假定满足时，才表明模型有效。

2.5.1残差的概念：

实际观测值y与通过回归方程给出的回归值之差，残差ei可以看做是误差项的估计值。

5.5.2残差图分析模型的有效性。

一般认为，如果一个回归模型满足所给出的基本假定，所有残差应是在e0附近随机变化，并在变化幅度不大的一条带子内。

残差图：

以自变量x作横轴，以残差为纵坐标，将相应的残差点画在直角坐标系上，就可以得到残差图。

具体作法：

1.计算残差：

回归分析主对话框中选择save按钮，Residuals选项下的Unstandardized选项，按continue，在原数据文件中加入残差值，2.画残差图。

GraphScatter例:

火灾损失与距离消防站的远近的回归分析回归方程检验的小结1.回归方程是否存在的检验F检验是检验自变量全体对因变量y是否产生显著影响2.所有自变量是否都对因变量有显著影响的检验当一个回归方程通过了F检验之后，并不能说明这个回归方程中所有的自变量都对因变量y有显著影响，因此，还要对回归系数进行检验。

3.回归方差是否有效性的检验样本决定系数与残差分析。

3.回归系数的区间估计当我们用最小二乘法得到0，1的点估计后，在实际应用中往往还希望给出回归系数的估计精度，即给出其置信水平为1的置信区间。

这个区间以1的概率包含参数0，1。

置信区间的长度越短，说明估计值与0，1接近的程度越好，估计值就越精确。

应用spss软件计算回归系数的区间估计：

在线性回归对话框中，点击StatisticsConfidenceinterval，这样，在回归系数表中就增加了回归系数的区间估计。

六、回归模型的运用建立回归模型的目的是为了应用，而预测和控制是回归模型最重要的应用。

4.1单值预测4.2区间预测4.2.1因变量新值的区间预测4.2.2因变量新值的平均值的区间估计4.3控制问题4.1单值预测单值预测就是用单个值作为因变量的预测值。

即当x0新值时，求出y0的预测值。

单值预测只是一个大概值，我们除了想知道预测值外，还希望知道预测值的精度，这就要作区间估计。

4.2区间预测给一个预测范围比只给出单个预测值更可信，这个问题也就是：

应用SPSS软件直接计算预测值1.单值预测：

在计算回归之前，把自变量新值x0输入样本数据中，在回归分析主对话框中点击Save按钮在save对话框中点击PredictedValuesUnstandardized2.因变量新值的区间预测：

在save对话框中点击PredictedintervalsIndividual3.因变量新值平均值的区间预测在save对话框中点击Predictedintervalsmean单值预测区间预测例：

火灾损失与距离消防站远近，x03.5公里，预测火灾损失额。

实习21.应用实习1的数据，对回归系数与回归常数做点估计与区间估计。

2.预测在贷款余额为380时，不良贷款的估计值和估计区间。

6.一元线性回归模型建立小结第一步，提出因变量与自变量第二步，搜集数据第三步，根据数据画散点图第四步，设定理论模型第五步，用SPSS软件计算，输出计算结果第六步，回归诊断，分析输出结果实习3：

下表为四组数据，分别对此四组数据进行回归分析，并做显著性检验。

实验数据文件为：

回归显著性比较.sav第一组x第一组y第二组x第二组y第三组x第三组y第四组x第四组y44.2643.145.3986.5855.6854.7455.7385.7667.2466.1366.0887.7174.8277.2676.4488.8486.9588.1486.7788.4798.8198.7797.1187.04108.04109.14107.4685.25118.33119.26117.8185.561210.84129.13128.1587.91137.58138.741312.7486.89149.96148.1148.841912.57.多元回归方法回归自变量的选择是建立回归模型的一个极为重要的问题。

应用spss软件中回归方法的选择可以进行自变量的选择。

一、前进法（

展开阅读全文