资料回归分析逐步回归分析.docx-资源下载

资料回归分析逐步回归分析.docx

1、资料回归分析逐步回归分析逐步回归分析在自变量很多时，其中有的因素可能对应变量的影响不是很大，而且X之间可能不完全相互独立的，可能有种种互作关系。在这种情况下可用逐步回归分析, 进行X因子的筛选，这样建立的多元回归模型预测效果会更较好。逐步回归分析，首先要建立因变量y与自变量x之间的总回归方程，再对总的方程及每一个自变量进行假设检验。当总的方程不显著时，表明该多元回归方程线性关系不成立；而当某一个自变量对y影响不显著时，应该把它剔除，重新建立不包含该因子的多元回归方程。筛选出有显著影响的因子作为自变量，并建立“最优”回归方程。回归方程包含的自变量越多，回归平方和越大，剩余的平方和越小，

2、剩余均方也随之较小，预测值夕的误差也愈小，模拟的效果愈好。但是方程中的变量过多，预报工作量就会越大，其中有些相关性不显著的预报因子会影响预测的效果。因此在多元回归模型中，选择适宜的变量数目尤为重要。逐步回归在病虫预报中的应用实例：以陕西省长武地区19841995年的烟盼传毒病情资料、相关虫情和气象资料为例（数据见,建立蜗传病毒病情指数的逐步回归模型，说明逐步回归分析的具体步骤。影响妈传病毒病情指数的虫情因子和气象因子一共有21个，通过逐步回归，从中选出对病惜指数影响显著的因子，从而建立相应的模型。对 1984X993年的病惜指数进行回检，然后对19961998年的病情进行预报，再检

3、验预报的效果。变量说明如下:xlh5月份均温历年病情指数xl2：5月份降水量xh前年冬季油菜越冬时的妍量（头/株）X13：6月份均温x2：前年冬季极端气温xl4：6月份降水量x3：5月份最高气温xl5第一次妍迁高峰期百株烟草x4t5月份最低气温有翅妍量x5z35月份降水量xl6：5月份油菜白株妍量x6：46月份降水量xl7：7月份降水量x7：35月份均温X18x8月份降水量xSt46月份均温xl9：7月份均温x9：4月份降水量x20：8月份均温x21z元月均温xlOx 4月份均温 1）准备分析数据在SPSS数据编辑窗口中,用“File-Open-Data”命令,打开“DATA6.xls”数

4、据文件。数据工作区如下图3-1显示。年份 1 y 1 X1 1 X2i4x6 | x7 | 182）启动线性回归过程单击SPSS主菜单的Analyze”下的Regression”中Linear项，将打开如图3-2所示的线性回归过程窗口。 Linear Regression图3-2线性回归对话窗口3）设置分析变量设置因变量：将左边变量列表中的“y”变量，选入到“Dependent”因变量显示栏里。设置自变量：将左边变量列表中的“xl” “x21”变量,全部选移到Independent （S） ” 自变量栏里。设置控制变量：本例子中不使用控制变量，所以不选择任何变量。选择标签变量：选择“年份”

5、为标签变量。选择加权变量：本例子没有加权变量，因此不作任何设置。4）回归方式在“Method”分析方法框中选中“Stepwise”逐步分析方法。该方法是根据 “Options”选择对话框中显著性检验（尸）的设置，在方程中进入或剔除单个变量，直到所建立的方程中不再含有可加入或可剔除的变量为止。设置后的对话窗口如图3-3o图3-33）设置变量检验水平在图6-15主对话框里单击“Options”按钮，将打开如图3-4所示的对话框。图3-4“Stepping Method Criteria框里的设置用于逐步回归分析的选择标准。其中Use probability of F”选项，提供设置显著性F检验

6、的概率。如果一个变量的F检验概率小于或等于进入“Entry”栏里设置的值，那么这个变量将被选入回归方程中；当回归方程中变量的F值检验概率大于剔除“Remor栏里设置的值，则该变量将从回归方程中被剔除。山此可见，设置F检验概率时，应使进入值小于剔除值。“UesF value”选项，提供设置显著性F检验的分布值。如果一个变量的F 值大于所设置的进入值(Entry),那么这个变量将被选入回归方程中；当回归方程中变量的F值小于设置的剔除值(Removal),则该变量将从回归方程中被剔除。同时，设置F分布值时，应该使进入值大于剔除值。本例子使用显著性F检验的概率，在进入Entry栏里设置为“

7、015,在剔除Removal栏里设置为“0. 20(剔除的概率值应比进入的值大)，如图6-17 所示。图6-17窗口中的其它设置参照一元回归设置。6)设置输岀统计量在主对话图3-2窗口中,单击“Statistics按钮，将打开如图6-18所示的对话框。该对话框用于设置相关参数。其中各项的意义分别为：Regression Coetticients R? Estimates 厂 Confidence intervals 厂 Covariance matrixResiduals厂 Dyrbin Y/atsonf Casewise diagnostics介 OblJieru outside (3

8、Biandard dcviaBionsC | cases图 3-5 Statistics” 对话框1uRegression Coefficients” 回归系数选项：0 Estimates输出回归系数和相关统计量。厂Confidence interval回归系数的95%置信区间。厂Covariance matrixn回归系数的方差-协方差矩阵。本例子选择Estimates输岀回归系数和相关统计量。2Residuals”残差选项：厂 “Durbin - Wat son Durbin-Watson 检验。厂uCasewise diagnosticM输出满足选择条件的观测量的相关信息。选择该项，下

9、面两项处于可选状态：a uOutliers outside standard deviationsn 选择标准化残差的绝对值大于输入值的观测量；“All cases”选择所有观测量。本例子都不选。3其它输入选项0 “Model fit”输出相关系数、相关系数平方、调整系数、估计标准误、AN0VA 表。厂“R squared changeM输出山于加入和剔除变量而引起的复相关系数平方的变化。厂Descriptives输出变量矩阵、标准差和相关系数单侧显著性水平矩阵。厂44Part and partial correlation相关系数和偏相关系数。厂44Collinearity diagn

10、osticsn显示单个变量和共线性分析的公差。本例子选择Model fit”项。7）绘图选项在主对话框单击“Plots”按钮，将打开如图3-6所示的对话框窗口。该对话框用于设置要绘制的图形的参数。图中的“X”和“Y”框用于选择X轴和Y轴相应的变量。图3-6 “Plots”绘图对话框窗口左上框中各项的意义分别为：“DEPENDNT” 因变量。“ZPRED”标准化预测值。“ZRESID”标准化残差。“DRESID”删除残差。ADJPRED”调节预测值。SRESID”学生氏化残差。SDRESID”学生氏化删除残差。uStandardized Residual Plots”设置各变量的标准化残差图

11、形输出。其中共包含两个选项：厂“Histogram”用直方图显示标准化残差。厂Normal probability plots”比较标准化残差与正态残差的分布示意图。uProduce all partial plot”偏残差图。对每一个自变量生成其残差对因变量残差的散点图。本例子不作绘图，不选择。8）保存分析数据的选项在主对话框里单击“Save”按钮，将打开如图3-7所示的对话框。图3-7 Save对话框1Fredicted Values预测值栏选项：厂Unstandardized非标准化预测值。就会在当前数据文件中新添加一个以字符“PREJ开头命名的变量，存放根据回归模型拟合的预测值

12、。厂Standardized标准化预测值。厂Adjusted调整后预测值。厂S. E. of mean predictions预测值的标准误。本例选中Unstandardized”非标准化预测值。2“Distances”距离栏选项：厂 Mahalanobis:距离。厂 Cook s” ： Cook 距离。厂 Leverage values:杠杆值。3Prediction Intervalsw 预测区间选项：厂Mean:区间的中心位置。厂Individual：观测量上限和下限的预测区间。在当前数据文件中新添加一个以字符开头命名的变量，存放预测区间下限值；以字符开头命名的变量，存放预测区间上限值

13、。Confidence Interval：置信度。本例不选。4“Save to New File”保存为新文件：选中“Coefficient statistics”项将回归系数保存到指定的文件中。本例不选。5Export model information to XML f订e导出统计过程中的回归模型信息到指定文件。本例不选。6“Residuals”保存残差选项：厂Unstandardized”非标准化残差。厂Standardized”标准化残差。厂Studentized学生氏化残差。厂“Deleted”删除残差。厂Studentized deleted”学生氏化删除残差。本例不选。7In

14、fluence Statistics统计量的影响。厂“DfBetd(s)”删除一个特定的观测值所引起的回归系数的变化。厂 uStandardized DfBeta(s) ”标准化的 DfBeta 值。厂“DiFit”删除一个特定的观测值所引起的预测值的变化。厂 uStandardized DiFit ”标准化的 DiFit 值。厂“Covaridnce ratio删除一个观测值后的协方差矩隈的行列式和带有全部观测值的协方差矩阵的行列式的比率。本例子不保存任何分析变量，不选择。9)提交执行在主对话框里单击“0K”，提交执行，结果将显示在输出窗口中。主要结果见表 6-10 至表 6-13o10)结果分析主要结果:6-10 Variables Entered/Removed O (进入/剔除变量)Model(歩)Variables Entered (逬入)Variables Removed (剔除)Method（方袪）1xl5-Stepwise (Criteria: P rob ability- ofF -to - ente r = .200).2x4-Stepwise (Criteria: P rob ability- of-F -to - ente r = .200).3x7Stepwise (C

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？