SPSS第五章回归分析.docx
《SPSS第五章回归分析.docx》由会员分享,可在线阅读,更多相关《SPSS第五章回归分析.docx(37页珍藏版)》请在冰豆网上搜索。
SPSS第五章回归分析
一元回归分析
在数学关系式中只描述了一个变量与另一个变量之间的数量变化关系,则称其为一元回归分析。
其回归模型为
y称为因变量,x称为自变量,称为随机误差,a,b称为待估计的回归参数,下标i表示第i个观测值。
如果给出a和b的估计量分别为,,则经验回归方程:
一般把称为残差,残差可视为扰动的“估计量”。
例子:
省汉阳县历年越冬代二化螟发蛾盛期与当年三月上旬平均气温的数据如表1-1,分析三月上旬平均温度与越冬代二化螟发蛾盛期的关系。
表1-1三月上旬平均温度与越冬代二化螟发蛾盛期的情况表
年份
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
三月上旬平均温度
8.6
8.3
9.7
8.5
7.5
8.4
7.3
9.7
5.4
5.5
越冬代二化螟发蛾盛期(6月30日为0)
3
5
3
1
4
4
5
2
7
5
数据保存在“DATA6-1.SAV”文件中。
1)准备分析数据
在数据编辑窗口中输入数据。
建立因变量历期“历期”
在SPSS数据编辑窗口中,创建“年份”、“温度”和“发蛾盛期”变量,并把数据输入相应的变量中。
或者打开已存在的数据文件“DATA6-1.SAV”。
2)启动线性回归过程
单击SPSS主菜单的“Analyze”下的“Regression”中“Linear”项,将打开如图1-1所示的线性回归过程窗口。
图1-1线性回归对话窗口
3)设置分析变量
设置因变量:
本例为“发蛾盛期”变量,用鼠标选中左边变量列表中的“发蛾盛期”变量,然后点击“Dependent”栏左边的向右拉按钮,该变量就自动调入“Dependent”显示栏里。
设置自变量:
选择一个变量作为自变量进入“Independent(S)”框中。
用鼠标选中左边变量列表中的“温度”变量,然后点击“Independent(S)”栏左边的向右拉按钮,该变量就自动调入“Independent(S)”显示栏里。
注:
SPSS中一元回归和多元回归以与多元逐步回归都是使用同一过程,所以该栏可以输入多个自变量。
设置控制变量
“SelectionVariable”为控制变量输入栏。
控制变量相当于过滤变量,即必须当该变量的值满足设置的条件时,观测量才能参加回归分析。
当你输入控制变量后,单击“Rule”按钮,将打开如图1-2所示的对话。
图1-2“Rule”对话框
在“Rule”对话框中,右边的“Value”框用于输入数值,左边的下拉列表中列出了观测量的选择关系,其中各项的意义分别为:
∙“equalto”等于。
∙“notequalto”不等于。
∙“lessthan”小于。
∙“lessthanorequal”小于或等于。
∙“greaterthan”大于。
∙“greaterthanorequal”大于或等于。
本例的控制变量是“计算”,将它选入“SelectionVariable”变量栏里,在“Rule”对话框中选择“equalto”=1。
选择标签变量
“CaseLabels”框用于选择观测量的标签变量。
在输出结果中,可显示该观测量的值,通过该变量的值可查看相应的观测量。
本例子选择“年份”为标签变量。
选择加权变量
在主对话框中单击“WLS”按钮,将在主对话框下方展开一个输入框,该框用于输入加权变量。
本例子没有加权变量,因此不作任何设置。
4)回归方式
在“Method”框中选择一种回归分析方式。
其中,各项的意义为:
∙全进入“Enter”所选择的自变量将全部进入建立的回归方程中,该项为默认方式。
∙逐步进入“Stepwise”根据“Options”对话框中的设置,在方程中加入或剔除单个变量直到所建立的方程中不再
含有可加入或剔除的变量为止。
∙后进入“Remove”将进入方程中的自变量同时剔除。
∙先进入“Backward”自变量框中所有的变量同时进入方程中,然后根据“Options”对话框中的设置,剔除某个变
量,直到所建立的方程中不再含有可剔除的变量为止。
∙条件进入“Forward”根据“Options”对话框中的设置,在方程中每次加入一个变量,直至加入所有符合条件的变
量为止。
本例子是一元回归,只能选第一项。
5)设置输出统计量
单击“Statistics”按钮,将打开如图1-3所示的对话框。
该对话框用于设置相关参数。
其中各项的意义分别为:
图1-3“Statistics”对话框
①“RegressionCoefficients”回归系数选项:
“Estimates”输出回归系数和相关统计量。
“Confidenceinterval”回归系数的95%置信区间。
“Covariancematrix”回归系数的方差-协方差矩阵。
本例子选择“Estimates”输出回归系数和相关统计量。
②“Residuals”残差选项:
“Durbin-Watson”Durbin-Watson检验。
“Casewisediagnostic”输出满足选择条件的观测量的相关信息。
选择该项,下面两项处于可选状态:
“Outliersoutsidestandarddeviations”选择标准化残差的绝对值大于输入值的观测量;
“Allcases”选择所有观测量。
本例子都不选。
③其它输入选项
“Modelfit”输出相关系数、相关系数平方、调整系数、估计标准误、ANOVA表。
“Rsquaredchange”输出由于加入和剔除变量而引起的复相关系数平方的变化。
“Descriptives”输出变量矩阵、标准差和相关系数单侧显著性水平矩阵。
“Partandpartialcorrelation”相关系数和偏相关系数。
“Collinearitydiagnostics”显示单个变量和共线性分析的公差。
本例子选择“Modelfit”项。
6)绘图选项
在主对话框单击“Plots”按钮,将打开如图1-4所示的对话框窗口。
该对话框用于设置要绘制的图形的参数。
图中的“X”和“Y”框用于选择X轴和Y轴相应的变量。
图1-4“Plots”绘图对话框窗口
左上框中各项的意义分别为:
∙“DEPENDNT”因变量。
∙“ZPRED”标准化预测值。
∙“ZRESID”标准化残差。
∙“DRESID”删除残差。
∙“ADJPRED”调节预测值。
∙“SRESID”学生氏化残差。
∙“SDRESID”学生氏化删除残差。
“StandardizedResidualPlots”设置各变量的标准化残差图形输出。
其中共包含两个选项:
“Histogram”用直方图显示标准化残差。
“Normalprobabilityplots”比较标准化残差与正态残差的分布示意图。
“Produceallpartialplot”偏残差图。
对每一个自变量生成其残差对因变量残差的散点图。
本例子不作绘图,不选择。
7)保存分析数据的选项
在主对话框里单击“Save”按钮,将打开如图1-5所示的对话框。
图1-5“Save”对话框
①“PredictedValues”预测值栏选项:
Unstandardized非标准化预测值。
就会在当前数据文件中新添加一个以字符“PRE_”开头命名的变量,存放根据回
归模型拟合的预测值。
Standardized标准化预测值。
Adjusted调整后预测值。
S.E.ofmeanpredictions预测值的标准误。
本例选中“Unstandardized”非标准化预测值。
②“Distances”距离栏选项:
Mahalanobis:
距离。
Cook’s”:
Cook距离。
Leveragevalues:
杠杆值。
③“PredictionIntervals”预测区间选项:
Mean:
区间的中心位置。
Individual:
观测量上限和下限的预测区间。
在当前数据文件中新添加一个以字符“LICI_”开头命名的变量,存放
预测区间下限值;以字符“UICI_”开头命名的变量,存放预测区间上限值。
ConfidenceInterval:
置信度。
本例选中“Individual”观测量上限和下限的预测区间。
④“SavetoNewFile”保存为新文件:
选中“Coefficientstatistics”项将回归系数保存到指定的文件中。
本例不选。
⑤“ExportmodelinformationtoXMLfile”导出统计过程中的回归模型信息到指定文件。
本例不选。
⑥“Residuals”保存残差选项:
“Unstandardized”非标准化残差。
“Standardized”标准化残差。
“Studentized”学生氏化残差。
“Deleted”删除残差。
“Studentizeddeleted”学生氏化删除残差。
本例不选。
⑦“InfluenceStatistics”统计量的影响。
“DfBeta(s)”删除一个特定的观测值所引起的回归系数的变化。
“StandardizedDfBeta(s)”标准化的DfBeta值。
“DiFit”删除一个特定的观测值所引起的预测值的变化。
“StandardizedDiFit”标准化的DiFit值。
“Covarianceratio”删除一个观测值后的协方差矩隈的行列式和带有全部观测值的协方差矩阵的行列式的比率。
本例子不保存任何分析变量,不选择。
8)其它选项
在主对话框里单击“Options”按钮,将打开如图1-6所示的对话框。
图1-6“Options”设置对话框
①“SteppingMethodCriteria”框用于进行逐步回归时部数值的设定。
其中各项为:
“UseprobabilityofF”如果一个变量的F值的概率小于所设置的进入值(Entry),那么这个变量将被选入回归方程
中;当变量的F值的概率大于设置的剔除值(Removal),则该变量将从回归方程中被剔除。
由此可见,设置
“UseprobabilityofF”时,应使进入值小于剔除值。
“UesFvalue”如果一个变量的F值大于所设置的进入值(Entry),那么这个变量将被选入回归方程中;当变量的
F值小于设置的剔除值(Removal),则该变量将从回归方程中被剔除。
同时,设置“UseFvalue”时,应使进
入值大于剔除值。
②“Includeconstantinequation”选择此项表示在回归方程中有常数项。
本例选中“Includeconstantinequation”选项在回归方程中保留常数项。
③“MissingValues”框用于设置对缺失值的处理方法。
其中各项为:
“Excludecaseslistwise”剔除所有含有缺失值的观测值。
“Exchudecasespairwise”仅剔除参与统计分析计算的变量中含有缺失值的观测量。
“Replacewithmean”用变量的均值取代缺失值。
本例选中“Excludecaseslistwise”。
9)提交执行
在主对话框里单击“OK”,提交执行,结果将显示在输出窗口中。
见表1-2至表1-5。
10)结果分析
结果:
表1-2给出了回归的方法是全回归模式,模型编号为1,自变量是“温度”,因变量是“发蛾盛期”。