多元回归分析SPSS案例.docx
《多元回归分析SPSS案例.docx》由会员分享,可在线阅读,更多相关《多元回归分析SPSS案例.docx(11页珍藏版)》请在冰豆网上搜索。
![多元回归分析SPSS案例.docx](https://file1.bdocx.com/fileroot1/2022-10/13/e161d07a-4c08-4eb4-9d44-7d2b71a53510/e161d07a-4c08-4eb4-9d44-7d2b71a535101.gif)
多元回归分析SPSS案例
多元回归分析
在大多数得实际问题中,影响因变量得因素不就就是一个而就就是多个,我们称这类回问题为多元回归分析。
可以建立因变量y与各自变量xj(j=1,2,3,…,n)之间得多元线性回归模型:
其中:
b0就就是回归常数;bk(k=1,2,3,…,n)就就是回归参数;e就就是随机误差。
多元回归在病虫预报中得应用实例:
某地区病虫测报站用相关系数法选取了以下4个预报因子;x1为最多连续10天诱蛾量(头);x2为4月上、中旬百束小谷草把累计落卵量(块);x3为4月中旬降水量(毫米),x4为4月中旬雨日(天);预报一代粘虫幼虫发生量y(头/m2)。
分级别数值列成表2-1。
预报量y:
每平方米幼虫0~10头为1级,11~20头为2级,21~40头为3级,40头以上为4级。
预报因子:
x1诱蛾量0~300头为l级,301~600头为2级,601~1000头为3级,1000头以上为4级;x2卵量0~150块为1级,15l~300块为2级,301~550块为3级,550块以上为4级;x3降水量0~10、0毫米为1级,10、1~13、2毫米为2级,13、3~17、0毫米为3级,17、0毫米以上为4级;x4雨日0~2天为1级,3~4天为2级,5天为3级,6天或6天以上为4级。
表2-1
x1
x2
x3
x4
y
年
蛾量
级别
卵量
级别
降水量
级别
雨日
级别
幼虫密度
级别
1960
1022
4
112
1
4、3
1
2
1
10
1
1961
300
1
440
3
0、1
1
1
1
4
1
1962
699
3
67
1
7、5
1
1
1
9
1
1963
1876
4
675
4
17、1
4
7
4
55
4
1965
43
1
80
1
1、9
1
2
1
1
1
1966
422
2
20
1
0
1
0
1
3
1
1967
806
3
510
3
11、8
2
3
2
28
3
1976
115
1
240
2
0、6
1
2
1
7
1
1971
718
3
1460
4
18、4
4
4
2
45
4
1972
803
3
630
4
13、4
3
3
2
26
3
1973
572
2
280
2
13、2
2
4
2
16
2
1974
264
1
330
3
42、2
4
3
2
19
2
1975
198
1
165
2
71、8
4
5
3
23
3
1976
461
2
140
1
7、5
1
5
3
28
3
1977
769
3
640
4
44、7
4
3
2
44
4
1978
255
1
65
1
0
1
0
1
11
2
数据保存在“DATA6-5、SAV”文件中。
1)准备分析数据
在SPSS数据编辑窗口中,创建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”与“幼虫密度”变量,并输入数据。
再创建蛾量、卵量、降水量、雨日与幼虫密度得分级变量“x1”、“x2”、“x3”、“x4”与“y”,它们对应得分级数值可以在SPSS数据编辑窗口中通过计算产生。
编辑后得数据显示如图2-1。
图2-1
或者打开已存在得数据文件“DATA6-5、SAV”。
2)启动线性回归过程
单击SPSS主菜单得“Analyze”下得“Regression”中“Linear”项,将打开如图2-2所示得线性回归过程窗口。
ﻫ图2-2 线性回归对话窗口
3)设置分析变量
设置因变量:
用鼠标选中左边变量列表中得“幼虫密度[y]”变量,然后点击“Dependent”栏左边得向右拉按钮,该变量就移到“Dependent”因变量显示栏里。
设置自变量:
将左边变量列表中得“蛾量[x1]”、“卵量[x2]”、“降水量[x3]”、“雨日[x4]”变量,选移到“Independent(S)”自变量显示栏里。
设置控制变量:
本例子中不使用控制变量,所以不选择任何变量。
选择标签变量:
选择“年份”为标签变量。
选择加权变量:
本例子没有加权变量,因此不作任何设置。
4)回归方式
本例子中得4个预报因子变量就就是经过相关系数法选取出来得,在回归分析时不做筛选。
因此在“Method”框中选中“Enter”选项,建立全回归模型。
5)设置输出统计量
单击“Statistics”按钮,将打开如图2-3所示得对话框。
该对话框用于设置相关参数。
其中各项得意义分别为:
图2-3 “Statistics”对话框
①“RegressionCoefficients”回归系数选项:
“Estimates”输出回归系数与相关统计量。
ﻫ“Confidenceinterval”回归系数得95%置信区间。
ﻫ“Covariance matrix”回归系数得方差-协方差矩阵。
本例子选择“Estimates”输出回归系数与相关统计量。
②“Residuals”残差选项:
“Durbin-Watson”Durbin-Watson检验。
“Casewisediagnostic”输出满足选择条件得观测量得相关信息。
选择该项,下面两项处于可选状态:
“Outliersoutsidestandard deviations”选择标准化残差得绝对值大于输入值得观测量;
“All cases”选择所有观测量。
本例子都不选。
③其它输入选项
“Model fit”输出相关系数、相关系数平方、调整系数、估计标准误、ANOVA表。
“Rsquaredchange”输出由于加入与剔除变量而引起得复相关系数平方得变化。
“Descriptives”输出变量矩阵、标准差与相关系数单侧显著性水平矩阵。
“Partandpartialcorrelation”相关系数与偏相关系数。
ﻫ“Collinearitydiagnostics”显示单个变量与共线性分析得公差。
本例子选择“Modelfit”项。
6)绘图选项
在主对话框单击“Plots”按钮,将打开如图2-4所示得对话框窗口。
该对话框用于设置要绘制得图形得参数。
图中得“X”与“Y”框用于选择X轴与Y轴相应得变量。
图2-4“Plots”绘图对话框窗口
左上框中各项得意义分别为:
∙“DEPENDNT”因变量。
∙“ZPRED”标准化预测值。
∙“ZRESID”标准化残差。
∙“DRESID”删除残差。
∙“ADJPRED”调节预测值。
∙“SRESID”学生氏化残差。
∙“SDRESID”学生氏化删除残差。
“StandardizedResidual Plots”设置各变量得标准化残差图形输出。
其中共包含两个选项:
“Histogram”用直方图显示标准化残差。
“Normalprobabilityplots”比较标准化残差与正态残差得分布示意图。
“Produceallpartial plot”偏残差图。
对每一个自变量生成其残差对因变量残差得散点图。
本例子不作绘图,不选择。
7)保存分析数据得选项
在主对话框里单击“Save”按钮,将打开如图2-5所示得对话框。
图2-5“Save”对话框
①“PredictedValues”预测值栏选项:
Unstandardized 非标准化预测值。
就会在当前数据文件中新添加一个以字符“PRE_”开头命名得变量,存放根据回
归模型拟合得预测值。
Standardized标准化预测值。
Adjusted调整后预测值。
ﻫS、E、 ofmeanpredictions预测值得标准误。
本例选中“Unstandardized”非标准化预测值。
②“Distances”距离栏选项:
Mahalanobis:
距离。
ﻫCook’s”:
Cook距离。
Leveragevalues:
杠杆值。
③“Prediction Intervals”预测区间选项:
Mean:
区间得中心位置。
ﻫIndividual:
观测量上限与下限得预测区间。
在当前数据文件中新添加一个以字符“LICI_”开头命名得变量,存放ﻫ预测区间下限值;以字符“UICI_”开头命名得变量,存放预测区间上限值。
ﻫConfidenceInterval:
置信度。
本例不选。
④“Saveto NewFile”保存为新文件:
选中“Coefficient statistics”项将回归系数保存到指定得文件中。
本例不选。
⑤“Export modelinformation toXMLfile” 导出统计过程中得回归模型信息到指定文件。
本例不选。
⑥“Residuals”保存残差选项:
“Unstandardized”非标准化残差。
ﻫ“Standardized”标准化残差。
ﻫ“Studentized”学生氏化残差。
ﻫ“Deleted”删除残差。
“Studentizeddeleted”学生氏化删除残差。
本例不选。
⑦“Influence Statistics” 统计量得影响。
“DfBeta(s)”删除一个特定得观测值所引起得回归系数得变化。
ﻫ“StandardizedDfBeta(s)”标准化得DfBeta值。
ﻫ“DiFit”删除一个特定得观测值所引起得预测值得变化。
ﻫ“StandardizedDiFit”标准化得DiFit值。
ﻫ“Covarianceratio”删除一个观测值后得协方差矩隈得行列式与带有全部观测值得协方差矩阵得行列式得比率。
本例子不保存任何分析变量,不选择。
8)其它选项
在主对话框里单击“Options”按钮,将打开如图2-6所示得对话框。
图2-6“Options”设置对话框
①“Stepping MethodCriteria”框用于进行逐步回归时内部数值得设定。
其中各项为:
“Useprobability ofF”如果一个变量得F值得概率小于所设置得进入值(Entry),那么这个变量将被选入回归方程
中;当变量得F值得概率大于设置得剔除值(Removal),则该变量将从回归方程中被剔除。
由此可见,设置
“Use probabilityofF”时,应使进入值小于剔除值。
“Ues Fvalue”如果一个变量得F值大于所设置得进入值(Entry),那么这个变量将被选入回归方程中;当变量得
F值小于设置得剔除值(Removal),则该变量将从回归方程中被剔除。
同时,设置“UseFvalue”时,应使进ﻫ入值大于剔除值。
本例就就是全回归不设置。
②“Includeconstantin equation”选择此项表示在回归方程中有常数项。
本例选中“Includeconstantin equation”选项在回归方程中保留常数项。
③“MissingValues”框用于设置对缺失值得处理方法。
其中各项为:
“Excludecaseslistwise”剔除所有含有缺失值得观测值。
“Exchudecases pairwise”仅剔除参与统计分析计算得变量中含有缺失值得观测量。
“Replacewithmean”用变量得均值取代缺失值。
本例选中“Excludecaseslistwise”。
9)提交执行
在主对话框里单击“OK”,提交执行,结果将显示在输出窗口中。
主要结果见表2-