多元回归分析SPSS案例分析.docx
《多元回归分析SPSS案例分析.docx》由会员分享,可在线阅读,更多相关《多元回归分析SPSS案例分析.docx(13页珍藏版)》请在冰豆网上搜索。
多元回归分析SPSS案例分析
多元回归分林
在大马数的实际冋趣中,影响因变量的因索不是一个而是多个,ftillS3类回问題为多元回旧分桥。
可£1建立因变量P与各自变量加,2,3,…,n)之间的多元线性回IH模型:
y=bQ+b1x1+&2x2+.・・4■錶抵+0
其中:
勿是ITH常裁;伽㈣,2,3,…,n)是回IH参数;&是H机误差。
某地区菊虫測根站用相关系数法选取了以下4个硕箍因子;为力最多连续10天诱醱量(头);上为4月上、中旬百東小谷草把累廿落卵量(挟);必为4月中旬降水量(毫米),必为4月中旬甬日(天);预报一代粘虫幼虫发生量〃(头/m2)o分级别数值列
成表2-1o
预摄量必甸平方米幼虫0~10头力1级,11~20头力2级,21~40头为3级,40头以上为4级。
预报因子:
加诱蟻量0~300头为I级,301-600头力2级,601-1000头为3级,1000头以上为4级;屋卵量0-150«为1级,151-300«为2级,301-550块为3级,550块以上力4级;匕障水量0~10.0毫米为1级,10.1-13.2毫米为2级,13.3-17.0毫米为3级,17.0毫米以上力4级;必甬日0~2天为1级,3~4天为2级,5天为3级,6天或6天以上为4级。
表2J
A
a2
a3
a4
y
年
ift量
级别
卵量
级别
降水量
级别
和
级别
幼虫密
K
级别
1960
1022
4
112
1
4.3
1
2
1
10
1
1961
300
1
440
3
0.1
1
1
1
4
1
1962
699
3
67
1
7.5
1
1
1
9
1
1963
1876
4
675
4
17.1
4
7
4
55
4
1965
43
1
80
1
1.9
1
2
1
1
1
1966
422
2
20
1
0
1
0
1
3
1
|19671
806
3
510
3
11.8
2
3
2
28
3
1976
115
1
240
2
0.6
1
2
1
7
1
1971
718
3
1460
4
18.4
4
4
2
45
4
1972
803
3
630
4
13.4
3
3
2
26
3
1973
572
2
280
2
13.2
2
4
2
16
2
1974
264
1
330
3
42.2
4
3
2
19
2
1975
198
1
165
2
71.8
4
5
3
23
3
1976
461
2
140
1
7.5
1
5
3
28
3
1977
769
3
640
4
44.7
4
3
2
44
4
1978
255
1
65
1
0
1
0
1
11
2
数据保存FDATA6-5.SAV仪件中。
1)准备分斯数据
在SPSS数摒编辑窗口中,创建“年IT宀量“、哪量”、“降水量”、“甫日“和“幼虫密厦”变量,并输人数据。
再创建播量、圳量、降水量、甬日和幼虫密度的分级变量“力”、“疋“、“昭”、“划“和丁‘,它们对应的分级数值可以在SPSSas编辑窗口中通过廿算严生。
编靖后的数据显示如图2-10
图2-1
或者打开已存在的数据文ADATA6-5.SAV乙
2)启动线性aiaa程
单击SPSS主菜单的“Analyze"下的“Regression"中"Linea广顶,将扌1开如图2-2所示的找性回归过程窗口。
3)玫置分斯变量
按置因变量:
用凤标选中左遊变量列表中的“幼虫密度切“变量,然后点击“Dependent"栏左边的匸口向右拉按和,该变量就務
到“Dependent"因变量显示栏里。
按置自变量:
将左边变量列表中的缄ilx1F\-JP量[x2「「谓水量[x3]\^B[x4p变量,选務到41ndependent(Sr自变量显示栏里。
按置腔岂变量:
本例子中不使用控SM变量,所以不选择任何变量。
选择标签变量:
选择“年悅“为标签变量。
旌择loflti:
本例子没有m权变量,因就不作任阿设置。
4)回归方式
本例子中的4f預报因子变量是经过相关系数法选取出来的,在时不他輪选。
因此在^Method^B中选屮吒nte广选攻,
建立全回归模里。
5)设置H出绒廿量
单击statistics-按N将打开如图2-3»示的对jjffloia对话杞用于设置相关参数。
其中各項的意义分M为:
RegressionCoefficients
&Estimates
厂Confidenceintervals厂Covariancematrix
Residuals
厂Dyrbin-Watson
厂Casewisediagnosiscs
QOutliefi;outsidepstandarddcvinlioris
广AHdiscs
图2-3“Statistics''对话fi
①'RegressionCoefficients"回10系数选肌
硬“Estimates"输出回归系数和相关鋭it量。
厂“Confidenceinterval"@归系数的95%置信区间。
厂“Covariancematrix"0!
H系数
的方差■怵方差拒辞。
本例子选择“Estimates"输出回!
0系数和相关统计量。
②’Residuals"履差选项:
r^Durbin-Watson^Durbin-Watson检验。
厂“Casewisediagnostic”输岀満足选择条件的观測量的相关信息。
选择垓SL下面两顶处于可选狀态:
““Outliersoutsidestandarddeviations''选择标准化残差的姐对值大于松入值的观測1;r“Allcases”选择所有观
本例子胡不选。
③其它输入选項
"Modelfit"输出相关系数、相关系数平方、调整系数、估廿标准锲、AN0VA表。
厂“Rsquaredchange^#出由于加人和别除
变量而引起的夏相关系数平方的变化。
厂descriptive萨输岀变量矩眸、标准差利相关系数单II显著11水平矩眸。
厂-Partandpartialcorrelation^ffl关系数利舗相关系数。
厂“Collinearitydiagnostics1*显示单个变量相共线性分析的公差。
本例子选茫Modelfiriio
6)绘图选頂
在主对话權单击“Plots”ea,将扌〕开如图2/所示的对话框窗口。
该对话根用于设置要绘制的图彫的参®o图中的“片和“片框用于选择X轴和丫轴榊应的变量。
iMearRBgrectlm!
Plot*
•ZPRED■ZRESID•DRESID■ADJPRED■SRESID■SDRESID
StandardizedResidualMots
厂Histogram
rNo(malprobability*plot
图2・4“Plots“绘图对话框窗n
左上根中各項的意义分别为:
•“DEPENDNT"因变量。
•“ZPRED“标准化预測值。
•“ZRESID"标旌化疲差。
•“DRESID“K除残差。
・“ADJPRED"岡节预测值。
•“SRESID”学生氏化展差。
•“SDRESID"学生氏化II除残差。
“StandardizedResidualPlots^^设置各变量的标准化残差图形输出。
其中共包含两个选项:
厂“Histogram”用頁方图显示标誥化残差。
厂“Normalprobabilityplots"比较标准化残差与正态疲差的分布示意图。
“Produceallpartialplot”侗残差图。
对毎一个自变量生成其残差对13变量残差的厳点图。
本例子不作绘图,不选择。
7)保存分斯数据的选顶
在主对话根里卑击"Save"按別,«打开如@2-5R示的对话框。
PvedietedValues
Pynst&ndardized厂StandafdizedrAdjuslcd厂S£mean{Hcdidion^
Distances
rMalalanobis
厂Cooj^s
rLcvcraQcvalues
PredictionIntervals
厂Mean厂Individual
ContidcniceIntcivol:
|%
S«vetoNewFife
rCQcflicicntstatistics
ExportmodelinfornnationtoXMLfile
Brewse
图2-5"Save“对话tg
1“PredictedValues”预測值栏选项:
厂Unstandardized非标准ItfiD值。
就会在当前数摒文件中新添M-个以字符“PRE_“开头命名的变量,存赦根摒回1月模里抵合的预II值。
厂Standardized标旌化预测值。
厂Adjusted禺整后預測值。
厂S.E.ofmeanpredictions預測值的标准闵。
本M选中“Unstandardized”非标准化預測值。
2'Distances”距肉芒选项:
厂Mahalanobis:
即离。
厂Cook^s^^:
Cook即离。
厂Leveragevalues:
杠杆值。
3“PredictionIntervals”预H区同选厦:
厂Mean:
区同的中Q位置。
厂Individual:
观測量上限利下限的預測区间。
在当前敛据文件中新淡JU一个以字符“LICL“开头命名的变量,存笊頂測区间下限a字符“UICL"开头命名的变量,存笊预測区间上限值。
厂ConfidenceInterval:
置信度。
本例不选。
4“SavetoNewFile”保存为新文件:
选中''Coefficientstatistics”項系数廉存到指定的文件中。
本啊不选。
5“ExportmodelinformationtoXMLfile”导出轨计U枳中的回旧模型信息到常定文件。
本例不选。
6“Residuals”保存残差fil:
厂“Unstandardized”非标准化残差。
厂“Standardized”标准化残差。
厂“Studentized"学生氏化残差。
厂“Deleted"JN除歿差。
厂"Studentizeddeleted"学生氏化H除残差。
本例不选。
7“InfluenceStatistics^^竦廿量的册晴。
厂“DfBeta(s)”JM除一个特定的观測值所弓I起的回归系数的变化。
厂“StandardizedDfBeta(s)“标旌化的DfBeta值。
厂“DiFit"W除一个特定的观測值所引起的預H值的变化。
厂"StandardizedDiFit”标准化的DiFit值°厂“Covarianceratio'll]除一个观測值后的协方差他限的行列氏和带有全部规測IS的怵方差拒阵的行列式的比率。
本例子不保存任何分林变量,不选择。
8)其它选頂
在主对话杞里单击“Options"按和,将扌I开如图2-6W示的对话權。
SteppingMethodCriteriaeUseprobabilityofF
广UseFvalue
Entry;卜M—Removal:
(2,71
17fncltrdeconstantinequation
MissingValues
冷Excludeca$e$JistwistrExcludeca&esp-airwiserBeplaccwithmean
图2-6“Options"设置对话柜
©^SteppingMethodCriteria”(B用于进行逐步回10时内部敛值的设定。
其中各顷为:
-UseprobabilityofF'如果一个变量的F值的脚率小于所设置的进人值(Entry),那么速个变量将被选入回归方程中;当变量的F值的闵率大于设置的刷除值(Removal),则孩变量将U0lfl方椁中被别除。
由此可见,设置
“UseprobabilityofF”时,应便逍人值小于駅除値。
「■“UesFvalue“如果一彳、变量的P值大于所设置的进人値(Entry),影么这个变量將值选人[TH方桿中;当变量的
F值小干设置的H除值(Removal),BK变量«U0D1方程中被關除。
何BL设置“UseFvalue"时,应使进入值大于91除值。
本例是全回IH不设置。
②“Includeconstantinequation”选择lU顶表示在回!
0方程中有常数顶。
本例选中“Includeconstantinequation”选项在回10方程中保国常数顶。
©"MissingValues”杞用于设置对缺失值的处理方法。
其中各项为:
広“Excludecaseslistwise"别除所有含有缺失值的规池IS。
「“Exchudecasespairwise”仅刷除参与统廿分桥计算的变量中含有缺失值的规測量。
广“Replacewithmean”用变量的均值取代缺失值。
本例选中"Excludecaseslistwise''。
9)提交执打
在主对话根里单击^or,提交执行,结果垢显示在输出窗口中。
壬要结果见表2・2至表2-4。
10)结果分桥
主要结果:
表2-2
表2・2是回IH模塑筑it量:
R是《!
关系数;RSquareft]关系数的平方,Q称判定系数,判定的扭合用来说
明用自变量解释因变量变异的程B(8(占比M);AdjustedRSquare调整后的判定系数;Std.ErroroftheEstimate估it标准锲差。
表6-8ANOVA〔方差分析表)
Model
SwnofSquares〔平方和]
df
(自由度)
Mean.Square〔均方)
F
Sig.(显著叶生水平)
1Regression.(回归)
16.779
4
4.195
10.930
・001(a)
ResicbiaL(剰余)
4.221
11
.384
Total(总的)
21.000
15
表2-3回归模塑的方差分析表,F值»10.930,显著性概率是0.001,表明BIBS显普。
表6-9Coefficients(0归系数)
Model
UnstandardizedCoefficients(非标准化回归系数)
StandardizedCoefficients(标准化回归系数)
t
Sig
B
Std.Error
Beta(p)
1
(Constant)(常数)
-0.182
.442
-.412
.688
蛾量
0.142
.158
.133
.900
.337
卵量
0.245
.213
.258
1.145
.276
降水量
0.210
.224
.244
.936
.369
雨日
0.606
.246
.465
2.473
.031
分折:
建立回10模型:
根据多元回归模塑:
”=绻+巧叭+6m■+■©
把表6-9中“非标准化回归系数"栏目中的“B“列系数代人上itfOffi方程:
y=-0.182十0.142X1十°卫45惣+0.210^+0.605加
预测时的标准差可用刺余均方估it:
=V0?
38T=±0.620
回归方程曲显着性检验:
从表6-8方差分桥表中得知I:
F貌汁量为10.93,系统自甬检验的显菁性水平为0.001o
1=(0.05411)値为3.36,A0.01,4,11)値为5.67,朋.001,4,11)値为10.35。
因此回肝方棺H1关非常显菁。
(Fffi可在Excel中用FINV()函数获得)。
回代检验
需要作预报效果的验证时,在主对话柜(图6-8)里单击“Save”按钮,在扌J开如图3-60(示对话根里,选中“PredictedValues”预测值选项栏中的“Unstandardized"非标准(tflUffi选项。
迪样在过样运算时,就食在当前文件中新添M—个“PRE_F命塔的变量,垓变量存故根儘回旧模里折合的預测(8。
然后,在SPSS数据窗口廿算与“PRE」”变量的差值(图2-7),本洌子IE嵬对差值大于0.8視为不符合,反之H符合。
结果符合的年数为15年,1年不符合,历史符合率力93.75%。
2
乡元回IH分桥法可媒合多个预报因子的作用,作岀預报,在説廿預报中是一种应用较为普遍的方法。
在实麻运用中,采取為预报因子和预根量按一定标准分为务级,用分级尺度代换较大的数字,更能吗示预报因子与预根量的
关系,預报效果比采用数量值躱廿方法有明显的提高,在实际应用中具有一定的现实恿义。