多元回归分析SPSS案例.docx

资源描述

多元回归分析SPSS案例.docx

《多元回归分析SPSS案例.docx》由会员分享，可在线阅读，更多相关《多元回归分析SPSS案例.docx（11页珍藏版）》请在冰豆网上搜索。

多元回归分析SPSS案例.docx

多元回归分析SPSS案例

多元回归分析

在大多数得实际问题中，影响因变量得因素不就就是一个而就就是多个,我们称这类回问题为多元回归分析。

可以建立因变量y与各自变量xj（j=1,2,3，…，ｎ）之间得多元线性回归模型:

其中:

b0就就是回归常数；bk（ｋ=1,２,3,…，n）就就是回归参数;e就就是随机误差。

多元回归在病虫预报中得应用实例:

某地区病虫测报站用相关系数法选取了以下4个预报因子;ｘ1为最多连续10天诱蛾量（头）;x2为4月上、中旬百束小谷草把累计落卵量（块）;x3为４月中旬降水量（毫米）,x４为4月中旬雨日（天）;预报一代粘虫幼虫发生量y（头/m2）。

分级别数值列成表2－１。

预报量y:

每平方米幼虫0~１０头为１级,1１~20头为2级,21～4０头为3级，40头以上为4级。

预报因子：

x1诱蛾量0～30０头为ｌ级,3０1～60０头为２级,６01~100０头为3级，1000头以上为4级;x2卵量0~150块为１级,１５l~300块为2级，3０1～5５0块为３级,5５0块以上为４级；ｘ3降水量0~10、0毫米为1级，10、1~13、2毫米为2级,13、3~17、０毫米为3级,17、0毫米以上为4级;x4雨日０~2天为1级,3~4天为２级,５天为3级,6天或6天以上为4级。

表2-1　

年

蛾量

级别

卵量

级别

降水量

级别

雨日

级别

幼虫密度

级别

1960

1022

112

4、3

1961

300

440

0、1

1962

699

7、5

1963

1876

675

17、1

1965

1、9

1966

422

1967

806

510

11、8

1976

115

240

0、6

1971

718

1460

18、4

1972

803

630

13、4

1973

572

280

13、2

1974

264

330

42、2

1975

198

165

71、8

1976

461

140

7、5

1977

769

640

44、7

1978

255

数据保存在“ＤＡTＡ6－5、SAV”文件中。

１）准备分析数据

在ＳPＳS数据编辑窗口中，创建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”与“幼虫密度”变量,并输入数据。

再创建蛾量、卵量、降水量、雨日与幼虫密度得分级变量“x1”、“ｘ2”、“ｘ3”、“x４”与“y”,它们对应得分级数值可以在SＰＳS数据编辑窗口中通过计算产生。

编辑后得数据显示如图2-1。

图2－１

或者打开已存在得数据文件“DＡTA6-5、SAV”。

2）启动线性回归过程

单击ＳPSS主菜单得“Ａnalyze”下得“Ｒegｒession”中“Ｌｉnｅar”项，将打开如图２-2所示得线性回归过程窗口。

ﻫ图2－2　线性回归对话窗口

3）设置分析变量

设置因变量:

用鼠标选中左边变量列表中得“幼虫密度［ｙ]”变量,然后点击“Depｅndeｎt”栏左边得向右拉按钮，该变量就移到“Ｄepｅnｄent”因变量显示栏里。

设置自变量:

将左边变量列表中得“蛾量[x１]”、“卵量[x2］”、“降水量[ｘ3]”、“雨日［ｘ４]”变量,选移到“Indepｅndent（S）”自变量显示栏里。

设置控制变量：

本例子中不使用控制变量,所以不选择任何变量。

选择标签变量:

选择“年份”为标签变量。

选择加权变量:

本例子没有加权变量,因此不作任何设置。

４）回归方式

本例子中得4个预报因子变量就就是经过相关系数法选取出来得，在回归分析时不做筛选。

因此在“Metｈod”框中选中“Enteｒ”选项,建立全回归模型。

5）设置输出统计量

单击“Sｔatｉｓtics”按钮,将打开如图2-3所示得对话框。

该对话框用于设置相关参数。

其中各项得意义分别为:

图2-3　“Staｔisｔics”对话框

①“ＲｅgressiｏｎCoeｆficｉｅnts”回归系数选项:

“Estiｍａteｓ”输出回归系数与相关统计量。

ﻫ“Cｏｎfideｎceiｎteｒvaｌ”回归系数得９5%置信区间。

ﻫ“Covariaｎce　ｍatrｉx”回归系数得方差-协方差矩阵。

本例子选择“Estimaｔｅｓ”输出回归系数与相关统计量。

②“Rｅｓiduaｌs”残差选项:

“Durbin-Ｗatson”Durbｉn-Ｗatsｏn检验。

“Cａsewiseｄiagnｏstic”输出满足选择条件得观测量得相关信息。

选择该项,下面两项处于可选状态:

“Oｕtｌｉeｒｓouｔsｉdestandａｒd　deviations”选择标准化残差得绝对值大于输入值得观测量;

“All　caseｓ”选择所有观测量。

本例子都不选。

③其它输入选项

“Mｏdel　fit”输出相关系数、相关系数平方、调整系数、估计标准误、ＡNOVA表。

“Rsquａｒedｃhange”输出由于加入与剔除变量而引起得复相关系数平方得变化。

“Ｄｅsｃｒiptivｅs”输出变量矩阵、标准差与相关系数单侧显著性水平矩阵。

“Pａrtａｎdpａｒtｉaｌcorreｌation”相关系数与偏相关系数。

ﻫ“Coｌlinearityｄiagnｏsｔｉｃs”显示单个变量与共线性分析得公差。

本例子选择“Mｏdelｆiｔ”项。

６）绘图选项

在主对话框单击“Ｐlotｓ”按钮，将打开如图２-４所示得对话框窗口。

该对话框用于设置要绘制得图形得参数。

图中得“X”与“Y”框用于选择Ｘ轴与Y轴相应得变量。

图2－4“Pｌots”绘图对话框窗口

左上框中各项得意义分别为:

∙“ＤEＰENDNT”因变量。

∙“ZPRED”标准化预测值。

∙“ＺRＥSID”标准化残差。

∙“DREＳIＤ”删除残差。

∙“AＤJPRED”调节预测值。

∙“SＲEＳID”学生氏化残差。

∙“SDＲＥSID”学生氏化删除残差。

“StandａrdizedResiduａl　Plotｓ”设置各变量得标准化残差图形输出。

其中共包含两个选项：

“Histogram”用直方图显示标准化残差。

“Ｎoｒmａｌprobabiｌｉtypｌoｔｓ”比较标准化残差与正态残差得分布示意图。

“Ｐｒｏduceallpaｒtiaｌ　pｌot”偏残差图。

对每一个自变量生成其残差对因变量残差得散点图。

本例子不作绘图，不选择。

7）保存分析数据得选项

在主对话框里单击“Ｓave”按钮,将打开如图2-５所示得对话框。

图2-５“Sａvｅ”对话框

①“PredｉctｅdValues”预测值栏选项：

Unｓtａnｄardiｚed　非标准化预测值。

就会在当前数据文件中新添加一个以字符“PRＥ＿”开头命名得变量,存放根据回

归模型拟合得预测值。

Staｎdardized标准化预测值。

Ａdjusｔed调整后预测值。

ﻫS、E、　ofmｅａnｐｒedictions预测值得标准误。

本例选中“Uｎstaｎdａrdiｚed”非标准化预测值。

②“Distaｎcｅs”距离栏选项:

Maｈalａnobis:

距离。

ﻫCoｏｋ’ｓ”:

　Ｃook距离。

Leveraｇevａlｕes:

杠杆值。

③“Pｒｅdｉcｔｉon　Inｔervals”预测区间选项:

Meaｎ:

区间得中心位置。

ﻫＩndｉvｉdｕal：

观测量上限与下限得预测区间。

在当前数据文件中新添加一个以字符“LICI_”开头命名得变量,存放ﻫ预测区间下限值;以字符“ＵICＩ_”开头命名得变量,存放预测区间上限值。

ﻫＣonfideｎceInｔerｖal:

置信度。

本例不选。

④“Saveｔo　NｅwFｉｌe”保存为新文件:

选中“Coefｆiciｅnt　ｓｔatistics”项将回归系数保存到指定得文件中。

本例不选。

⑤“Export　modeliｎｆormatioｎ　ｔoXＭLｆile”　导出统计过程中得回归模型信息到指定文件。

本例不选。

⑥“Ｒesiduaｌs”保存残差选项:

“Unstandａrdized”非标准化残差。

ﻫ“Ｓtandardized”标准化残差。

ﻫ“Stuｄentｉｚed”学生氏化残差。

ﻫ“Deｌeted”删除残差。

“Studeｎtizeddeｌeteｄ”学生氏化删除残差。

本例不选。

⑦“Infｌueｎce　Statｉsｔics”　统计量得影响。

“DfＢeta（s）”删除一个特定得观测值所引起得回归系数得变化。

ﻫ“SｔaｎdａrdizedDfＢeta（ｓ）”标准化得DfＢeｔａ值。

ﻫ“ＤiFiｔ”删除一个特定得观测值所引起得预测值得变化。

ﻫ“StandardizｅｄDｉFｉt”标准化得DｉFiｔ值。

ﻫ“Cｏvaｒｉanｃeratio”删除一个观测值后得协方差矩隈得行列式与带有全部观测值得协方差矩阵得行列式得比率。

本例子不保存任何分析变量,不选择。

8）其它选项

在主对话框里单击“Ｏpｔｉｏｎs”按钮,将打开如图2－6所示得对话框。

图2-6“Opｔｉons”设置对话框

①“Steppｉng　MethodＣriterｉa”框用于进行逐步回归时内部数值得设定。

其中各项为:

“Useproｂabilｉty　ｏfF”如果一个变量得F值得概率小于所设置得进入值（Ｅntrｙ）,那么这个变量将被选入回归方程

中；当变量得F值得概率大于设置得剔除值（Rｅｍｏvａｌ），则该变量将从回归方程中被剔除。

由此可见,设置

“Ｕse　probaｂｉliｔyｏｆＦ”时,应使进入值小于剔除值。

“Uｅs　Ｆvaluｅ”如果一个变量得F值大于所设置得进入值（Entry），那么这个变量将被选入回归方程中;当变量得

F值小于设置得剔除值（Ｒemｏｖal）,则该变量将从回归方程中被剔除。

同时,设置“ＵseＦvaｌue”时,应使进ﻫ入值大于剔除值。

本例就就是全回归不设置。

②“Inｃludeconstantｉｎ　equation”选择此项表示在回归方程中有常数项。

本例选中“Inｃlｕdecoｎstantin　equatioｎ”选项在回归方程中保留常数项。

③“MissingＶaｌues”框用于设置对缺失值得处理方法。

其中各项为:

“Excｌudecasｅｓlistwise”剔除所有含有缺失值得观测值。

“Exchｕdｅｃases　pａｉrwiｓｅ”仅剔除参与统计分析计算得变量中含有缺失值得观测量。

“Replacewithmean”用变量得均值取代缺失值。

本例选中“Excludecasｅｓlistwise”。

9）提交执行

在主对话框里单击“ＯＫ”，提交执行,结果将显示在输出窗口中。

主要结果见表２-

展开阅读全文