多元回归分析SPSS案例分析.docx

资源描述

多元回归分析SPSS案例分析.docx

《多元回归分析SPSS案例分析.docx》由会员分享，可在线阅读，更多相关《多元回归分析SPSS案例分析.docx（13页珍藏版）》请在冰豆网上搜索。

多元回归分析SPSS案例分析.docx

多元回归分析SPSS案例分析

多元回归分林

在大马数的实际冋趣中，影响因变量的因索不是一个而是多个，ftillS3类回问題为多元回旧分桥。

可£1建立因变量P与各自变量加,2,3,…,n）之间的多元线性回IH模型：

y=bQ+b1x1+&2x2+.・・4■錶抵+0

其中:

勿是ITH常裁；伽㈣,2,3,…,n）是回IH参数；&是H机误差。

某地区菊虫測根站用相关系数法选取了以下4个硕箍因子；为力最多连续10天诱醱量（头）；上为4月上、中旬百東小谷草把累廿落卵量（挟）；必为4月中旬降水量（毫米），必为4月中旬甬日（天）；预报一代粘虫幼虫发生量〃（头/m2）o分级别数值列

成表2-1o

预摄量必甸平方米幼虫0~10头力1级，11~20头力2级，21~40头为3级，40头以上为4级。

预报因子：

加诱蟻量0~300头为I级，301-600头力2级，601-1000头为3级,1000头以上为4级;屋卵量0-150«为1级，151-300«为2级，301-550块为3级，550块以上力4级；匕障水量0~10.0毫米为1级，10.1-13.2毫米为2级，13.3-17.0毫米为3级，17.0毫米以上力4级；必甬日0~2天为1级，3~4天为2级，5天为3级，6天或6天以上为4级。

表2J

年

ift量

级别

卵量

级别

降水量

级别

和

级别

幼虫密

级别

1960

1022

112

4.3

1961

300

440

0.1

1962

699

7.5

1963

1876

675

17.1

1965

1.9

1966

422

|19671

806

510

11.8

1976

115

240

0.6

1971

718

1460

18.4

1972

803

630

13.4

1973

572

280

13.2

1974

264

330

42.2

1975

198

165

71.8

1976

461

140

7.5

1977

769

640

44.7

1978

255

数据保存FDATA6-5.SAV仪件中。

1）准备分斯数据

在SPSS数摒编辑窗口中,创建“年IT宀量“、哪量”、“降水量”、“甫日“和“幼虫密厦”变量,并输人数据。

再创建播量、圳量、降水量、甬日和幼虫密度的分级变量“力”、“疋“、“昭”、“划“和丁‘,它们对应的分级数值可以在SPSSas编辑窗口中通过廿算严生。

编靖后的数据显示如图2-10

图2-1

或者打开已存在的数据文ADATA6-5.SAV乙

2）启动线性aiaa程

单击SPSS主菜单的“Analyze"下的“Regression"中"Linea广顶,将扌1开如图2-2所示的找性回归过程窗口。

3）玫置分斯变量

按置因变量：

用凤标选中左遊变量列表中的“幼虫密度切“变量,然后点击“Dependent"栏左边的匸口向右拉按和，该变量就務

到“Dependent"因变量显示栏里。

按置自变量：

将左边变量列表中的缄ilx1F\-JP量[x2「「谓水量[x3]\^B[x4p变量，选務到41ndependent（Sr自变量显示栏里。

按置腔岂变量：

本例子中不使用控SM变量,所以不选择任何变量。

选择标签变量：

选择“年悅“为标签变量。

旌择loflti:

本例子没有m权变量,因就不作任阿设置。

4）回归方式

本例子中的4f預报因子变量是经过相关系数法选取出来的，在时不他輪选。

因此在^Method^B中选屮吒nte广选攻,

建立全回归模里。

5）设置H出绒廿量

单击statistics-按N将打开如图2-3»示的对jjffloia对话杞用于设置相关参数。

其中各項的意义分M为:

RegressionCoefficients

&Estimates

厂Confidenceintervals厂Covariancematrix

Residuals

厂Dyrbin-Watson

厂Casewisediagnosiscs

QOutliefi；outsidepstandarddcvinlioris

广AHdiscs

图2-3“Statistics''对话fi

①'RegressionCoefficients"回10系数选肌

硬“Estimates"输出回归系数和相关鋭it量。

厂“Confidenceinterval"@归系数的95%置信区间。

厂“Covariancematrix"0!

H系数

的方差■怵方差拒辞。

本例子选择“Estimates"输出回！

0系数和相关统计量。

②’Residuals"履差选项:

r^Durbin-Watson^Durbin-Watson检验。

厂“Casewisediagnostic”输岀満足选择条件的观測量的相关信息。

选择垓SL下面两顶处于可选狀态:

““Outliersoutsidestandarddeviations''选择标准化残差的姐对值大于松入值的观測1;r“Allcases”选择所有观

本例子胡不选。

③其它输入选項

"Modelfit"输出相关系数、相关系数平方、调整系数、估廿标准锲、AN0VA表。

厂“Rsquaredchange^#出由于加人和别除

变量而引起的夏相关系数平方的变化。

厂descriptive萨输岀变量矩眸、标准差利相关系数单II显著11水平矩眸。

厂-Partandpartialcorrelation^ffl关系数利舗相关系数。

厂“Collinearitydiagnostics1*显示单个变量相共线性分析的公差。

本例子选茫Modelfiriio

6）绘图选頂

在主对话權单击“Plots”ea,将扌〕开如图2/所示的对话框窗口。

该对话根用于设置要绘制的图彫的参®o图中的“片和“片框用于选择X轴和丫轴榊应的变量。

iMearRBgrectlm!

Plot*

•ZPRED■ZRESID•DRESID■ADJPRED■SRESID■SDRESID

StandardizedResidualMots

厂Histogram

rNo（malprobability*plot

图2・4“Plots“绘图对话框窗n

左上根中各項的意义分别为:

•“DEPENDNT"因变量。

•“ZPRED“标准化预測值。

•“ZRESID"标旌化疲差。

•“DRESID“K除残差。

・“ADJPRED"岡节预测值。

•“SRESID”学生氏化展差。

•“SDRESID"学生氏化II除残差。

“StandardizedResidualPlots^^设置各变量的标准化残差图形输出。

其中共包含两个选项:

厂“Histogram”用頁方图显示标誥化残差。

厂“Normalprobabilityplots"比较标准化残差与正态疲差的分布示意图。

“Produceallpartialplot”侗残差图。

对毎一个自变量生成其残差对13变量残差的厳点图。

本例子不作绘图,不选择。

7）保存分斯数据的选顶

在主对话根里卑击"Save"按別，«打开如@2-5R示的对话框。

PvedietedValues

Pynst&ndardized厂StandafdizedrAdjuslcd厂S£mean{Hcdidion^

Distances

rMalalanobis

厂Cooj^s

rLcvcraQcvalues

PredictionIntervals

厂Mean厂Individual

ContidcniceIntcivol:

S«vetoNewFife

rCQcflicicntstatistics

ExportmodelinfornnationtoXMLfile

Brewse

图2-5"Save“对话tg

1“PredictedValues”预測值栏选项：

厂Unstandardized非标准ItfiD值。

就会在当前数摒文件中新添M-个以字符“PRE_“开头命名的变量，存赦根摒回1月模里抵合的预II值。

厂Standardized标旌化预测值。

厂Adjusted禺整后預測值。

厂S.E.ofmeanpredictions預測值的标准闵。

本M选中“Unstandardized”非标准化預測值。

2'Distances”距肉芒选项：

厂Mahalanobis:

即离。

厂Cook^s^^:

Cook即离。

厂Leveragevalues:

杠杆值。

3“PredictionIntervals”预H区同选厦：

厂Mean:

区同的中Q位置。

厂Individual:

观測量上限利下限的預測区间。

在当前敛据文件中新淡JU一个以字符“LICL“开头命名的变量,存笊頂測区间下限a字符“UICL"开头命名的变量，存笊预測区间上限值。

厂ConfidenceInterval：

置信度。

本例不选。

4“SavetoNewFile”保存为新文件：

选中''Coefficientstatistics”項系数廉存到指定的文件中。

本啊不选。

5“ExportmodelinformationtoXMLfile”导出轨计U枳中的回旧模型信息到常定文件。

本例不选。

6“Residuals”保存残差fil：

厂“Unstandardized”非标准化残差。

厂“Standardized”标准化残差。

厂“Studentized"学生氏化残差。

厂“Deleted"JN除歿差。

厂"Studentizeddeleted"学生氏化H除残差。

本例不选。

7“InfluenceStatistics^^竦廿量的册晴。

厂“DfBeta（s）”JM除一个特定的观測值所弓I起的回归系数的变化。

厂“StandardizedDfBeta（s）“标旌化的DfBeta值。

厂“DiFit"W除一个特定的观測值所引起的預H值的变化。

厂"StandardizedDiFit”标准化的DiFit值°厂“Covarianceratio'll］除一个观測值后的协方差他限的行列氏和带有全部规測IS的怵方差拒阵的行列式的比率。

本例子不保存任何分林变量，不选择。

8）其它选頂

在主对话杞里单击“Options"按和，将扌I开如图2-6W示的对话權。

SteppingMethodCriteriaeUseprobabilityofF

广UseFvalue

Entry;卜M—Removal：

（2,71

17fncltrdeconstantinequation

MissingValues

冷Excludeca$e$JistwistrExcludeca&esp-airwiserBeplaccwithmean

图2-6“Options"设置对话柜

©^SteppingMethodCriteria”（B用于进行逐步回10时内部敛值的设定。

其中各顷为:

-UseprobabilityofF'如果一个变量的F值的脚率小于所设置的进人值（Entry），那么速个变量将被选入回归方程中;当变量的F值的闵率大于设置的刷除值（Removal）,则孩变量将U0lfl方椁中被别除。

由此可见，设置

“UseprobabilityofF”时，应便逍人值小于駅除値。

「■“UesFvalue“如果一彳、变量的P值大于所设置的进人値（Entry），影么这个变量將值选人［TH方桿中；当变量的

F值小干设置的H除值（Removal）,BK变量«U0D1方程中被關除。

何BL设置“UseFvalue"时，应使进入值大于91除值。

本例是全回IH不设置。

②“Includeconstantinequation”选择lU顶表示在回!

0方程中有常数顶。

本例选中“Includeconstantinequation”选项在回10方程中保国常数顶。

其中各项为:

広“Excludecaseslistwise"别除所有含有缺失值的规池IS。

「“Exchudecasespairwise”仅刷除参与统廿分桥计算的变量中含有缺失值的规測量。

广“Replacewithmean”用变量的均值取代缺失值。

本例选中"Excludecaseslistwise''。

9）提交执打

在主对话根里单击^or,提交执行，结果垢显示在输出窗口中。

壬要结果见表2・2至表2-4。

10）结果分桥

主要结果:

表2-2

表2・2是回IH模塑筑it量：

R是《!

关系数；RSquareft］关系数的平方，Q称判定系数，判定的扭合用来说

明用自变量解释因变量变异的程B（8（占比M）;AdjustedRSquare调整后的判定系数;Std.ErroroftheEstimate估it标准锲差。

表6-8ANOVA〔方差分析表）

Model

SwnofSquares〔平方和］

（自由度）

Mean.Square〔均方）

Sig.（显著叶生水平）

1Regression.（回归）

16.779

4.195

10.930

・001（a）

ResicbiaL（剰余）

4.221

.384

Total（总的）

21.000

表2-3回归模塑的方差分析表,F值»10.930,显著性概率是0.001,表明BIBS显普。

表6-9Coefficients（0归系数）

Model

UnstandardizedCoefficients（非标准化回归系数）

StandardizedCoefficients（标准化回归系数）

Sig

Std.Error

Beta（p）

（Constant）（常数）

-0.182

.442

-.412

.688

蛾量

0.142

.158

.133

.900

.337

卵量

0.245

.213

.258

1.145

.276

降水量

0.210

.224

.244

.936

.369

雨日

0.606

.246

.465

2.473

.031

分折:

建立回10模型:

根据多元回归模塑:

”=绻+巧叭+6m■+■©

把表6-9中“非标准化回归系数"栏目中的“B“列系数代人上itfOffi方程:

y=-0.182十0.142X1十°卫45惣+0.210^+0.605加

预测时的标准差可用刺余均方估it：

=V0?

38T=±0.620

回归方程曲显着性检验：

从表6-8方差分桥表中得知I：

F貌汁量为10.93,系统自甬检验的显菁性水平为0.001o

1=（0.05411）値为3.36,A0.01,4,11）値为5.67,朋.001,4,11）値为10.35。

因此回肝方棺H1关非常显菁。

（Fffi可在Excel中用FINV（）函数获得）。

回代检验

需要作预报效果的验证时，在主对话柜（图6-8）里单击“Save”按钮,在扌J开如图3-60（示对话根里，选中“PredictedValues”预测值选项栏中的“Unstandardized"非标准（tflUffi选项。

迪样在过样运算时，就食在当前文件中新添M—个“PRE_F命塔的变量,垓变量存故根儘回旧模里折合的預测（8。

然后，在SPSS数据窗口廿算与“PRE」”变量的差值（图2-7）,本洌子IE嵬对差值大于0.8視为不符合,反之H符合。

结果符合的年数为15年，1年不符合，历史符合率力93.75%。

乡元回IH分桥法可媒合多个预报因子的作用，作岀預报，在説廿預报中是一种应用较为普遍的方法。

在实麻运用中，采取為预报因子和预根量按一定标准分为务级，用分级尺度代换较大的数字，更能吗示预报因子与预根量的

关系，預报效果比采用数量值躱廿方法有明显的提高，在实际应用中具有一定的现实恿义。

展开阅读全文