1、多元回归分析SPSS案例分析多元回归分林在大马数的实际冋趣中,影响因变量的因索不是一个而是多个,ft ill S3类回问題为多元回旧分桥。可1建立因变量P与 各自变量加,2,3,n)之间的多元线性回IH模型:y = bQ +b1x1 +&2x2 +. 4錶抵 + 0其中:勿是ITH常裁;伽,2,3,n)是回IH参数;&是H机误差。某地区菊虫測根站用相关系数法选取了以下4个硕箍因子;为力最多连续10天诱醱量(头);上为4月上、中旬百東小谷草 把累廿落卵量(挟);必为4月中旬降水量(毫米),必为4月中旬甬日(天);预报一代粘虫幼虫发生量(头/m2)o分级别数值列成表2-1 o预摄量必甸平方米幼虫0
2、10头力1级,112 0头力2级,2140头为3级,40头以上为4级。预报因子:加诱蟻量0300头为I级,301-600头力2级,601-1000头为3级,1000头以上为4级;屋卵量0-150 为1 级,151-300 为2级,301-550块为3级,550块以上力4级;匕障水量010.0毫米为1级,10.1-13.2毫米为2级,13.3-17.0 毫米为3级,17.0毫米以上力4级;必甬日02天为1级,34天为2级,5天为3级,6天或6天以上为4级。表2JAa2a3a4y年ift量级别卵量级别降水量级别和级别幼虫密K级别19601022411214.31211011961300144030
3、.111141196269936717.511191196318764675417.147455419654318011.91211119664222201010131| 1967 18063510311.82322831976115124020.612171197171831460418.444245419728033630413.433226319735722280213.224216219742641330342.243219219751981165271.84532331976461214017.515328319777693640444.74324441978255165101011
4、12数据保存FDATA6-5.SAV仪件中。1)准备分斯数据在SPSS数摒编辑窗口中,创建“年IT宀量“、哪量”、“降水量”、“甫日“和“幼虫密厦”变量,并输人数据。再创建播量、 圳量、降水量、甬日和幼虫密度的分级变量“力”、“疋“、“昭”、“划“和丁,它们对应的分级数值可以在SPSS a s编辑窗口中通 过廿算严生。编靖后的数据显示如图2-10图2-1或者打开已存在的数据文ADATA6-5.SAV乙2)启动线性aiaa程单击SPSS主菜单的“Analyze下的“Regression中Linea广顶,将扌1开如图2-2所示的找性回归过程窗口。3)玫置分斯变量按置因变量:用凤标选中左遊变量列表中
5、的“幼虫密度切“变量,然后点击“Dependent栏左边的匸口向右拉按和,该变量就務到“Dependent因变量显示栏里。按置自变量:将左边变量列表中的缄ilx1F -JP量x2谓水量x3 Bx4p变量,选務到41ndependent(Sr自变量显 示栏里。按置腔岂变量:本例子中不使用控SM变量,所以不选择任何变量。选择标签变量:选择“年悅“为标签变量。旌择loflti:本例子没有m权变量,因就不作任阿设置。4)回归方式本例子中的4 f預报因子变量是经过相关系数法选取出来的,在时不他輪选。因此在MethodB中选屮吒nte广选攻,建立全回归模里。5)设置H出绒廿量单击statistics-按N
6、将打开如图2-3 示的对jjfflo ia对话杞用于设置相关参数。其中各項的意义分M为:Regression Coefficients& Estimates厂 Confidence intervals 厂 Covariance matrixResiduals厂 Dyrbin-Watson厂 Casewise diagnosiscsQ Outliefi; outside p standard dcvinlioris广 AH discs图 2-3 “Statistics对话 fiRegression Coefficients回 10 系数选肌硬“Estimates输出回归系数和相关鋭it量。厂“C
7、onfidence interval 归系数的95%置信区间。厂“Covariance matrix 0 !H系数的方差怵方差拒辞。本例子选择“Estimates输出回!0系数和相关统计量。Residuals履差选项:rDurbin-WatsonDurbin-Watson检验。厂“Casewisediagnostic”输岀満足选择条件的观測量的相关信息。选择垓SL下面两 顶处于可选狀态:“ “Outliers outside standard deviations选择标准化残差的姐对值大于松入值的观測1; r “All cases”选择所有观本例子胡不选。其它输入选項Model fit输出相关
8、系数、相关系数平方、调整系数、估廿标准锲、AN0VA表。厂“R squared change#出由于加人和别除 变量而引起的夏相关系数平方的变化。厂descriptive萨输岀变量矩眸、标准差利相关系数单II显著11水平矩眸。厂-Part and partial correlationffl关系数利舗相关系数。厂“Collinearity diagnostics1*显示单个变量相共线性分析的公差。本例子选茫Modelfiriio6)绘图选頂在主对话權单击“Plots”ea,将扌开如图2/所示的对话框窗口。该对话根用于设置要绘制的图彫的参o图中的“片和“片 框用于选择X轴和丫轴榊应的变量。iMe
9、ar RBgrectlm! Plot*ZPRED ZRESID D RESID ADJPRED SRESID SDRESIDStandardized Residual Mots厂 Histogramr No(mal probability*plot图24“Plots“绘图对话框窗n左上根中各項的意义分别为:“DEPENDNT因变量。“ZPRED“标准化预測值。“ZRESID标旌化疲差。“DRESID“K 除残差。“ADJPRED岡节预测值。“SRESID ”学生氏化展差。“SDRESID学生氏化II除残差。“Standardized Residual Plots设置各变量的标准化残差图形输出。
10、其中共包含两个选项:厂“Histogram”用頁方图显示标誥化残差。厂“Normal probability plots比较标准化残差与正态疲差的分布示意图。“Produceall partial plot”侗残差图。对毎一个自变量生成其残差对13变量残差的厳点图。本例子不作绘图,不选择。7)保存分斯数据的选顶在主对话根里卑击Save按別,打开如2-5 R示的对话框。Pvedieted Value sP ynst&ndardized 厂 Stand afdized r Adjuslc d 厂 S mean HcdidionDistancesr Malala nobis厂 Coojsr Lcvc
11、raQc valuesPrediction Intervals厂 Mean 厂 IndividualConti dcnice Intcivol: | %Sve to New Fifer CQcflicicnt statisticsExport model infornnation to XML fileBrewse图 2-5 Save“对话 tg1“Predicted Values”预測值栏选项:厂U nstandardized非标准ItfiD值。就会在当前数摒文件中新添M-个以字符“PRE_“开头命名的变量,存赦根摒回1 月模里抵 合的预II值。厂Standardized标旌化预测值。厂Ad
12、justed禺整后預測值。厂S.E. of mean predictions預測值的标准闵。本M选中“Unstandardized”非标准化預測值。2Distances”距肉芒选项:厂 Mahalanobis:即离。厂 Cooks: Cook 即离。厂 Leverage values:杠杆值。3“Prediction Intervals” 预 H 区同选厦:厂Mean:区同的中Q位置。厂Individual:观測量上限利下限的預測区间。在当前敛据文件中新淡JU 一个以字符“LICL “开头命 名的变量,存笊頂測区间下限a字符“UICL开头命名的变量,存笊预測区间上限值。厂Confidence
13、Interval:置信度。本例不选。4“Save to New File”保存为新文件:选中Coefficient statistics”項系数廉存到指定的文件中。本啊不选。5“Export model information to XML file”导出轨计U枳中的回旧模型信息到常定文件。本例不选。6“Residuals”保存残差fil:厂“Unstandardized”非标准化残差。厂“Standardized”标准化残差。厂“Studentized学生氏化残差。厂“DeletedJN除歿差。 厂Studentized deleted学生氏化H除残差。本例不选。7“Influence St
14、atistics 竦廿量的册晴。厂“DfBeta(s)”JM除一个特定的观測值所弓I起的回归系数的变化。厂“Standardized DfBeta(s)“标旌化的DfBeta值。厂“DiFit W除 一个特定的观測值所引起的預H值的变化。厂Standardized DiFit”标准化的DiFit值厂“Covariance ratioll除一个观測值后的协方 差他限的行列氏和带有全部规測IS的怵方差拒阵的行列式的比率。本例子不保存任何分林变量,不选择。8)其它选頂在主对话杞里单击“Options按和,将扌I开如图2-6 W示的对话權。Stepping Method Criteria e Use
15、probability of F广 Use F valueEntry;卜M Removal: (2,7117 fncltrde constant in equationMissing Val ues冷 Exclude ca$e$ Jis twist r Exclude ca&es p-airwise r Beplacc with mean图2-6“Options设置对话柜Stepping Method Criteria”(B用于进行逐步回10时内部敛值的设定。其中各顷为:-Use probability of F如果一个变量的F值的脚率小于所设置的进人值(Entry ),那么速个变量将被选入回
16、归方程中;当变 量的F值的闵率大于设置的刷除值(Removal),则孩变量将U0lfl方椁中被别除。由此可见,设置“Use probability of F”时,应便逍人值小于駅除値。“UesFvalue “如果一彳、变量的P值大于所设置的进人値(Entry ),影么这个变量將值选人TH方桿中;当变量的F值小干设置的H除值(Removal) , B K变量U0D1方程中被關除。何BL设置“Use F value时,应使进入值大于91除值。本例是全回IH不设置。“Include constant in equation”选择lU顶表示在回!0方程中有常数顶。本例选中“Include consta
17、nt in equation”选项在回10方程中保国常数顶。MissingValues”杞用于设置对缺失值的处理方法。其中各项为:広“Exclude cases listwise别除所有含有缺失值的规池IS。“Exchude cases pairwise”仅刷除参与统廿分桥计算的变量中含有缺 失值的规測量。广“Replace with mean”用变量的均值取代缺失值。本例选中Exclude cases listwise。9)提交执打在主对话根里单击or,提交执行,结果垢显示在输出窗口中。壬要结果见表22至表2-4。10)结果分桥主要结果:表2-2表22是回IH模塑筑it量:R是!关系数;R
18、Square ft关系数的平方,Q称判定系数,判定的扭合用来说明用自变量解释因变量变异的程B ( 8(占比M ) ; Adjusted R Square调整后的判定系数;Std. Error of the Estimate估it标准锲差。表6-8 ANOVA方差分析表)ModelSwn of Squares 平方和df(自由度)Mean. Square 均方)FSig. (显著叶生水平)1 Regression.(回归)16.77944. 19510.930 001(a)ResicbiaL (剰余)4. 22111.384Total (总的)21.00015表2-3回归模塑的方差分析表,F值
19、10.930,显著性概率是0.001,表明BIBS显普。表6-9 Coefficients (0归系数)ModelUnstandardized Coefficients (非标准化回归系数)Standardized Coefficients (标准化回归系数)tSigBStd. ErrorBeta ( p )1(Constant)(常数)-0.182.442-.412.688蛾量0.142.158.133.900.337卵量0.245.213.2581.145.276降水量0.210.224.244.936.369雨日0.606.246.4652.473.031分折:建立回10模型:根据多元回
20、归模塑:”=绻+巧叭+6m + 把表6-9中“非标准化回归系数栏目中的“B“列系数代人上it fOffi方程:y = -0.182 十 0.142X1 十 卫45惣 + 0.210 +0.605加预测时的标准差可用刺余均方估it: =V0?38T = 0.620回归方程曲显着性检验:从表6-8方差分桥表中得知I: F貌汁量为10.93,系统自甬检验的显菁性水平为0.001 o1=(0.05411)値为3.36, A0.01,4,11)値为5.67,朋.001,4,11)値为10.35。因此回肝方棺H1关非常显菁。(F ffi可在Excel中 用FINV()函数获得)。回代检验需要作预报效果的验
21、证时,在主对话柜(图6-8)里单击“Save”按钮,在扌J开如图3-6 0(示对话根里,选中“Predicted Values” 预测值选项栏中的“Unstandardized非标准(tflUffi选项。迪样在过样运算时,就食在当前文件中新添M个“PRE_F命塔的变量, 垓变量存故根儘回旧模里折合的預测(8。然后,在SPSS数据窗口廿算与“PRE”变量的差值(图2-7),本洌子IE嵬对差值大于0.8視为不符合,反之H符合。结果 符合的年数为15年,1年不符合,历史符合率力93.75%。2乡元回IH分桥法可媒合多个预报因子的作用,作岀預报,在説廿預报中是一种应用较为普遍的方法。在实麻运用中,采取為预报因子和预根量按一定标准分为务级,用分级尺度代换较大的数字,更能吗示预报因子与预根量的关系,預报效果比采用数量值躱廿方法有明显的提高,在实际应用中具有一定的现实恿义。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1