回归分析作业.docx
《回归分析作业.docx》由会员分享,可在线阅读,更多相关《回归分析作业.docx(12页珍藏版)》请在冰豆网上搜索。
回归分析作业
实验目的:
分析国内生产总值,水电燃料价格指数对电力消费量的影响。
实验变量:
设电力消费量为因变量、国内生产总值和水电燃料价格指数为自变量,建立二元回归模型。
实验方法:
多元线性回归分析法
软件:
spss19.0
操作过程:
step1:
设y=电力消费量,x1=国内生产总值,x2=水电燃料价格指数
建立数据文件 file——new——data;(文件数据见附页)
Step2:
画散点图:
选中Graphs——Scatter/dot-----Simplescatter------define
得出散点图如图所示:
根据散点图可以看出自变量与因变量之间均呈线性关系。
Step3:
Analyze——Regression——Linear,Dependent(因变量)选择电力消费量,Independents(自变量)选择国内生产总值和水电燃料价格指数;Method选择Stepwise.
进入如下界面:
Step4:
Statistics——egressionCoefficients(回归系数)中的Estimates——Residuals(残差)中的Durbin-Watson、Casewisediagnostics默认——Modelfit、Collinearitydiagnotics——Continue.
Step5:
Plots——*ZPRED(标准化预测值)作为纵轴变量——DEPENDNT(因变量)作为横轴变量——StandardizedResidualPlots(标准化残差图)中的Histogram、Normalprobabilityplot——Continue.
Step6:
Save——PredictedVaniues(预测值)和Residuals(残差)选项组中的Unstandardized——Continue.
Step7:
Options——(默认)——Continue.
Step7:
返回主对话框,单击OK.
输出结果分析:
1、引入/剔除变量表
表1自变量进入方式
VariablesEntered/Removeda
Model
VariablesEntered
VariablesRemoved
Method
1
国内生产总值
.
Stepwise(Criteria:
Probability-of-F-to-enter<=.050,Probability-of-F-to-remove>=.100).
2
水电燃料价格指数
.
Stepwise(Criteria:
Probability-of-F-to-enter<=.050,Probability-of-F-to-remove>=.100).
a.DependentVariable:
电力消费量
该表显示模型最先引入变量国内生产总值,第二个引入模型的是水电燃料价格指数,没有变量被剔除。
2、模型汇总
表2模型汇总
ModelSummaryc
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
Durbin-Watson
1
.897a
.804
.783
65.33893
2
.973b
.947
.934
36.10549
2.183
a.Predictors:
(Constant),国内生产总值
b.Predictors:
(Constant),国内生产总值,水电燃料价格指数
c.DependentVariable:
电力消费量
表2是对模型的汇总,模型的复相关系数(R)为0.973,可见线性回归关系密切,可决系数(RSquare)为0.947,调整的可决系数(AdjustedRSquare)为0.934,估计值的标准误差(Std.ErroroftheEstimate)为36.105,Durbin-Watson检验统计量为2.183,综上说明建立的模型效果较好。
3、方差分析表
表3方差分析表
ANOVAc
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
157913.737
1
157913.737
36.989
.000a
Residual
38422.577
9
4269.175
Total
196336.314
10
2
Regression
185907.464
2
92953.732
71.305
.000b
Residual
10428.850
8
1303.606
Total
196336.314
10
a.Predictors:
(Constant),国内生产总值
b.Predictors:
(Constant),国内生产总值,水电燃料价格指数
c.DependentVariable:
电力消费量
表3所示的是回归模型的方差分析表,可以看出,模型的F统计量为71.305,概率p值为0.000,小于显著性水平(0.05),所以该模型是有统计学意义的,即国内生产总值、水电燃料价格指数与水电消费量的线性关系是显著的。
4、回归系数
表4回归系数表
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
CollinearityStatistics
B
Std.Error
Beta
Tolerance
VIF
1
(Constant)
135.922
36.116
3.763
.004
国内生产总值
.102
.017
.897
6.082
.000
1.000
1.000
2
(Constant)
1941.837
390.219
4.976
.001
国内生产总值
.094
.009
.826
9.958
.000
.966
1.035
水电燃料价格指数
-17.151
3.701
-.384
-4.634
.002
.966
1.035
a.DependentVariable:
电力消费量
如表4所示的是回归系数表,给出了回归模型的常数项(constant)、国内生产总值和水电燃料价格指数的偏回归系数,分别等于1941.837、0.094和-17.151,于是得到的回归方程如下:
y=1941.837+0.094*x1-17.151*x2
其中,常数项表示当自变量取值全为0时,因变量的大小。
同时比较国内生产总值和水电燃料价格指数的系数可以看到,水电燃料价格指数对电力消费量的影响大于国内生产总值对其的影响。
表4还给出了模型对国内生产总值和水电燃料价格指数的偏回归系数是否等于0的t检验结果,其t值分别为9.958和-4.634;概率P值都小于显著性水平0.05,因此认为偏回归系数显著不为0。
根据容差发现,自变量间共线性问题不严重,VIF值为1.035。
5、模型外变量
表5模型外变量表
ExcludedVariablesb
Model
BetaIn
t
Sig.
PartialCorrelation
CollinearityStatistics
Tolerance
VIF
MinimumTolerance
1
水电燃料价格指数
-.384a
-4.634
.002
-.854
.966
1.035
.966
a.PredictorsintheModel:
(Constant),国内生产总值
b.DependentVariable:
电力消费量
从表5看出无模型外变量。
6、多重共线性诊断
、
表6共线性诊断表
CollinearityDiagnosticsa
Model
Dimension
Eigenvalue
ConditionIndex
VarianceProportions
(Constant)
国内生产总值
水电燃料价格指数
1
1
1.838
1.000
.08
.08
2
.162
3.370
.92
.92
2
1
2.784
1.000
.00
.03
.00
2
.216
3.594
.00
.93
.00
3
.000
84.179
1.00
.04
1.00
a.DependentVariable:
电力消费量
该表是多重共线性检验的特征值以及条件指数。
特征值最大为2.784,其余依次减小,可以认为多重共线性较弱。
7、残差分析表
表6共线性诊断表
ResidualsStatisticsa
Minimum
Maximum
Mean
Std.Deviation
N
PredictedValue
133.4953
624.7637
320.0209
136.34789
11
Residual
-70.48175
48.77497
.00000
32.29373
11
Std.PredictedValue
-1.368
2.235
.000
1.000
11
Std.Residual
-1.952
1.351
.000
.894
11
a.DependentVariable:
电力消费量
根据表6可以看到,残差的最小值等于-70.482,最大值等于48.775,均值等于0.000,这说明模型的拟合效果还是不错的。
8、回归标准化残差的直方图
该图为回归标准化残差的直方图,正态曲线也被显示在直方图上,用以判断标准化残差是否呈正态分布。
但是由于样本数只有11个,所以只能大概判断其呈正态分布。
9、回归标准化的正态P-P图
该图回归标准化的正态P-P图,该图给出了观测值的残差分布与假设的正态分布的比较,由图可知标准化残差散点分布靠近直线,因而可判断标准化残差呈正态分布。
10、因变量与回归标准化预测值的散点图
该图显示的是因变量与回归标准化预测值的散点图,其中DEPENDENT为x轴变量,*ZPRED为y轴变量。
由图可见,两变量基本呈直线趋势。
电力消费量
国内生产总值
水电燃料价格指数
模型的预测值
残差
320.43
1734.31
104.7
308.48982
11.94018
356.95
2455.36
101.7
427.43175
-70.48175
248.01
1971.3
109
256.92397
-8.91397
660.51
4875.12
103.4
624.7637
35.7463
366.63
1185.04
99.3
349.69219
16.93781
353.2
2232.32
102.9
385.97451
-32.77451
355.97
2035.96
103.2
362.45012
-6.48012
339.66
1161.43
102.6
290.88503
48.77497
125.51
341.11
107.3
133.49532
-7.98532
178.76
329.28
105.2
168.40448
10.35552
214.6
1598.28
109.6
211.71911
2.88089