SPSS多元线性回归分析实例操作步骤.doc
《SPSS多元线性回归分析实例操作步骤.doc》由会员分享,可在线阅读,更多相关《SPSS多元线性回归分析实例操作步骤.doc(12页珍藏版)》请在冰豆网上搜索。
SPSS统计分析
多元线性回归分析方法操作与分析
实验目的:
引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。
实验变量:
以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。
实验方法:
多元线性回归分析法
软件:
spss19.0
操作过程:
第一步:
导入Excel数据文件
1.opendatadocument——opendata——open;
2.Openingexceldatasource——OK.
第二步:
1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method选择Stepwise.
进入如下界面:
2.点击右侧Statistics,勾选RegressionCoefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的Durbin-Watson、Casewisediagnostics默认;接着选择Modelfit、Collinearitydiagnotics;点击Continue.
3.点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的StandardizedResidualPlots(标准化残差图)中的Histogram、Normalprobabilityplot;点击Continue.
4.点击右侧Save,勾选PredictedVaniues(预测值)和Residuals(残差)选项组中的Unstandardized;点击Continue.
5.点击右侧Options,默认,点击Continue.
6.返回主对话框,单击OK.
输出结果分析:
1.引入/剔除变量表
VariablesEntered/Removeda
Model
VariablesEntered
VariablesRemoved
Method
1
城市人口密度(人/平方公里)
.
Stepwise(Criteria:
Probability-of-F-to-enter<=.050,Probability-of-F-to-remove>=.100).
2
城市居民人均可支配收入(元)
.
Stepwise(Criteria:
Probability-of-F-to-enter<=.050,Probability-of-F-to-remove>=.100).
a.DependentVariable:
商品房平均售价(元/平方米)
该表显示模型最先引入变量城市人口密度(人/平方公里),第二个引入模型的是变量城市居民人均可支配收入(元),没有变量被剔除。
2.模型汇总
ModelSummaryc
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
Durbin-Watson
1
1.000a
1.000
1.000
35.187
2
1.000b
1.000
1.000
28.351
2.845
a.Predictors:
(Constant),城市人口密度(人/平方公里)
b.Predictors:
(Constant),城市人口密度(人/平方公里),城市居民人均可支配收入(元)
c.DependentVariable:
商品房平均售价(元/平方米)
该表显示模型的拟合情况。
从表中可以看出,模型的复相关系数(R)为1.000,判定系数(RSquare)为1.000,调整判定系数(AdjustedRSquare)为1.000,估计值的标准误差(Std.ErroroftheEstimate)为28.351,Durbin-Watson检验统计量为2.845,当DW≈2时说明残差独立。
3.方差分析表
ANOVAc
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
38305583.506
1
38305583.506
30938.620
.000a
Residual
11143.039
9
1238.115
Total
38316726.545
10
2
Regression
38310296.528
2
19155148.264
23832.156
.000b
Residual
6430.018
8
803.752
Total
38316726.545
10
a.Predictors:
(Constant),城市人口密度(人/平方公里)
b.Predictors:
(Constant),城市人口密度(人/平方公里),城市居民人均可支配收入(元)
c.DependentVariable:
商品房平均售价(元/平方米)
该表显示各模型的方差分析结果。
从表中可以看出,模型的F统计量的观察值为23832.156,概率p值为0.000,在显著性水平为0.05的情形下,可以认为:
商品房平均售价(元/平方米)与城市人口密度(人/平方公里),和城市居民人均可支配收入(元)之间有线性关系。
4.回归系数
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
T
Sig.
CollinearityStatistics
B
Std.Error
Beta
Tolerance
VIF
1
(Constant)
1652.246
24.137
68.454
.000
城市人口密度(人/平方公里)
1.072
.006
1.000
175.894
.000
1.000
1.000
2
(Constant)
1555.506
44.432
35.009
.000
城市人口密度(人/平方公里)
1.020
.022
.951
46.302
.000
.050
20.126
城市居民人均可支配收入(元)
.017
.007
.050
2.422
.042
.050
20.126
a.DependentVariable:
商品房平均售价(元/平方米)
该表为多元线性回归的系数列表。
表中显示了模型的偏回归系数(B)、标准误差(Std.Error)、常数(Constant)、标准化偏回归系数(Beta)、回归系数检验的t统计量观测值和相应的概率p值(Sig.)、共线性统计量显示了变量的容差(Tolerance)和方差膨胀因子(VIF)。
令x1表示城市人口密度(人/平方公里),x2表示城市居民人均可支配收入(元),根据模型建立的多元多元线性回归方程为:
y=1555.506+1.020x1+0.017x2
方程中的常数项为1555.506,偏回归系数b1为1.020,b2为0.017,经T检验,b1和b2的概率p值分别为0.000和0.042,按照给定的显著性水平0.10的情形下,均有显著性意义。
根据容差发现,自变量间共线性问题严重;VIF值为20.126,也可以说明共线性较明显。
这可能是由于样本容量太小造成的。
5.模型外的变量
ExcludedVariablesc
Model
BetaIn
t
Sig.
PartialCorrelation
CollinearityStatistics
Tolerance
VIF
MinimumTolerance
1
城市居民人均可支配收入(元)
.050a
2.422
.042
.650
.050
20.126
.050
五年以上平均年贷款利率(%)
-.001a
-.241
.815
-.085
.999
1.001
.999
房屋空置率(%)
.004a
.596
.568
.206
.928
1.078
.928
2
五年以上平均年贷款利率(%)
.002b
.391
.708
.146
.913
1.096
.045
房屋空置率(%)
.002b
.452
.665
.168
.914
1.094
.049
a.PredictorsintheModel:
(Constant),城市人口密度(人/平方公里)
b.PredictorsintheModel:
(Constant),城市人口密度(人/平方公里),城市居民人均可支配收入(元)
c.DependentVariable:
商品房平均售价(元/平方米)
该表显示的是回归方程外的各模型变量的有关统计量,可见模型方程外的各变量偏回归系数经重检验,概率p值均大于0.10,故不能引入方程。
6.共线性诊断
CollinearityDiagnosticsa
Model
Dimension
Eigenvalue
ConditionIndex
VarianceProportions
(Constant)
城市人口密度(人/平方公里)
城市居民人均可支配收入(元)
1
1
1.898
1.000
.05
.05
2
.102
4.319
.95
.95
2
1
2.891
1.000
.00
.00
.00
2
.106
5.213
.21
.03
.00
3
.003
30.736
.78
.97
1.00
a.DependentVariable:
商品房平均售价(元/平方米)
该表是多重共线性检验的特征值以及条件指数。
对于第二个模型,最大特征值为2.891,其余依次快速减小。
第三列的各个条件指数,可以看出有多重共线性。
7.残差统计量
ResidualsStatisticsa
Minimum
Maximum
Mean
Std.Deviation
N
PredictedValue
3394.71
8382.83
5465.64
1957.302
11
Residual
-47.035
40.271
.000
25.357
11
Std.PredictedValue
-1.058
1.490
.000
1.000
11
Std.Residual
-1.659
1.420
.000
.894
11
a.DependentVariable:
商品房平均售价(元/平方米)
该表为回归模型的残差统计量,标准化残差(Std.Residual)的绝对值最大为1.659,没有超过默认值3,不能发现奇异值。
8.回归标准化残差的直方图
该图为回归标准化残差的直方图,正态曲线也被显示在直方图上,用以判断标准化残差是否呈正态分