多元线性回归案例.docx
《多元线性回归案例.docx》由会员分享,可在线阅读,更多相关《多元线性回归案例.docx(15页珍藏版)》请在冰豆网上搜索。
![多元线性回归案例.docx](https://file1.bdocx.com/fileroot1/2023-2/21/009b6a91-43d9-45c0-8c47-113b7923dcfb/009b6a91-43d9-45c0-8c47-113b7923dcfb1.gif)
多元线性回归案例
年份
商品房平均售价(元平方米)
城市人口密度人平方公里)
城市居民人均可支配收入元
五年以上平均贷款利率
房屋空置率
1998
3401
1654
8773
8.64
9.37
1999
3422
1672
10932
6.69
15.68
2000
3565
1757
11718
6.21
23.83
2001
3866
2050
12883
6.21
44.24
2002
4134
2279
13250
5.76
57.71
2003
5118
3250
14867
5.76
64.38
2004
5886
3913
16683
5.82
55.28
2005
6842
4912
18645
6.12
40.45
2006
7196
5172
20668
6.45
34.82
2007
8361
6231
23623
7.48
39.31
2008
8362
6240
26675
6.89
36.92
REGRESSION
/MISSINGLISTWISE
/STATISTICSCOEFFOUTSRANOVACOLLINTOL
/CRITERIA=PIN(.05)POUT(.10)
/NOORIGIN
/DEPENDENT商品房平均售价(元平方米)
/METHOD=STEPWISE城市人口密度人平方公里)城市居民人均可支配收入元五年以上平均贷款利率房屋空置率
/SCATTERPLOT=(*ZPRED,商品房平均售价(元平方米))
/RESIDUALSDURBINHISTOGRAM(ZRESID)NORMPROB(ZRESID)
/CASEWISEPLOT(ZRESID)OUTLIERS(3)
/SAVEPREDRESID.
迴歸
附註
已建立輸出
21-MAR-201920:
52:
04
備註
輸入
作用中資料集
数据集1
過濾器
<無>
粗細
<無>
分割檔案
<無>
工作資料檔案中的N列
11
遺漏值處理
遺漏的定義
使用者定義的遺漏值會被視為遺漏。
已使用觀察值
統計資料基於所使用任何變數之沒有遺漏值的觀察值。
語法
REGRESSION
/MISSINGLISTWISE
/STATISTICSCOEFFOUTSRANOVACOLLINTOL
/CRITERIA=PIN(.05)POUT(.10)
/NOORIGIN
/DEPENDENT商品房平均售价(元平方米)
/METHOD=STEPWISE城市人口密度人平方公里)城市居民人均可支配收入元五年以上平均贷款利率房屋空置率
/SCATTERPLOT=(*ZPRED,商品房平均售价(元平方米))
/RESIDUALSDURBINHISTOGRAM(ZRESID)NORMPROB(ZRESID)
/CASEWISEPLOT(ZRESID)OUTLIERS(3)
/SAVEPREDRESID.
資源
處理器時間
00:
00:
01.28
經歷時間
00:
00:
01.53
需要記憶體
4624位元組數
殘差圖需要額外的記憶體
632位元組數
已建立或修改變數
PRE_1
UnstandardizedPredictedValue
RES_1
UnstandardizedResidual
變數已輸入/已移除a
模型
變數已輸入
變數已移除
方法
1
城市人口密度人平方公里)
.
逐步(準則:
F-to-enter的機率<=.050,F-to-remove的機率>=.100)。
2
城市居民人均可支配收入元
.
逐步(準則:
F-to-enter的機率<=.050,F-to-remove的機率>=.100)。
a.應變數:
商品房平均售价(元平方米)
该表显示模型最先引入变量城市人口密度(人/平方公里),第二个引入模型的是变量城市居民人均可支配收入(元),没有变量被剔除。
模型摘要c
模型
R
R平方
調整後R平方
標準偏斜度錯誤
Durbin-Watson
1
1.000a
1.000
1.000
35.187
2
1.000b
1.000
1.000
28.351
2.845
a.預測值:
(常數),城市人口密度人平方公里)
b.預測值:
(常數),城市人口密度人平方公里),城市居民人均可支配收入元
c.應變數:
商品房平均售价(元平方米)
该表显示模型的拟合情况。
从表中可以看出,模型的复相关系数(R)为1.000,判定系数(RSquare)为1.000,调整判定系数为1.000,估计值的标准误差为28.351,检验统计量为2.845,当DW≈2时说明残差独立。
變異數分析a
模型
平方和
df
平均值平方
F
顯著性
1
迴歸
38305583.506
1
38305583.506
30938.620
.000b
殘差
11143.039
9
1238.115
總計
38316726.545
10
2
迴歸
38310296.528
2
19155148.264
23832.156
.000c
殘差
6430.018
8
803.752
總計
38316726.545
10
a.應變數:
商品房平均售价(元平方米)
b.預測值:
(常數),城市人口密度人平方公里)
c.預測值:
(常數),城市人口密度人平方公里),城市居民人均可支配收入元
该表显示各模型的方差分析结果。
从表中可以看出,模型的F统计量的观察值为23832.156,概率p值为0.000,在显著性水平为0.05的情形下,可以认为:
商品房平均售价(元/平方米)与城市人口密度(人/平方公里),和城市居民人均可支配收入(元)之间有线性关系。
係數a
模型
非標準化係數
標準化係數
T
顯著性
B
標準錯誤
Beta
1
(常數)
1652.246
24.137
68.454
.000
城市人口密度人平方公里)
1.072
.006
1.000
175.894
.000
2
(常數)
1555.506
44.432
35.009
.000
城市人口密度人平方公里)
1.020
.022
.951
46.302
.000
城市居民人均可支配收入元
.017
.007
.050
2.422
.042
係數a
模型
共線性統計資料
允差
VIF
1
(常數)
城市人口密度人平方公里)
1.000
1.000
2
(常數)
城市人口密度人平方公里)
.050
20.126
城市居民人均可支配收入元
.050
20.126
a.應變數\:
商品房平均售价(元平方米)
该表为多元线性回归的系数列表。
表中显示了模型的偏回归系数(B)、标准误差(Std.Error)、常数(Constant)、标准化偏回归系数(Beta)、回归系数检验的t统计量观测值和相应的概率p值(Sig.)、共线性统计量显示了变量的容差(Tolerance)和方差膨胀因子(VIF)。
令x1表示城市人口密度(人/平方公里),x2表示城市居民人均可支配收入(元),根据模型建立的多元多元线性回归方程为:
y=1555.506+1.020x1+0.017x2
方程中的常数项为1555.506,偏回归系数b1为1.020,b2为0.017,经T检验,b1和b2的概率p值分别为0.000和0.042,按照给定的显著性水平0.10的情形下,均有显著性意义。
根据容差发现,自变量间共线性问题严重;VIF值为20.126,也可以说明共线性较明显。
这可能是由于样本容量太小造成的。
排除的變數a
模型
Beta入
T
顯著性
偏相關
共線性統計資料
允差
1
城市居民人均可支配收入元
.050b
2.422
.042
.650
.050
五年以上平均贷款利率
-.001b
-.241
.815
-.085
.999
房屋空置率
.004b
.596
.568
.206
.928
2
五年以上平均贷款利率
.002c
.391
.708
.146
.913
房屋空置率
.002c
.452
.665
.168
.914
排除的變數a
模型
共線性統計資料
VIF
允差下限
1
城市居民人均可支配收入元
20.126
.050
五年以上平均贷款利率
1.001
.999
房屋空置率
1.078
.928
2
五年以上平均贷款利率
1.096
.045
房屋空置率
1.094
.049
a.應變數:
商品房平均售价(元平方米)
b.模型中的預測值:
(常數),城市人口密度人平方公里)
c.模型中的預測值:
(常數),城市人口密度人平方公里),城市居民人均可支配收入元
该表显示的是回归方程外的各模型变量的有关统计量,可见模型方程外的各变量偏回归系数经重检验,概率p值均大于0.10,故不能引入方程。
共線性診斷a
模型
維度
特徵值
條件指數
變異數比例
(常數)
城市人口密度人平方公里)
城市居民人均可支配收入元
1
1
1.898
1.000
.05
.05
2
.102
4.319
.95
.95
2
1
2.891
1.000
.00
.00
.00
2
.106
5.213
.21
.03
.00
3
.003
30.736
.78
.97
1.00
a.應變數:
商品房平均售价(元平方米)
该表是多重共线性检验的特征值以及条件指数。
对于第二个模型,最大特征值为2.891,其余依次快速减小。
第三列的各个条件指数,可以看出有多重共线性。
殘差統計資料a
最小值
最大值
平均數
標準偏差
N
預測值
3394.71
8382.83
5465.64
1957.302
11
殘差
-47.035
40.271
.000
25.357
11
標準預測值
-1.058
1.490
.000
1.000
11
標準殘差
-1.659
1.420
.000
.894
11
a.應變數:
商品房平均售价(元平方米)
该表为回归模型的残差统计量,标准化残差(Std.Residual)的绝对值最大为1.659,没有超过默认值3,不能发现奇异值。
圖表