回归分析应用实例讲解.docx

上传人:b****5 文档编号:8328862 上传时间:2023-01-30 格式:DOCX 页数:18 大小:40.44KB
下载 相关 举报
回归分析应用实例讲解.docx_第1页
第1页 / 共18页
回归分析应用实例讲解.docx_第2页
第2页 / 共18页
回归分析应用实例讲解.docx_第3页
第3页 / 共18页
回归分析应用实例讲解.docx_第4页
第4页 / 共18页
回归分析应用实例讲解.docx_第5页
第5页 / 共18页
点击查看更多>>
下载资源
资源描述

回归分析应用实例讲解.docx

《回归分析应用实例讲解.docx》由会员分享,可在线阅读,更多相关《回归分析应用实例讲解.docx(18页珍藏版)》请在冰豆网上搜索。

回归分析应用实例讲解.docx

回归分析应用实例讲解

影响成品钢材量的多元回归分析故当原油产量为16225.86万吨,生铁产量为12044.54万吨,原煤产量为13.87万吨以及发电量为12334.89亿千瓦时时,成品钢材量预测值为10727.33875万吨;当原油产量为17453万吨,生铁产量为12445.96万吨,原煤产量为14.54万吨以及发电量为13457亿千瓦时时,成品钢材量预测值为10727.33875万吨。

钢材的需求量设为y,作为被解释变量,而原油产量、生铁产量x1、原煤产量、发电量作为解释变量,通过建立这些经济变量的xxx432线性模型来研究影响成品钢材需求量的原因。

能源转换技术等因素。

在此,收集的数据选择与其相关的四个因素:

原油产量、生铁产量、原煤产量、发电量,1980—1997的有关数据如下表。

理论上成品钢材的需求量的影响因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、

原始数据(中国统计年鉴)

aa

年份a

yaaa

1xaaa

2xaaa

3xaaa

4xaaaa

1980aa

2716.20a

10595.00a

3802.40a

6.20a

3006.20aaaa

1981aa

2670.10a

10122.00a

3416.60a

6.20a

3092.70aaaa

1982aa

2902.00a

10212.00a

3551.00a

6.66a

3277.00aaaa

1983aa

3072.00a

10607.00a

3738.00a

7.15a

3514.00aaaa

1984aa

3372.00a

11461.30a

4001.00a

7.89a

3770.00aaaa

1985aa

3693.00a

12489.50a

4384.00a

8.72a

4107.00aaaa

1986aa

4058.00a

13068.80a

5064.00a

8.94a

4495.00aaaa

1987aa

4356.00a

13414.00a

5503.00a

9.28a

4973.00aaaa

1988aa

4689.00a

13704.60a

5704.00a

9.80a

5452.00aaaa

1989aa

4859.00a

13764.10a

5820.00a

10.54a

5848.00aaaa

1990aa

5153.00a

13830.60a

6238.00a

10.80a

6212.00aaaa

1991aa

5638.00a

14009.20a

6765.00a

10.87a

6775.00

aaaa

1992aa

6697.00a

14209.70a

7589.00a

11.16a

7539.00aaaa

1993aa

7716.00a

14523.00a

8739.00a

11.51a

8395.00aaaa

1994aa

8482.00a

14608.20a

9741.00a

12.40a

9281.00aaaa

1995aa

8979.80a

15004.94a

10529.27a

13.61a

10070.30aaaa

1996aa

9338.02a

15733.39a

10722.50a

13.97a

10813.10aaaa

1997aa

9978.93a

16074.14a

11511.41a

13.73a

11355.53

将中国成品

一、模型的设定

设因变量y与自变量、、、的一般线性回归模型为:

xxxx4321y=+?

?

?

?

?

?

?

x?

xxx?

?

421330241是随机变量,通常满足;Var()=2?

?

?

?

0?

()?

二参数估计

aaa

系数aaa

模型aa

非标准化系数aa

标准系数a

ta

Sig.

a

Baaaa

误差标准aa

试用版

aaaaaaaaaaaa

发电量(亿千瓦时)原煤(万吨)生铁(万吨)原油(万吨

)1常量()aaaaa

.389-17.818.554-.041170.287aaaaa

.199115.468.170.090494.572aaaaa

.438-.018.608-.031aaaaa

1.952-.1543.267-.457.344aaaaa

.073.880.006.655.736aaaaa

a.成品钢材(万吨):

因变量

再用spss做回归线性,根据系数表得出回归方程为:

1x0?

180..?

45x1?

.0?

201y?

7.87x04.5x783894123再做回归预测,得出如下截图:

故当原油产量为16225.86万吨,生铁产量为12044.54万吨,原煤产量为13.87万吨以及发电量为12334.89亿千瓦时时,成品钢材量预测值为10727.33875万吨;当原油产量为17453万吨,生铁产量为12445.96万吨,原煤产量为14.54万吨以及发电量为13457亿千瓦时时,成品钢材量预测值为10727.33875万吨。

三回归方程检验

描述性统计量

均值标准偏差N

成品钢材(万吨)182460.349265465.0028

)原油(万吨181875.7887313190.6372

生铁(万吨)18

2700.79676

6489.9544

原煤(万吨)9.96832.5401818

发电量(亿千瓦时)18

2768.11191

6220.8794

aa

相关性aa

a

成品钢材(万吨)aaa

)原油(万吨aa

生铁(万吨)aa

原煤(万吨)aaa

时)发电量(亿千瓦aaaaaaaaaaaaa

发电量(亿千瓦时)原煤(万吨)生铁(万吨)原油(万吨)相关性Pearson成品钢材(万吨)aaaaa

.997.961.998.9091.000aaaaa

.920.973.9121.000.909aaaaa

.997.9621.000.912.998aaaaa

.9711.000.962.973.961aaaaa

1.000.971.997.920.997aaaaaaaaaaaaa

发电量(亿千瓦时)原煤(万吨)生铁(万吨))原油(万吨成品钢材(万吨)(单侧)Sig.aaaaa

.000.000.000.000.aaaaa

.000.000.000..000aaaaa

.000.000..000.000aaaaa

.000..000.000.000aaaa

.000.000.000.000aaaaaaaaaaa

发电量(亿千瓦时)原煤(万吨)生铁(万吨))原油(万吨N成品钢材(万吨)aaaaa

1818181818aaaaa

1818181818aaaaa

1818181818aaaaa

1818181818aaaaa

1818181818.

由相关系数表看出,因变量与各个自变量的相关系数都很高,都在0.9以上,说明变量间的线性相关程度很高,适合做多元线性回归模型。

aaa

模型汇总baa

模型a

Raaa

方Raaaaa

方R调整aaaa

估计的误差标准a

1aa

.999aaa

.997a

.997a

140.71641aaaaaaaaaaaaaaaaaaa

成品钢材(万吨):

因变量

b.。

生铁(万吨),原煤(万吨)),原油(万吨,发电量(亿千瓦时)),常量:

(预测变量a.

22RR知,模型对样本观测数据的拟合度很好。

=0.997以及调整之后的=0.997由.

bAnova模型平方和均方Fdf

Sig.

a回归41296.001

1

1.026E8.0002.566E7

残差19801.108

13257414.404

总计17

1.029E8

a.预测变量:

(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)。

b.因变量:

成品钢材(万吨)

?

=0.05,故拒绝原假设,认为自变量联合起来值=0.000

aaa

系数aaa

模型aa

非标准化系数aa

标准系数a

ta

Sig.

a

Baaaa

标准误差aa

试用版

aaaaaaaaaaaa

发电量(亿千瓦时)原煤(万吨)生铁(万吨)原油(万吨)1常量()aaaaa

.389-17.818.554-.041170.287aaaaa

.199115.468.170.090494.572aaaaa

.438-.018.608-.031aaaaa

1.952-.1543.267-.457.344aaaaa

.073.880.006.655.736aaaaa

:

因变量成品钢材(万吨)a.

对因变量?

,故接受原假设,认为=0.05=-0.154P因为值=0.880远远大于xt33y没有显著影响,故应剔除。

用后退法剔除变量后,再做回归线性,x3得如下表:

aaa

系数aaa

模型aa

非标准化系数aa

标准系数a

ta

Sig.

a

Baaaa

误差标准aa

试用版

aaaaaaaa

生铁(万吨)原油(万吨)1(常量)aaa

.554-.041170.287aaa

.170.090494.572aaa

.608-.031aaa

3.267-.457.344aaa

.006.655.736

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

257414.404

1319801.108残差

1296.001141.026E8.0002.566E7回归

adfSig.F均方平方和模型Anovad发电量(亿千瓦时)原煤(万吨)aa

.389-17.818aa

.199115.468aa

.438-.018aa

1.952-.154aa

.073.880aaaaaaaaaa

发电量(亿千瓦时)生铁(万吨)原油(万吨)2(常量)aaaa

.371.564-.053197.734aaaa

.153.150.045445.099aaaa

.417.620-.041aaaa

2.4173.760-1.172.444aaaa

.030.002.261.664aaaaaaaa

发电量(亿千瓦时)生铁(万吨)3(常量)aaa

.311.591-309.403aaa

.147.150105.079aaa

.350.649aaa

2.1253.937-2.944aaa

.051.001.010aaaaa

:

a.因变量成品钢材(万吨)

总计171.029E8

b回归3.422E72

.00031857.513

1.026E8

残差18420.420

14257885.884

总计171.029E8

c回归5.131E7.0003

2718.023

1.026E82

残差18878.288

15283174.324

总计17

1.029E8

a.预测变量:

(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)。

b.预测变量:

(常量),发电量(亿千瓦时),原油(万吨),生铁(万吨)。

c.预测变量:

(常量),发电量(亿千瓦时),生铁(万吨)。

d.因变量:

成品钢材(万吨)

、两个自变量,得出新的回归方程为:

xx最后剔除31x0.311x?

0.591?

?

y?

309.40342F=2718.023P值=0.000故拒绝原假设,通过F检验。

基本假定检验四

1、异方差检验

等级相关系数检验

做abs(e)与x的等级相关系数,得出表如下

aa

相关系数aaa

aa

)原油(万吨aa

生铁(万吨)aa

原煤(万吨)aaa

时)发电量(亿千瓦a

abseaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

N(双侧)Sig.abse相关系数N(双侧)Sig.相关系数发电量(亿千瓦时)N(双侧)Sig.相关系数原煤(万吨)N(双侧)Sig.相关系数生铁(万吨)NSig.(双侧)rho的Spearman

相关系数)原油(万吨aaa

18.1.000aaaa

18.000.998**aaaaa

18.000.994**aaaaa

18.000.994**aaaa

18.291.263

aaaa

18.000.998**aaaa

18.1.000aaaa

18.000.989**aaaaa

18.000.988**aaaa

18.236.294

aaaa

18.000.994**aaaaa

18.000.989**aaaa

18.1.000aaaa

18.000.997**aaaa

18.365.227

aaaa

18.000.994**aaaaa

18.000.988**aaaaa

18.000.997**aaaa

18.1.000aaa

18.399.212

aaa

18.291.263aaa

18.236.294aaa

18.365.227aaa

18.399.212aaa

18.1.000aaaaaa

时,相关性是显著的。

0.01在置信度(双测)为**.

由表中P值全大于0.01,故接受原假设,模型中不存在异方差。

2、自相关检验

b模型汇总模型R方调整R方标准估计的误差Durbin-Watson

R

a.922

140.71641

.997

.997

.9991

a.预测变量:

(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)。

b.因变量:

成品钢材(万吨)

DW=0.992n=18k=5,查表得出,故DW落入无法确定1.87d?

d?

0.82,ul的领域。

自相关性不明显,由此也看出DW检验的局限性。

3、多重共线性

aaa

系数aaa

模型aa

非标准化系数aa

标准系数a

ta

Sig.aa

共线性统计量

a

Baaaa

误差标准aa

试用版

aa

容差a

VIFaaaaaaaaaaaa

发电量(亿千瓦时)原煤(万吨)生铁(万吨)原油(万吨

)1(常量)aaaaa

.389-17.818.554-.041170.287aaaaa

.199115.468.170.090494.572aaaaa

.438-.018.608-.031aaaaa

1.952-.1543.267-.457.344aaaaa

.073.880.006.655.736aaaaa

.004.014.006.041aaaaa

261.48073.861180.10524.672aaaaa

:

成品钢材(万吨)因变量a.

aaa

共线性诊断aaaaa

维数模型aa

特征值aa

条件索引aa

方差比例

aaa

)常量(aa

)原油(万吨aa

生铁(万吨)aa

原煤(万吨)aaa

时)发电量(亿千瓦aaaaaa

543211aaaaa

.000.001.004.1184.878aaaaa

137.10088.71837.1066.4351.000aaaaa

.05.57.36.02.00aaaaa

.51.46.03.00.00aaaaa

.68.28.03.00.00aaaaa

.70.21.09.00.00aaaaa

.84.16.00.00.00aaaaa

成品钢材(万吨):

因变量a.

因为VIF中有两个远远的大于10,故模型存在严重的多重共线性。

由共线性诊断表中数据得出,、、之间存在多重共线性。

xxx423故先剔除变量,再做线性回归,得出表如下:

x4.

aaa

系数aaa

模型aa

非标准化系数aa

标准系数a

ta

Sig.aa

共线性统计量

a

Baaaa

误差标准aa

试用版

aa

容差a

VIFaaaaaaaaaa

原煤(万吨)生铁(万吨)原油(万吨

)1常量()aaaa

118.233.871-.10859.520aaaa

100.887.054.092538.378aaaa

.122.956-.082aaaa

1.17216.144-1.178.111aaaa

.261.000.258.914aaaa

.021.066.047aaaa

46.95615.17621.142aaaaa

a.成品钢材(万吨):

因变量

aaa

共线性诊断aaaaa

维数模型aa

特征值aa

条件索引aa

方差比例

aaa

)常量(aa

)原油(万吨aa

生铁(万吨)aa

原煤(万吨)aaaaa

43211aaaa

.001.003.0793.917aaaa

87.74333.6867.0421.000aaaa

.64.33.02.00aaaa

.96.04.00.00aaaa

.28.66.06.00aaaa

.87.13.00.00aaaaa

成品钢材(万吨):

因变量a.

由于模型中仍然存在多重共线性,故继续剔除VIF最大的变量,再做线性回x3归,得出表如下

aaa

系数aaa

模型aa

非标准化系数aa

标准系数a

ta

Sig.aa

共线性统计量

a

Baaaa

误差标准aa

试用版

aa

容差a

VIFaaaaaaaa

生铁(万吨)原油(万吨)1常量()aaa

.920-.017-282.131aaa

.034.049458.218aaa

1.010-.013aaa

26.871-.345-.616aaa

.000.735.547aaa

.168.168aaa

5.9675.967aaaaa

成品钢材(万吨)因变量:

a.

a共线性诊断方差比例条件索引特征值维数模型

(常量)

原油(万吨)

生铁(万吨)

.00.00.001

12.9221.000

.19.03.076.006.2042

.81

1.00

.002

3

.97

38.315

a.因变量:

成品钢材(万吨)

aaa

系数aaa

模型aa

非标准化系数aa

标准系数a

ta

Sig.aa

共线性统计量

a

Baaaa

标准误差aa

试用版

aa

容差a

VIFaaaaaaaa

生铁(万吨)原油(万吨)1常量()aaa

.920-.017-282.131aaa

.034.049458.218aaa

1.010-.013aaa

26.871-.345-.616aaa

.000.735.547aaa

.168.168aaa

5.9675.967aaaaa

因变量a.成品钢材(万吨):

由于剔除变量后,VIF值都小于10,故多重共线性得以消除,得出x3新的回归方程:

x?

0.92?

0.017x282.131y?

?

214、异常值和强影响值

aaa

残差统计量aa

aa

极小值aa

极大值aa

均值aaaa

偏差标准a

Naaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

距离。

Mahal已删除的残差化Student已删除的残差残差Student化残差标准残差调整的预测值预测值的标准误差预测值标准预测值aaaaaaaaaa

1.487-1.867-316.76953-1.710-1.300-182.887652770.477553.220-1.1102738.5310aaaaaaaaaa

10.9532.128292.427921.8871.714241.1956910140.2559117.7171.87010059.5371aaaaaaaaaa

3.778-.045-20.88723-.057.000.000005485.890072.288.0005465.0028aaaaaaaaaa

2.4171.070173.806821.022.874123.052932473.4477417.0571.0002457.27013aaaaaaaaaa

18181818181818181818

aaaaa

居中杠杆值的距

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工作范文 > 行政公文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1