实用回归分析.docx

上传人:b****7 文档编号:10002436 上传时间:2023-02-07 格式:DOCX 页数:15 大小:74.90KB
下载 相关 举报
实用回归分析.docx_第1页
第1页 / 共15页
实用回归分析.docx_第2页
第2页 / 共15页
实用回归分析.docx_第3页
第3页 / 共15页
实用回归分析.docx_第4页
第4页 / 共15页
实用回归分析.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

实用回归分析.docx

《实用回归分析.docx》由会员分享,可在线阅读,更多相关《实用回归分析.docx(15页珍藏版)》请在冰豆网上搜索。

实用回归分析.docx

实用回归分析

实用回归分析作业

 

统计一班

马方方

200840530123

 

一、经济背景

汽车产业是国民经济的支柱产业,在国民经济中占重要地位。

(1)促进国民经的持续快速发展

汽车产业是资本、技术密集型,又是劳动密集型产业。

具有巨大的前后相关联度和很强的波及效果,对国民经济具有很强的带动作用。

因此党中央、国务院对发展汽车产业非常重视,多次提出要把汽车产业建成国民经济的支柱产业,并为此采取了一系列的政策措施。

在这一思想的指导下,我国汽车产业取得了快速发展,在国民经济中的地位和作用越来越重要。

近些年来,我国经济的快速增长,汽车产业做出了很大的贡献。

到2020年要实现国民经济翻两番的奋斗目标,离开了汽车产业的快速发展也是难以实现的。

(2)有利于全面建设小康社会

发展汽车产业对全面建设小康社会有很大的推动作用。

一是有利于增加就业。

汽车产业的规模生产方式和对上下游产业的巨大带动作用为社会提供了大量的就业机会。

二是有利于满足人民的消费需求。

随着我国国民经济的快速发展和人民生活水平的提高,人民的消费需求已逐步由吃、穿、用为向住和行为主转变,因此,发展汽车产业有利于满足人民不断增长的消费需求,有利于推动居民消费结构的升级。

三是有利于改变人民的生活方式,提高生活质量。

随着我国汽车产业的发展和汽

车普及率的提高,将极大地提高人们的出行效率,拓展活动时间,提高出行的舒适性。

(3)推动技术进步和产业结构升级

汽车作为一个产品,是高新技术的结晶。

作为一个产业,是新技术应用范围最广、数量最多、周期最长、规模最大的产业。

它不仅本身的生产制造有很高的技术要求,而且对相关产业如原材料产业、装备制造业、配套产业等也有很高的技术要求。

因此,汽车产业的发展不仅要求本身广泛发展和使用新技术,也要求相关产业广泛发展使用新技术。

因此汽车产业对推动技术进步和产业结构升级具有重要作用。

(4)推动城市化进程

城市化是我国经济社会发展的必然历史过程。

汽车产业的发展有助于加快我国城市化进程。

一是汽车的发展和普及,改变了城市交通的面貌,推动了城市交通的现代化,促进了城市经济繁荣;二是汽车的发展和普及,推动了城市结构的改变,促进了围绕大城市而建立的卫星城市群落发展;三是汽车的普及和发展,加强了城市之间在物质、文化、信息、人员等方面的交流和联系,有利于推动城乡经济一体化发展,缩小城乡差距。

我国正处于全面建设小康社会的重要战略机遇期,大力发展汽车产业,全面推进国民经济各部门持续健康发展,是当前我们面临的重大任务。

因此,通过建立经济模型,研究汽车产量和相关因素的关系,是一件有意义的事。

二、模型的建立

为了研究我国汽车产量的变化趋势与其成因,以汽车总产量为因变量y,以钢铁产量、运输公路长度、制造业职工人数、私人汽车拥有量、石油消费总量为影响汽车总产量的的主要因素。

y表示汽车总产量(万辆),x

表示钢铁产量(万吨),x

表示运输公路长度(万公里),x

表示制造业职工人数(万人),x

表示私人汽车拥有量(万辆),x

表示石油消费总量(万吨)。

据《中国统计年鉴》获得1994—2008共15个年份的统计数据,数据如下:

年份

y

x

x

x

x

X

1994

136.69

9261

111.78

5434

205.42

21356.24

1995

145.27

9535.99

115.7

5439

249.96

22955.8

1996

147.52

10124.06

118.58

5293

289.67

25010.64

1997

158.25

10894.17

122.64

5083

358.36

28110.79

1998

163

11559

127.85

3769

423.65

28426.01

1999

183.2

12426

135.17

3496

533.88

30187.61

2000

207

12850

140.27

3240

625.33

32053.06

2001

234.17

15163.44

169.8

3010

770.78

32784.1

2002

325.1

18236.61

176.52

2907

968.98

35528.81

2003

444.39

22233.6

180.98

2898.9

1219.23

38107.38

2004

509.11

28291.09

187.07

2960

1481.66

45319.62

2005

570.49

35323.98

334.52

3096.5

1848.07

47183.22

2006

727.89

41914.85

345.7

3250.3

2333.32

50239.08

2007

888.89

48928.8

358.37

3358.4

2876.22

52319.85

2008

934.55

50091.53

373.02

3329.3

3501.39

53295

作相关分析

相关性

Y

X1

X2

X3

X4

X5

Y

Pearson相关性

1

.995**

.957**

-.529*

.992**

.961**

显著性(双侧)

.000

.000

.043

.000

.000

N

15

15

15

15

15

15

X1

Pearson相关性

.995**

1

.976**

-.521*

.989**

.965**

显著性(双侧)

.000

.000

.046

.000

.000

N

15

15

15

15

15

15

X2

Pearson相关性

.957**

.976**

1

-.511

.959**

.937**

显著性(双侧)

.000

.000

.052

.000

.000

N

15

15

15

15

15

15

X3

Pearson相关性

-.529*

-.521*

-.511

1

-.536*

-.695**

显著性(双侧)

.043

.046

.052

.039

.004

N

15

15

15

15

15

15

X4

Pearson相关性

.992**

.989**

.959**

-.536*

1

.953**

显著性(双侧)

.000

.000

.000

.039

.000

N

15

15

15

15

15

15

X5

Pearson相关性

.961**

.965**

.937**

-.695**

.953**

1

显著性(双侧)

.000

.000

.000

.004

.000

N

15

15

15

15

15

15

**.在.01水平(双侧)上显著相关。

*.在0.05水平(双侧)上显著相关。

从相关矩阵看出,y与x1,x2,x4,x5的相关系数都在0.9以上,说明所选自变量与y高度线性相关的,用y与自变量做多元线性回归是适合的。

y与x3的相关系数为-0.529,p值=0.043,在显著性水平

=0.05下y与x3是线性相关的。

一般认为制造业职工人数和汽车产量应呈正相关,制造业职工人数多了,汽车产量就会增加。

汽车产业属于装备制造业,中国装备制造业无论从管理机制、技术创新能力,还是从企业规模、竞争实力等方面,都存在较大差距。

作回归分析

模型汇总b

模型

R

R方

调整R方

标准估计的误差

1

.999a

.997

.996

18.80279

a.预测变量:

(常量),X5,X3,X2,X4,X1。

b.因变量:

Y

ANOVAb

Model

SumofSquares

df

MeanSquare

F

Sig.

1

Regression

1098608.550

5

219721.710

621.482

.000a

Residual

3181.904

9

353.545

Total

1101790.454

14

a.Predictors:

(Constant),X5,X3,X2,X4,X1

b.DependentVariable:

Y

 

Coefficientsa

Model

UnstandardizedCoefficients

StandardizedCoefficients

t

Sig.

B

Std.Error

Beta

1

(Constant)

154.097

130.410

1.182

.268

X1

.022

.005

1.182

4.554

.001

X2

-.832

.250

-.293

-3.328

.009

X3

-.013

.013

-.045

-.981

.352

X4

.057

.038

.210

1.513

.165

X5

-.003

.004

-.136

-.922

.381

a.DependentVariable:

Y

回归诊断:

回归方程为

=154.097+0.022x1-0.832x2-0.013x3+0.057x4-0.003x5.

复相关系数R=0.999,决定系数R

=0.997,由决定系数看回归方程高度显著。

方差分析表,F=621.482,p值=0.000,表明回归方程高度显著,说明x1,x2,x3,x4,x5整体上对y有高度显著的线性影响。

回归系数的显著性检验。

在显著性水平

=0.05下,自变量x1、x2对y均有显著影响,但x3、x4、x5对y无显著影响。

下面采用后退法剔除变量

先剔除p值最大的变量x5,作回归分析

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

37.530

31.474

1.192

.261

X1

.019

.003

.995

6.162

.000

X2

-.767

.238

-.270

-3.223

.009

X3

-.002

.006

-.008

-.357

.728

X4

.071

.034

.263

2.098

.062

a.因变量:

Y

自变量x3对应的p值=0.728最大,进一步剔除,再做回归分析

模型汇总b

模型

R

R方

调整R方

标准估计的误差

1

.998a

.997

.996

17.90525

a.预测变量:

(常量),X4,X2,X1。

b.因变量:

Y

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

1098263.877

3

366087.959

1141.891

.000a

残差

3526.577

11

320.598

总计

1101790.454

14

a.预测变量:

(常量),X4,X2,X1。

b.因变量:

Y

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

28.376

17.539

1.618

.134

X1

.019

.003

.990

6.414

.000

X2

-.763

.228

-.269

-3.345

.007

X4

.074

.032

.271

2.286

.043

a.因变量:

Y

复相关系数R=0.998,决定系数R

=0.997,回归方程高度显著。

方差分析表中F=1141.891,p值=0.000,回归方程高度显著。

在显著性水平

=0.05下,自变量x1,x2,x4均对y有显著影响。

回归方程y=28.376+0.019x1-0.763x2+0.074x4.

另外,x2的回归系数-0.763是负的,x2是运输公路长度,负的回归系数显然是不合理的,可能是由于自变量之间的共线性.

三、异常值的诊断

Y

X1

X2

X4

RES_1

SRE_1

SDR_1

COO_1

136.69

9261

111.78

205.42

4.27667

0.25715

0.24592

0.00263

145.27

9535.99

115.7

249.96

7.39989

0.4419

0.42512

0.00699

147.52

10124.06

118.58

289.67

-2.13661

-0.12728

-0.12145

0.00056

158.25

10894.17

122.64

358.36

-7.84839

-0.46532

-0.4481

0.00687

163

11559

127.85

423.65

-16.4314

-0.9704

-0.96758

0.02782

183.2

12426

135.17

533.88

-15.062

-0.89055

-0.88147

0.02394

207

12850

140.27

625.33

-2.07081

-0.12481

-0.11908

0.00064

234.17

15163.44

169.8

770.78

-6.58438

-0.40602

-0.39006

0.00903

325.1

18236.61

176.52

968.98

17.07748

1.00544

1.00598

0.02812

444.39

22233.6

180.98

1219.23

46.16463

2.74397

4.65776

0.24972

509.11

28291.09

187.07

1481.66

-17.7404

-1.5275

-1.64079

0.80311

570.49

35323.98

334.52

1848.07

-3.08261

-0.26928

-0.2576

0.02622

727.89

41914.85

345.7

2333.32

3.15923

0.21605

0.20644

0.00583

888.89

48928.8

358.37

2876.22

1.93908

0.14055

0.13413

0.00338

934.55

50091.53

373.02

3501.39

-9.06036

-1.27335

-1.31486

2.1615

从上表中看到,绝对值最大的学生化残差SRE

=2.74397,小于3,因而根据学生化残差诊断认为数据不存在异常值。

绝对值最大的删除学生化残差为SDR

=4.65776,因而根据删除学生化残差诊断认为第10个数据为异常值。

其Cook距离为0.24972<0.5,这样第10个数据为异常值的原因是由因变量引起的。

第11和15个数据的Cook距离分别为0.80311和2.1615,其删除化学生残差的绝对值分别为1.64079和1.31486,因而认为第10和15个数据为异常值均是由自变量引起的。

四、异方差的诊断

残差散点图如下:

从残差图看,15个点的分布是随机的,即误差项无明显的异方差性。

等级相关系数的检验

 

相关系数

Y

e

Sig.(双侧)

.

.990

N

15

15

e

相关系数

.004

1.000

Sig.(双侧)

.990

.

N

15

15

其中e为残差绝对

由上表得等级相关系数r

=0.004,p值=0.990,认为残差绝对值e与因变量y不显著相关,不存在异方差。

五、自相关性的诊断

由上面的残差散点图可以看出,残差项随因变量y无规律的变化,那么随机扰动项

不存在序列相关。

ModelSummaryb

Model

R

RSquare

AdjustedRSquare

Std.ErroroftheEstimate

Durbin-Watson

1

.998a

.997

.996

17.90525

1.776

a.Predictors:

(Constant),X4,X2,X1

b.DependentVariable:

Y

下面再利用自相关系数法对其检验

由上图可知,D.K=1.776,查D.K表,n=15,k=3,在显著性水平

=0.05下,d

=0.95,d

=1.54.由1.54

=2.46,可知残差序列无自相关性。

六、多重共线性的诊断

Coefficientsa

Model

UnstandardizedCoefficients

StandardizedCoefficients

t

Sig.

CollinearityStatistics

B

Std.Error

Beta

Tolerance

VIF

1

(Constant)

28.376

17.539

1.618

.134

X1

.019

.003

.990

6.414

.000

.012

81.926

X2

-.763

.228

-.269

-3.345

.007

.045

22.220

X4

.074

.032

.271

2.286

.043

.021

48.155

a.DependentVariable:

Y

从上表中看到,x1的方差扩大因子VIF

=81.926最大,且远大于10,说明此模型存在强的多重共线性,再根据自变量的经济意义及前面对回归系数的显著性检验,先将x4剔除,用y与剩余两个自变量建立回归方程,有关计算结果如下表:

Coefficientsa

Model

UnstandardizedCoefficients

StandardizedCoefficients

t

Sig.

CollinearityStatistics

B

Std.Error

Beta

Tolerance

VIF

1

(Constant)

6.401

17.060

.375

.714

X1

.025

.002

1.294

14.124

.000

.047

21.331

X2

-.868

.260

-.306

-3.337

.006

.047

21.331

a.DependentVariable:

Y

从上表中看到,x1和x2的方差扩大因子都为21.331,大于10,且x2的p值=0.006,因而剔除x2,剔除后,建立y与x1之间的回归方程,有关计算结果如下:

ModelSummary

Model

R

RSquare

AdjustedRSquare

Std.ErroroftheEstimate

1

.995a

.991

.990

27.77706

a.Predictors:

(Constant),X1

Coefficientsa

Model

UnstandardizedCoefficients

StandardizedCoefficients

t

Sig.

CollinearityStatistics

B

Std.Error

Beta

Tolerance

VIF

1

(Constant)

-39.661

13.376

-2.965

.011

X1

.019

.001

.995

37.616

.000

1.000

1.000

a.DependentVariable:

Y

得到y与x1的线性回归方程为:

y=-39.661+0.019x1,由复相关系数R=0.995,决定系数R

=0.991,知回归方程高度显著。

七、经济解释及存在问题

、经济解释:

从以上模型分析可得出:

制造业职工人数、石油消费总量对汽车产量没有显著影响。

说明汽车生产与上述两个因素没有必然联系。

钢铁产量、运输公路长度和私人汽车拥有量有显著影响,但运输公路长度和私人汽车拥有量可以由钢铁产量表示,即钢铁产量决定了运输公路长度和私人汽车拥有量。

这说明作为汽车产业的上游产业,钢铁制造业的健康发展对汽车生产具有重大意义。

为了保证汽车生产,我们必须全力发展现代化的中国钢铁产业。

、存在问题:

在未作数据分析回归之前,我们还考虑了许多可能影响的因素,如国民生产总值,城镇居民消费总额,原油总产量,公路运输业从业人数,自行车总产量,但回归分析后都遭到了淘汰,说明往往主观认知与数据说明的问题有很大差距。

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 节日庆典

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1