北航数理统计大作业逐步回归.docx

上传人:b****7 文档编号:10908832 上传时间:2023-02-23 格式:DOCX 页数:14 大小:153.48KB
下载 相关 举报
北航数理统计大作业逐步回归.docx_第1页
第1页 / 共14页
北航数理统计大作业逐步回归.docx_第2页
第2页 / 共14页
北航数理统计大作业逐步回归.docx_第3页
第3页 / 共14页
北航数理统计大作业逐步回归.docx_第4页
第4页 / 共14页
北航数理统计大作业逐步回归.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

北航数理统计大作业逐步回归.docx

《北航数理统计大作业逐步回归.docx》由会员分享,可在线阅读,更多相关《北航数理统计大作业逐步回归.docx(14页珍藏版)》请在冰豆网上搜索。

北航数理统计大作业逐步回归.docx

北航数理统计大作业逐步回归

应用数理统计

第一次大作业

 

学号:

 

班级:

B11班

 

2015年12月

民航客运量的多元线性回归分析

摘要:

本文为建立以民航客运量为因变量的多元线性回归模型,选取了1996年至2013年的统计数据,包含国民生产总值,民航航线里程,过夜入境旅游人数,城镇居民可支配收入等因素,利用统计软件SPSS对各因素进行了筛选分析,采用逐步回归法得到最优多元线性回归模型,并对模型的回归显著性、拟合度以及随机误差的正态性进行了检验,并采用2014年的数据进行检验,得到的结果达到预期,证明该模型建立是较为成功的。

关键词:

多元线性回归,逐步回归法,民航客运量

 

0.符号说明

变量

符号

民用航空客运量

Y

国民生产总值

X1

铁路客运量

X2

民航航线里程

X3

入境过夜旅游人数

X4

城镇居民人均可支配收入

X5

1.引言

随着社会的进步,人民生活水平的提高,如何获得更快捷方便的交通成为人们日益关注的问题。

因为航空的安全性,快速且价格水平越来越倾向大众,越来越多的人们选择航空这种交通方式。

近年来,我国的航空客运量已经进入世界前列,为掌握航空客运的动态,合理安排班机数量。

科学地对我国民航客运量的影响因素的分析,并得出其回归方程,进而能够估计航空客运量是非常有必要的。

本文收集整理了与我国航空客运量相关的历年数据,运用SPSS软件对数据进行分析,研究1996年起至2013年我国民航客运量y(万人)与国民生产总值X1(亿元)、铁路客运量X2(万人)、民航航线里程X3(万公里)、入境过夜旅游人数X4(万人)、城镇居民人均可支配收入X5(元)的关系。

采用逐步回归法建立线性模型,选出较优的线性回归模型。

2.数据的统计与分析

本文在进行统计时,查阅《中国统计摘要》,《中国统计年鉴2014》以及中国知网数据查询中的数据,收集了1996年至2013年各个自变量因素的数据,分析它们之间的联系。

整理如表1所示。

 

表1:

年份

民航客运量(万人)

国生产总值(亿元)

铁路客运量(万人)

民航航线里程(万公里)

入境过夜旅游人数(万人)

城镇居民可支配收入(元)

1996

5555

78973

94797

116.65

1356.26

4838.9

1997

5630

84402.3

93308

142.5

1578.53

5160.3

1998

5755

89677.1

95085

150.58

1692.45

5425.1

1999

6094

88479.2

100164

152.22

1765.25

5854.1

2000

6722

99214.6

105073

150.29

1750.96

6280.1

2001

7524

109655.2

105155

155.36

1880.36

6859.6

2002

8594

120332.7

105606

163.77

2012.45

7702.8

2003

8759

135822.8

97260

174.95

2033.58

8472.2

2004

12123

159878.3

111764

204.94

2519.89

9421.6

2005

13827

184937.4

115583

199.85

2925.63

10493.1

2006

15968

216314.4

125656

211.35

3486.45

11759.5

2007

18576

265810.3

135670

234.3

3398.58

13785.8

2008

19251

314045.4

146193

246.18

3696.71

15780.8

2009

23052

340506.9

152451

234.51

4025.96

17174.7

2010

26769

397983.5

168145

276.5

4753.84

19109.4

2011

29316

473104

146192

349.05

4924.32

21809.8

2012

31896

519470.1

189337

328.01

5668.63

24564.7

2013

35397

568845.2

210597

410.6

5562.39

26955.1

2.1模型的建立

以民航客运量y为因变量,以上5种影响因素为自变量Xi,构建回归方程:

其中

为常数项,

为误差项。

先观察自变量与因变量的关系,用SPSS得到各个自变量与因变量的散点图:

图1民航客运量与国生产总值散点图

图2民航客运量与铁路客运量散点图

 

图3民航客运量与航线里程散点图

图4民航客运量与入境过夜人数散点图

图5民航客运量与人均可支配收入散点图

从以上五散点图,我们可以看出因变量民航客运量与国生产总值,入境过夜旅游人数和城镇居民人均可支配收入均有较好的线性关系,这说明建立线性模型是有意义的。

继续下一步逐步回归分析,逐步回归的基本思想是将变量逐个引入模型,每引入一个变量后都要进行F检验,并对已经选入的变量逐个进行t检验,当原来引入的变量由于后面变量的引入变得不再显著时,则将其删除。

以确保每次引入新的变量之前回归方程中只包含先主动变量。

这是一个反复的过程,直到既没有显著的变量选入回归方程,也没用不显著的变量从回归方程中剔除为止。

在SPSS软件中可直接进行逐步回归分析,得出以下结果:

由表2知,逐步回归后得出两个模型,模型1只包含城镇居民可支配收入,其他自变量都没有进入模型,模型2在1的基础上再纳入了过夜入境旅游人数,其他的自变量也都被排除了。

 

表2

输入/移去的变量a

模型

输入的变量

移去的变量

方法

1

城镇居民人均可支配收入

.

步进(准则:

F-to-enter的概率<=.050,F-to-remove的概率>=.100)。

2

过夜游客

.

步进(准则:

F-to-enter的概率<=.050,F-to-remove的概率>=.100)。

a.因变量:

民用航空客运量

表3

已排除的变量a

模型

BetaIn

t

Sig.

偏相关

共线性统计量

容差

1

国生产总值

.197b

.517

.612

.132

.003

铁路客运量

-.001b

-.014

.989

-.004

.058

民航航线里程

-.040b

-.388

.704

-.100

.044

过夜游客

.421b

3.432

.004

.663

.018

2

国生产总值

.306c

1.059

.308

.272

.003

铁路客运量

-.020c

-.289

.777

-.077

.058

民航航线里程

.011c

.138

.892

.037

.043

a.因变量:

民用航空客运量

b.模型中的预测变量:

(常量),城镇居民人均可支配收入。

c.模型中的预测变量:

(常量),城镇居民人均可支配收入,过夜游客。

表4

模型汇总c

模型

R

R方

调整R方

标准估计的误差

更改统计量

R方更改

F更改

df1

df2

Sig.F更改

1

.996a

.993

.992

876.7400

.993

2183.841

1

16

.000

2

.998b

.996

.995

677.6913

.003

11.779

1

15

.004

a.预测变量:

(常量),城镇居民人均可支配收入。

b.预测变量:

(常量),城镇居民人均可支配收入,过夜游客。

c.因变量:

民用航空客运量

2.2拟合度检验

由表4,模型1的决定系数R2=0.992,模型2的决定系数R2=0.995,可以看出回归方程都高度显著,且模型2比模型1更优。

2.3回归方程的显著性检验:

由表5,方差分析表Sig值都<0.05,说明每个模型都拒绝回归系数均为0的假设,每个方程都是显著的。

表5

Anovaa

模型

平方和

df

均方

F

Sig.

1

回归

1678659397.184

1

1678659397.184

2183.841

.000b

残差

12298767.261

16

768672.954

总计

1690958164.444

17

2

回归

1684069181.370

2

842034590.685

1833.437

.000c

残差

6888983.075

15

459265.538

总计

1690958164.444

17

a.因变量:

民用航空客运量

b.预测变量:

(常量),城镇居民人均可支配收入。

c.预测变量:

(常量),城镇居民人均可支配收入,过夜游客。

由表6可以得到两个模型的回归方程分别:

1.以城镇居民可支配收入为自变量的拟合函数:

y=-1698.669+1.406X5

2.以城镇居民可支配收入和过夜入境旅游人数为自变量的拟合函数:

y=-3267.728+0.817X5+2.871X4

且所有系数的显著性水平都小于0.05,每个回归方程都是有意义的。

表6

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

-1698.669

423.955

-4.007

.001

城镇居民人均可支配收入

1.406

.030

.996

46.732

.000

2

(常量)

-3267.728

562.492

-5.809

.000

城镇居民人均可支配收入

.817

.173

.579

4.721

.000

过夜游客

2.871

.837

.421

3.432

.004

a.因变量:

民用航空客运量

 

表7是残差统计结果。

主要显示预测值、标准化预测值、残差和标准化残差等统计量的最大值、最小值、均值和标准差。

残差平方和Q描述的是随机误差引起因变量Y的分散程度,Q越大分散性也越大,则线性关系越不明显。

由表7可见标准化残差的最大绝对值为1.758。

而且标准残差的均值为0,说明随机误差对Y值的影响很小。

表7

残差统计量a

极小值

极大值

均值

标准偏差

N

预测值

4581.804

35339.836

15600.444

9953.0344

18

残差

-1191.5225

973.1963

.0000

636.5802

18

标准预测值

-1.107

1.983

.000

1.000

18

标准残差

-1.758

1.436

.000

.939

18

a.因变量:

民用航空客运量

2.4多重共线性的诊断

表8

共线性诊断a

模型

维数

特征值

条件索引

方差比例

(常量)

城镇居民人均可支配收入

过夜游客

1

1

1.873

1.000

.06

.06

2

.127

3.843

.94

.94

2

1

2.852

1.000

.01

.00

.00

2

.147

4.410

.37

.01

.00

3

.002

39.683

.62

.99

1.00

a.因变量:

民用航空客运量

表8是SPSS软件的多重共线性诊断表,它包括3项诊断值:

特征值、条件数和方差比率。

特征值表明在自变量中存在多少截然不同的维数,当几个特征值都接近0是,变量是高度相关的。

条件数是最大特征值对每一个连续特征值的比率的平方根,若条件数大于15则表明可能存在多重共线问题,若大于30则表明存在严重的多重共线性问题。

显然表8中变量X4过夜入境旅游人数的条件数大于30,说明回归方程存在多重共线性。

2.5残差检验

如图6是残差分布直方图。

在回归分析中,总是假定残差服从正态分布,这个图就是根据样本数据的计算结果显示残差分析的实际情况。

从图来看标准化残差还是近似服从正态分布的。

图6

如图7残差的积累概率图基本围绕在假设直线(正态分布)周围,说明残差分布基本符合正态分布,说明民航客运量这个因变量基本上可以用线性回归方法建立模型。

3.结论

为了解决多重共线性的问题,排除模型2,考虑到模型1的拟合度也是很好的,综合来看认为模型1为更优。

最终得到的回归方程为:

y=-1698.669+1.406X5

并以2014年的数据检验该回归方程,2014年航空客运量为39195万人,城镇居民人均可支配收入为28843.9,将自变量X5带入回归方程得到y=38855.85万人,与实际的客运量39195万人的误差为0.86%。

因此可以认为该模型基本达到了预期的目标。

通过最优回归方程,我们可以发现航空客运量与城镇居民的可支配收入线性相关十分显著,这是符合常识的,只有居民可支配收入越来越高,才会选择航空这种昂贵的客运方式。

图7

 

参考文献:

[1]2015年中国统计年鉴

[2]海燕、周梦、卫国、伟.应用数理统计.航空航天大学,2009

[3]朱卫卫.基于偏最小二乘回归的我国民航客运量影响因素分析[J].中国市场.2010(41):

110-112

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 历史学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1